O recurso de OCR do lado do servidor Smartker pode fornecer OCR (Optical Character Recognition) para documentos PDF e TIFF encontrados na biblioteca do Smartker para que eles possam ser indexados e pesquisados. O mecanismo de OCR está localizado no servidor Smartker que usa uma fila para processar os documentos. Uma vez concluído o mecanismo de OCR do documento, o documento é registrado como uma nova versão contendo uma camada de texto que permite que o documento seja indexado e pesquisado dentro do sistema de gerenciamento de documentos.
Os critérios para acrescentar um documento à fila de processamento de OCR são:
* O documento deve estar em um formato «Documento Eletrônico». Os registros eletrônicos e documentos off-line não serão processados.
* Somente documentos do tipo PDF e TIF / TIFF são processados. As imagens TIFF são convertidas em documentos PDF pesquisáveis.
* Somente a última versão dos documentos pode ser processada. Isto porque uma nova versão é criada uma vez que o documento tenha sido OCRed. O proprietário do documento original continua sendo o proprietário da nova versão do OCR.
Motor OCR A camada de texto resultante depende da qualidade do documento a ser OCRed. Portanto, para garantir a precisão da camada de texto resultante, a qualidade dos documentos deve ser razoavelmente alta. Digitalizações de qualidade inferior serão difíceis para o OCR, portanto, verificações de qualidade devem ser realizadas nestes documentos. O mecanismo de OCR não pode detectar se uma imagem é girada, portanto, certifique-se de que seus documentos possam ser lidos da direita para a esquerda e que o texto seja orientado horizontalmente.
Os documentos processados pelo motor OCR podem ser comprimidos para reduzir o espaço do repositório. O recurso de compressão imagem / PDF deve ser licenciado pela Smartker. A compressão de documentos consiste em várias técnicas. Os administradores do sistema podem decidir qual técnica deve ser habilitada ou desabilitada para manter o nível exigido de otimização de documentos. Ver Imagem / PDF Opções de compressão para configurações.
OCR do lado do servidor é um recurso opcional que é controlado na licença do Smartker. Para adquirir o OCR do lado do servidor, entre em contato com sales@Smartker.com.
Se um documento passa pelo processo de OCR do lado do servidor, uma nova versão do documento é gerada. Esta nova versão não será associada a nenhum fluxo de trabalho que tenha ocorrido na versão anterior e, portanto, perderá seu status de revisão e aprovação. A versão recém gerada precisará passar pelo processo de fluxo de trabalho novamente se esses status precisarem ser mantidos entre versões.
OCR do lado do servidor pode ser um mecanismo demorado; portanto, os documentos são adicionados a uma fila para processamento. Todos os novos documentos, novas versões, adicionados manualmente ou através de um mecanismo de importação automática (tais como pastas monitoradas ou importações gerenciadas) são automaticamente adicionados à fila. Os documentos de repositório existentes podem ser adicionados manualmente à fila.
Você pode aplicar a prioridade para que os documentos ou versões recém-adicionados tenham uma prioridade maior na fila através de uma configuração. Eles serão processados antes de qualquer documento existente na fila. Se a configuração não for aplicada, os documentos são retirados da fila na ordem em que são adicionados, independentemente da prioridade.
Para a opção «Adicionar documentos existentes à fila de OCR», uma configuração de configuração «OcrTotalOfExistingDocuments» é usada para a fila de OCR. Primeiro, o Smartker processa quaisquer documentos ou versões mais recentes, depois olha para a fila de espera. Se a fila for grande porque também precisa processar um grande número de documentos existentes, isto pode afetar o desempenho do sistema.
Ocr Total Of Existing Documents pode ajudar a reduzir estes efeitos. O valor padrão é 1.000.000, mas pode ser ajustado no arquivo web.config localizado em C: \ Arquivos de Programas Smartker Systems Servidor de Aplicações LibraryManager. Com um número maior de documentos na fila, é recomendável que:
Realizar operações fora do horário comercial.
Ampliar a configuração WebServiceCallTimeoutSec para WebClient para evitar timeout do lado do cliente. Não é necessário, independentemente do timeout do lado do cliente, a operação continuará no lado do servidor.