Smart-Di

OCR do lado do servidor

O recurso de OCR do lado do servidor Smartker pode fornecer OCR (Optical Character Recognition) para documentos PDF e TIFF encontrados na biblioteca do Smartker para que eles possam ser indexados e pesquisados. O mecanismo de OCR está localizado no servidor Smartker que usa uma fila para processar os documentos. Uma vez concluído o mecanismo de OCR do documento, o documento é registrado como uma nova versão contendo uma camada de texto que permite que o documento seja indexado e pesquisado dentro do sistema de gerenciamento de documentos.

Os critérios para acrescentar um documento à fila de processamento de OCR são:

* O documento deve estar em um formato «Documento Eletrônico». Os registros eletrônicos e documentos off-line não serão processados.

* Somente documentos do tipo PDF e TIF / TIFF são processados. As imagens TIFF são convertidas em documentos PDF pesquisáveis.

* Somente a última versão dos documentos pode ser processada. Isto porque uma nova versão é criada uma vez que o documento tenha sido OCRed. O proprietário do documento original continua sendo o proprietário da nova versão do OCR.

 

Sistema de Gerenciamento de Documentos

Motor OCR A camada de texto resultante depende da qualidade do documento a ser OCRed. Portanto, para garantir a precisão da camada de texto resultante, a qualidade dos documentos deve ser razoavelmente alta. Digitalizações de qualidade inferior serão difíceis para o OCR, portanto, verificações de qualidade devem ser realizadas nestes documentos. O mecanismo de OCR não pode detectar se uma imagem é girada, portanto, certifique-se de que seus documentos possam ser lidos da direita para a esquerda e que o texto seja orientado horizontalmente.

Os documentos processados pelo motor OCR podem ser comprimidos para reduzir o espaço do repositório. O recurso de compressão imagem / PDF deve ser licenciado pela Smartker. A compressão de documentos consiste em várias técnicas. Os administradores do sistema podem decidir qual técnica deve ser habilitada ou desabilitada para manter o nível exigido de otimização de documentos. Ver Imagem / PDF Opções de compressão para configurações.

OCR do lado do servidor é um recurso opcional que é controlado na licença do Smartker. Para adquirir o OCR do lado do servidor, entre em contato com sales@Smartker.com.

Se um documento passa pelo processo de OCR do lado do servidor, uma nova versão do documento é gerada. Esta nova versão não será associada a nenhum fluxo de trabalho que tenha ocorrido na versão anterior e, portanto, perderá seu status de revisão e aprovação. A versão recém gerada precisará passar pelo processo de fluxo de trabalho novamente se esses status precisarem ser mantidos entre versões.

 

Habilitação de OCR do lado do servidor

OCR do lado do servidor pode ser um mecanismo demorado; portanto, os documentos são adicionados a uma fila para processamento. Todos os novos documentos, novas versões, adicionados manualmente ou através de um mecanismo de importação automática (tais como pastas monitoradas ou importações gerenciadas) são automaticamente adicionados à fila. Os documentos de repositório existentes podem ser adicionados manualmente à fila.

Você pode aplicar a prioridade para que os documentos ou versões recém-adicionados tenham uma prioridade maior na fila através de uma configuração. Eles serão processados antes de qualquer documento existente na fila. Se a configuração não for aplicada, os documentos são retirados da fila na ordem em que são adicionados, independentemente da prioridade.

Para a opção «Adicionar documentos existentes à fila de OCR», uma configuração de configuração «OcrTotalOfExistingDocuments» é usada para a fila de OCR. Primeiro, o Smartker processa quaisquer documentos ou versões mais recentes, depois olha para a fila de espera. Se a fila for grande porque também precisa processar um grande número de documentos existentes, isto pode afetar o desempenho do sistema.

Ocr Total Of Existing Documents pode ajudar a reduzir estes efeitos. O valor padrão é 1.000.000, mas pode ser ajustado no arquivo web.config localizado em C: \ Arquivos de Programas Smartker Systems Servidor de Aplicações LibraryManager. Com um número maior de documentos na fila, é recomendável que:

Realizar operações fora do horário comercial.

Ampliar a configuração WebServiceCallTimeoutSec para WebClient para evitar timeout do lado do cliente. Não é necessário, independentemente do timeout do lado do cliente, a operação continuará no lado do servidor.