什么是OCR？»其定义和含义

OCR是光学字符识别的光学字符识别，或在西班牙语中也称为光学字符识别的光学字符识别。 OCR是一种支持文本识别的软件，可产生文本图像，将其转换为一系列字符，然后将其保存为给定格式，以供这些文本编辑程序使用。换句话说，借助这项新技术，可以将任何类型的文本或文档（包括PDF文件，扫描的纸张甚至从数码相机拍摄的图像）转换为数据，以便进行编辑。

该软件的工作方式如下：首先，分析相关文档图像的各个部分；以表格，图像，文本块等形式散布页面；然后将这些行以单词分布，以后再变成字符；并且由于已经指示了字符，因此该软件会与一组图案图像进行比较。这是根据关于每个角色是什么的一系列假设进行的; 并基于这些假设，分析了将折线分成单词和将单词分为字符的不同变体。经过大量的假设分析和处理，程序终于提出了已经识别并转换为新格式的文本。。

应当指出，当今计算机市场提供了基于OCR的一系列程序，例如OmniPage，Abbyy Fine Reader或READiris。 YY不仅具有分析和识别文本的能力，而且还具有识别格式和样式的能力，但是具有一定的局限性，因此需要在分析后编辑文本以进行调整。要求。