OCR是光学字符识别的光学字符识别,或在西班牙语中也称为光学字符识别的光学字符识别。 OCR是一种支持文本识别的软件,可产生文本图像,将其转换为一系列字符,然后将其保存为给定格式,以供这些文本编辑程序使用。换句话说,借助这项新技术,可以将任何类型的文本或文档(包括PDF文件,扫描的纸张甚至从数码相机拍摄的图像)转换为数据,以便进行编辑。
该软件的工作方式如下:首先,分析相关文档图像的各个部分;以表格,图像,文本块等形式散布页面;然后将这些行以单词分布,以后再变成字符;并且由于已经指示了字符,因此该软件会与一组图案图像进行比较。这是根据关于每个角色是什么的一系列假设进行的; 并基于这些假设,分析了将折线分成单词和将单词分为字符的不同变体。经过大量的假设分析和处理,程序终于提出了已经识别并转换为新格式的文本。。
应当指出,当今计算机市场提供了基于OCR的一系列程序,例如OmniPage,Abbyy Fine Reader或READiris。 YY不仅具有分析和识别文本的能力,而且还具有识别格式和样式的能力,但是具有一定的局限性,因此需要在分析后编辑文本以进行调整。要求。