通常扫描图像以图形文件的方式储存,有数种可使用图像的文件格式。TIFF(标志图像文件格式)是目前最常用的图形文件格式之一。扫描、传真、文字处理、光学字符识别和其它一些应用等都支持这种格式。扫描仪使用注意事项:
1、分辨率
分辨率太高,会加长扫描所用时间,并且会因为一些非文字的细节被捕获反而造成识别不正确,分辨率太低,OCR软件因为信息量不足,也会造成识别率不高。一般大多普通五号印刷体选择黑白模式下300dpi进行扫描比较合适。
2、亮度
选择适当的亮度可使扫描原稿显得黑白分明,扫描亮度的设定以扫描所得图像中汉字的笔划较细但不断开为佳,如果扫描所得的汉字轮廓残缺较多,应该增加亮度,如果有一些黑点或黑斑,则应减小亮度。
3、原稿
虽然一些OCR软件允许文稿有一定的倾斜,还可以通过识别软件进行倾斜校正,但这种校正效果并不是很令人满意的。
4、版面分析
在版面分析中选择与原稿相符的版面类型,对一些复杂的版面,划分合理的块来进行识别,这样也能有效地提高识别正确率。
5、自定义库
对个别扫描效果清晰,但OCR却识别错误的字,可以加到用户自定义库中,这样下次就不会犯同样的错误,慢慢地识别正确率也会得到提高。
TIFF格式特点:
1、应用广泛
TIFF可以描述多种类型的图像;TIFF拥有一系列的压缩方案可供选择;TIFF不依赖于具体的硬件;TIFF是一种可移植的文件格式。
2、可扩展性
在TIFF 6.0中定义了许多扩展,它们允许TIFF提供以下通用功能:几种主要的压缩方法;多种色彩表示方法;图像质量增强;特殊图像效果;文档的存储和检索帮助。
3、格式复杂
TIFF文件的复杂性给它的应用带来了一些问题。一方面,要写一种能够识别所有不同标记的软件非常困难。另一方面,一个TIFF文件可以包含多个图像,每个图像都有自己的IFD和一系列标记,并且采用了多种压缩算法。这样也增加了程序设计的复杂度。
继续阅读与本文标签相同的文章
【转载】如何搭建靠谱的支付通道?
TP5 微信网页自定义分享类
-
500亿元打水漂,贾跃亭造车太难申请破产,及时止损不算怂
2026-05-19栏目: 教程
-
望闻问切,用好人工智能
2026-05-19栏目: 教程
-
数字时代如何保护个人信息
2026-05-19栏目: 教程
-
SPAR国际物流峰会在威海召开
2026-05-19栏目: 教程
-
NewBalance新款3D打印运动鞋 改变前掌中底
2026-05-19栏目: 教程
