武警工程大学教研保障中心,陕西西安 710086
摘要:通过扫描制作PDF文件是纸质档案资料数字化的常用方法。要想精通 PDF 文件制作技术,应该学会破解纸质文件文字方向不一致的难题、文件中有空白页的难题、内容过少的文件页无法扫描的难题、漏页补救的难题、装订孔消除的难题和PDF 文件内容无法任意选取复制的难题等八大难题。
关键词:扫描;PDF文件;制作
纸质档案资料数字化是档案信息化的基础性工程,双层PDF文件是数字档案资料的常见存储格式,扫描法制作PDF文件是档案数字化的必由之路。本文以松下KV-SL5100高速扫描仪为例,探讨档案工作者应该学会破解的八大难题。
1.纸质文件文字方向不一致怎么办?
由于竖向排版的纸质文件中,有部分插图、表格、附件、附录等因内容需要采用了横向排版,与主体文件文字方向不一致。这种竖向与横向混排的纸质文件扫描制作成PDF文件后,其中某些页面的文字呈现方向并非竖直向上,而是向左偏转了90o,严重影响正常阅读。
成功扫描文字方向不一致的纸质文件可分两种情况精准应对:一是扫描前发现不一致。点击扫描软件主页面上部快捷工具栏中的“扫描设定”按钮,在打开的设定对话框中点击“版式”,点击选中“自动图像方向”栏中的“有效”选项,则在扫描过程中扫描软件就能自动识别所扫文件中各页的文字方向并自动旋转调整为竖直向上方向后统一呈现。二是扫描后保存前发现不一致。点击快捷工具栏中的“缩略图显示”按钮,在缩略图中点击选中向左偏转了90o需要矫正的页面,点击快捷工具栏中的“顺时针旋转90o”按钮即可完成矫正。
2.纸质文件中有空白页怎么办?
由于单面打印和双面打印纸质文件在同一份档案资料中混合存档的原因,待扫描文件中的部分页背面无内容,致使双面扫描后一份完整的PDF文件中间会夹杂不少空白页,多余且影响阅读。
删除空白页也分两种情况:一是扫描前发现有空白页。点击快捷工具栏中的“扫描设定”按钮,在打开的设定对话框中点击“版式”,点击选中“消除空白页”栏中的“有效”选项并调整“像素比例”(取值范围为0.01-5.00)到适当值,则在扫描过程中扫描软件就能自动识别所扫文件中的空白页并清除。二是扫描后保存前发现空白页。点击快捷工具栏中的“缩略图显示”按钮,在缩略图中点击选中空白页,点击快捷工具栏中的“删除页面”按钮即可删除当前空白页。
3.纸质文件中内容过少的页无法扫描怎么办?
对纸质文件进行扫描时,发现该文件文字较少的尾页会被扫描软件自动跳过,无法扫描,多次调整分辨率和图像类型重新扫描问题仍在。经过认真分析,初步考虑是扫描软件的自动消除空白页功能发挥作用过度,把内容较少的页误认为是空白页所致。
此问题与上一个问题正好相反,方法有二:一是重新调整“消除空白页”栏中“像素比例”到合适的值问题即能解决。二是去掉消除空白页功能。点击快捷工具栏中的“扫描设定”按钮,在打开的设定对话框中点击“版式”,点击取消“消除空白页”栏中的“有效”选项即可扫描文字覆盖率极低的任何文件页。
4.扫描过程中发现漏页了怎么办?
扫描法制作PDF文件时,发现扫描后所得的PDF文件不完整,漏掉了个别页。究其原因,可能是由于原纸质文件存放时间过久、边缘有破损、个别页有褶皱等,致使在扫描仪进纸过程中发生纸张粘连所致。
补救漏页可分两种情况有针对性进行:一是倘若原件页数较少,可调整原件平整度后重新扫描。二是倘若原件页数较多,重新扫描费时费力,建议用插入扫描的方式进行弥补。具体方法:在原文件中找出漏扫页,调整该页的平整度后放入扫描仪进纸器待扫,在缩略图显示状态下将当前页定位为漏扫页的下一页,点击快捷工具栏中的“插入-扫描”按钮,重新扫描漏页即可。
5.纸质文件边缘有装订孔怎么办?
由于纸质档案资料历史久远,载体质量差异较大,有的文件是用边缘带有数十个圆孔的活页纸记录的,数字化扫描后边缘会出现一排黑色孔印,影响页面清洁度。还有的档案资料由于装订原因,也会留下三个装订孔,同样影响扫描后的PDF文件质量。
松下KV-SL5100扫描仪自带的扫描软件自带孔洞去除和淡化功能,可以较好地解决装订孔洞问题。方法一:点击快捷工具栏中的“扫描设定”,在弹出的窗口中点击“公用”菜单,选中“图像过滤程序”栏中的“孔去除”选项即可。方法二:当孔洞较多时,应将“公用”菜单“扫描设定”栏中“背景颜色”项选为“白色”,即用与白纸颜色接近的白色填充孔洞,也能达到淡化孔洞的效果。
6.扫描所得的PDF文件页面内容不够清晰怎么办?
扫描制作的PDF文件模糊不清,影响阅读,更无法达到出版印刷和数字化保存的要求。可能是在纸质文件扫描时,扫描软件的扫描分辨率设置过低,未达到纸质文件数字化的行业标准。
分辨率是扫描文件品质好坏的关键所在,其高低将会直接影响到清晰度。扫描前,只有将扫描软件的扫描分辨率调整到合适的数值(通常扫描分辨率最低不应低于200dpi;原件文字偏小、过密、清晰度较差时,分辨率应高于300dpi;如需高精度仿真复制,则分辨率应在600dpi以上;若要印刷出版,分辨率可设置得更高),才能制作出满意的PDF文件。
7.扫描制作的PDF文件为何只有首页内容能选取和复制?
扫描结束并选择双层PDF格式存盘后,制作得到的PDF文件在阅读器中打开后,首页中的所有内容都可以任意选取和复制,可是从第二页起之后的所有页面内容均无法作为文本选取和复制。
因为首页内容选取和复制完全正常,所以排除扫描仪硬件和扫描问题,考虑存盘原因。经过研究发现,在保存页面“OCR设定”选项窗中有一个“可搜索PDF页数”的设置栏,选择“全部页面”选项,重新保存文件后问题解决,所有页面中的内容均能作为文本正常选取和复制。
8.扫描制作的PDF文件中文内容复制、粘贴后会乱码怎么办?
文件扫描结束并选择双层PDF格式存盘后,制作得到的PDF文件在PDF文件阅读器中打开后,页面中的所有内容均能任意选取和复制,可是在文字处理软件中粘贴后,数字和英文字符等内容都能正常显示和编辑,而文件中的中文内容全部乱码,更换PDF阅读器和文字处理软件后问题依旧。
松下KV-SL5100扫描仪具有双层PDF文件制作功能,扫描过程也没有问题,扫完存储时保存类型选择“PDF/A(可搜索)File(*.pdf)”格式也完全正确,问题究竟出在了哪里呢?仔细研究保存页面后,发现在“OCR设定”选项窗中有一个“目标语言”选择栏,里面有各种常用语言,默认语言是英语,初步认定问题就出在语言选择上。选择“简体中文”为当前语言,存盘后,问题得到解决,所得PDF文件中的数字、英文字符和中文内容经复制、粘贴后全部能正常显示和编辑。
结束语
制作PDF 文件的方法有多种,本文只是探讨了通过扫描制作PDF文件过程中几种最常见的难题及其破解方法。只有精通PDF文件制作方法技巧,才能更好地完成纸质档案资料数字化任务。
参考文献:
[1]·许育彬,席美丽,华千勇,周桂莲.基于期刊在线系统的稿件录用证明PDF文件制作[J].编辑学报,2018,30(03):271.
[2]·吴欣.有效管理PDF文件的颜色特性[J].印刷杂志,2015,(02):25-27.
[3]·周丽.分割PDF文件的几种常用方式[J].新闻研究导刊,2015,(12):353-354.
[4]·孙敏.重铸PDF文件,删除无用内容[J].电脑迷,2011,(22):21.
2