纸质档案数字化的理论与实践* 档案数字化加工

纸质档案数字化的理论与实践* 档案数字化加工

纸质档案数字化的理论与实践*

余英杰

【摘要】随着社会信息化的进一步发展,人们对信息资源的渴求日渐增大。作为政府资讯重要来源之一的档案部门,在信息时代里如何利用丰富的档案资源,以方便、快捷、多样的形式为社会建设提供服务一直都是我们不断探讨的问题。本文结合纸质档案数字化的理论和实践,对我局的纸质档案数字化工作作出初步的总结与思考。

【关键词】数字化 档案资源信息共享

随着社会信息化进程的加快,信息资源已经成为人类社会活动和经济活动的战略资源。信息技术的高速发展和推广应用使信息产业成为国民经济中最具有增长活力的部门和重要的支柱产业之一,与此同时信息技术的发展与广泛应用使档案数字化建设提上了日程,给档案工作带来了新的契机,信息技术的日新月异也给档案工作带来了新的研究课题——这就是档案数字化建设。档案工作的数字化建设也是顺应潮流,适应时代发展的新举措、新要求。档案作为一种原生的信息资源,其重要性正日益凸显出来。面对这种挑战我们档案工作者应积极应对,我们要不断学习科学知识,逐步掌握信息技术为档案工作服务,为社会主义经济建设服务,为社会主义精神文明建设服务。

目前大部分档案馆馆藏档案载体仍然是以纸质为主,传统的档案管理模式占用存放空间大,保管成本高,易磨损,并且检索利用效率低,难以满足人们日渐增大的对信息资源的渴求。通过对纸质档案的数字化处理,利用电子档案替代原件使用,实现了对档案原件的有效保护。数字化档案可以副本异地保存,这样可使这些档案资料在出现天灾人祸的情况下不致于遭到毁灭性的破坏。档案数字化有助于恢复档案材料模糊褪变的字迹及对污损残缺照片档案的修复。档案数字化能改善档案的利用方式,使档案的利用不再受“孤本”的限制,一份文件可以同时提供给所有需要它的人共享。档案数字化以后,将已开放的档案上网,这样所有利用者就可以在任何时间上网利用档案信息资源,扩大了档案的利用空间,让更多的人来了解档案,利用档案。

纸质档案数字化制作方式一般有两种:第一种是通过计算机人工录入或通过扫描仪扫描由字符识别软件(OCR)识别,制成文本文件;第二种是将档案原文的每一页看成是一张图片,不管上面具体是什么内容,由扫描仪按页扫入计算机制成图形文件。第一种方式占据空间小,是一种真正意义上的全文数字化,但纸质档案信息的记录方式是多种多样的,有的是手写体、繁体字,有的字迹褪化及非文字形式等,此时采用第一种方式就会暴露出如下致命弱点:用OCR字符识别的准确率低;若采用人工录入,不但需要大量的录入人员,而且一时还不能马上胜任此项工作,差错率大且核对困难,投入大,收效低。而第二种方式实现容易,一般档案工作人员只要稍加培训,即可操作机器,且工作可以定量化,差错率相对较低,即便有一些错扫、漏扫等,也能很快被发现。至于图形文件占空间大的问题,在计算机技术日新月异的今天,存储设备容量的不断提高,相关处理软件的推陈出新,图形文件的储存问题将会得到很好的解决,如果能采用先进的高速扫描仪,那么对档案信息数字化无疑是如虎添翼。另外,还因为图像扫描保持了档案原件本来面目,可以使利用者在看到文字内容的同时,也能看到纸质档案的其它一些特征,如原件的纸色、墨迹、印章、圈点、批注等各种原貌,使利用者可以获得更多的线索,开展一些更深入的研究。

在开始档案数字化之前,先要作好统筹规划。将大量的档案数字化,是一个庞大的系统工程。首先要做好馆藏情况的调查,包括档案的类型、载体形态与状态、馆藏数量、档案信息利用等基本情况。根据馆藏情况制订档案数字化的科学规划,包括扫描仪等硬件的购置计划和数字化处理规划。档案数字化要经过一个较长的过程,硬件的购置不可能一步到位,也不需要一步到位,应从实际和长远打算,保证扫描仪等硬件设施的成龙配套,使其具有较强的支撑能力和扩展能力。对馆藏重点和利用率高的档案先进行数字化,早日满足大多数利用者的需求。

做好档案数字化的全程控制。在档案数字化过程中,为了提高档案的扫描效率和保证形成图像的完整性,有时候需要把一卷卷的档案拆开对每一张档案进行扫描,扫描完毕后再重新装订起来,在此过程中要做好档案原件保管工作,不能丢失或损坏档案。要做好数字化时扫描参数的优化设置,在确保图像能够清晰完整地反映档案原件内容的前提下,图像文件所占用存储空间的大小要适中。数字化要注重全面的质量检查,加强数据的质量控制。质量检查应包括以下几方面内容:首先,数字化前的档案整理检查。要进行数字化的档案原件必须完整、排序正确,对折损严重影响扫描质量的原件应预先修整。其次,数字化后的数据质量、图像质量检查。扫描后的图像文件应保持档案的原貌,字迹清楚不失真,幅面摆放正确,亮度适当,既没丢失信息,又无增加信息,无错扫、漏扫,对图像文件质量有问题的应重新扫描;采集录入数据要丰富、准确。档案数字化过程中,总会遇到不能对外公开或泄密的文件,所以要注重由纸质档案扫描而形成的电子文件的保密与保管工作。在一般情况下,数字化工作人员不得带任何电子存储设备进入数字化工作室,保证档案资料不外泄。对数字化生成的电子文件,要及时地进行备份保存,防止因为突发的计算机故障而导致数据的大量丢失。

纸质档案数字化是一项长期而又复杂的任务,在实践过程中会不断地涌现新的情况、新的问题、新的技术,数字化工作不可能一步到位。这就要求我们必须具备发展的眼光,将学习到的新知识、新技术应用到实际工作中去,推动档案事业不断地向前发展。

(作者单位:佛山市档案局)



*本文获佛山市档案学会2006年档案研讨会论文三等奖

  

爱华网本文地址 » http://www.aihuau.com/a/25101010/39929.html

更多阅读

现代教育理论与实践论坛 深圳现代教育集团骗局

现代教育理论与实践论坛 第八届全国征文启事一、征稿对象各级教育行政主管部门、教研人员、学校教育教学管理者和广大老师、学生及广大热爱教育事业的各界人士。二、征稿内容1、教育教学论文(教育思考、创新教育、素质教育、学校管理

校本研修的理论与实践 校本研修的收获与体会

第七讲 校本研修的理论与实践主讲 徐阿根(上海新中高级中学校长 “双特”:特级教师+特级校长)引言:校本研修与教师专业成长存在内在的联系。1、教师的专业成长具有鲜明的个性化特点,必需植根于教育情境和教育实践。2、教师的专业成

《中国特色社会主义理论与实践研究》学习心得

本学期学习《中国特色社会主义理论与实践研究》课程,在上课过程中,学到了许多知识,对马克思主义与中国实际相结合的科学理论指导有了更进一步的认识,中国特色社会主义必须坚持社会主义经济建设、政治建设、文化建设、社会建设“四位一体

声明:《纸质档案数字化的理论与实践* 档案数字化加工》为网友抽烟喝酒颠疯狂分享!如侵犯到您的合法权益请联系我们删除