下面是小编为大家整理的2022年度档案数字化建设实施方案,档案数字化管理方案,供大家参考。
加快档案信息化基础设施建设,加强电子文件归档和电子档案的规范化管理,稳步实施存量档案数字化,增量档案电子化,建立数字化综合应用平台,下面是小编给大家分享的一些有关于档案数字化建设实施方案,档案数字化管理方案的内容,希望能对大家有所帮助。
第1篇:档案数字化方案制定与实施
档案数字化方案制定与实施
馆藏传统载体档案数字化的问题,许多地方档案馆进行了实践,积累了一定的经验,对全国档案数字化建设起到了推动作用。但是,总结以前我国档案数字化建设的不足和失误,往往不是信息技术支持不够,而是绝大多数都知道搞数字化,但档案数字化目的是利用的主题不突出,忽略档案开放鉴定与数字化档案利用的逻辑关系,对先剔除无用档案后开展数字化的思路不明确,没很好研究档案数字化的整体效果就大张旗鼓地做起来了。进而出现数字化目录数据和全文数据不对应、找不着或不好用等问题不少,档案数字化的量虽多,但能上网利用或者说能上互联网利用的很少,数字化返工的现象比较突出,使有限的资金投入并没有体现在数字化档案的利用效益上,这一点已引起档案系统管理和技术高层领导的重视,许多实践工作者已开始进行有益的探索。
面对网络时代公众迫切需要远程、公开、快捷的档案信息,面对馆藏浩瀚如海的案卷,面对当前我国档案数字化需要解决的一系列问题,长春市档案馆与中国人民大学信息资源管理学院共同承担了国家档案局科技项目《档案数字化方案研究》。该项目经过课题研究人员的共同努力,已取得初步研究成果。通过课题研究,对档案数字化方案的研究提出了一些观点和看法,大家交流和讨论。
一、确定档案数字化指导思想与原则
档案数字化指导思想是:以需求为导向,以利用为目的,充分利用计算机软硬件功能,最大限度发挥人力资源和数字化加工设备能力,保护馆藏档案原件完好,保证数字化档案真实准确,更好地发挥档案信息资源的作用。
档案数字化原则是:遵循重要档案数字化的价值性原则、常用档案数字化的实用性原则、开放档案数字化的开放性原则、褪迹档案数字化的抢救性原则,解密档案数字化的及时性原则,目录数字化与全文数字化分步的时效性原则,档案数字化加工与利用同步的一致性原则。
二、明确档案数字化策略
(一)需求导向,急用先上策略
1.需求导向策略
社会需求对档案利用的影响应该是档案工作者特别关注的问题。我们用统计数字加以分析。
(1)随着编史修志工作纳入各地工作规划,1986年全国省(区、市)综合档案馆接待编史修志查档卷数占利用总卷数的69%。随着编史修志阶段性高潮过去,2003年全国省(区、市)综合档案馆接待编史修志查档卷数占利用总卷数的28%。下降41个百分点。(此数据来自国家档案局法规司保存的档案统计年) (2)随着社会保障制度的建立和国有企业改革的深入,长春市档案馆查阅工人调配档案卷数占利用总卷数的百分比,由2002年的1%增加到2004年的占利用总卷数的68%。(此数据来自长春市档案馆利用统计数据库) 由此看出,国家、地方新政策的出台和工作部署对档案利用的影响程度。从宏观上讲,档案利用已实现了两个转变,服务重点由政治领域转变为经济领域,服务对象由机关干部扩展到公众百姓,特别是为百姓提供凭证案例急剧上升。用动态观念研究当前与长远社会对档案的需求,并指导档案数字化与利用服务工程实践应该是档案部门的必然选择。
2.急用先上策略
地方档案馆馆藏档案数量众多。但并不是所有档案都在现实中利用,有相当大一部分多年不用。2004年全国省(区、市)综合档案馆档案平均利用率仅为1.6%。虽然档案馆众多全宗中当地党委、政府全宗利用率高是一般规律,但其他全宗利用情况往往和政策、时间的变化而变化,影响更大。所以,各级地方档案馆按照近期利用统计情况和发展趋势确定数字化的先后顺序是科学的选择,利用优化理论进行档案数字化筛选,快速反应,突击完成急用档案数字化任务,能够达到更好地发挥档案作用的目的,实现即时投入使用的预期。(此数据来自国家档案局法规司保存的档案统计年报)
(二)本级为主,分步实施策略
(1)本级为主策略
根据档案馆职能分工和档案来源原则,各级地方档案馆永久档案绝大多数是本级机关形成的,一般都占50%以上,这部分档案自然是当地档案馆数字化的重点。同时,地方档案馆都保管着大量的上级档案文件,馆际之间上级档案文件重复是必要的,这些纸质文件来源一般都是上级机关统一印制的。进入信息时代,地方档案馆都面临着保管的上级档案文件全文数字化问题,特别是上级档案文件的开放鉴定审查问题,与其各地分头审查上级档案文件开放和进行数字化,不如国家档案局着手进行档案全文数字化和开放鉴定分工、协作,向馆际共建、共享已有鉴定和数字化成果的方向发展。地方档案馆坚持本级为主的原则,根据需要和可能适时、适量地进行利用频繁政策性上级档案文件的全文数字化,以满足当前工作的急需,尽量减少档案馆多层的重复劳动。
(2)分步实施策略
馆藏档案数字化不可能一步到位,而且档案室进馆范围档案陆续进馆,进馆范围档案实施档案数字化馆室共建、共赢、共享的策略非常重要。在具体实施过程中,文件级目录数据库建设是最基础性的工作,是第一位需要建全的,但并一定是文件级目录数据库建成后再建其它数据库。专题数据库建设是根据现实需要而适时建立。全文数据库建设是满足信息检索需要而必须加快建设的数据库。
(三)剔除无用,避免浪费策略
1.剔除无用策略
地方档案馆馆藏现行档案主要来自于机关各个立档单位,其档案文件进馆的决定权掌握在立档单位文档人员手里,加之国家档案保管期限表几经修改和许多条款至今还比较笼统,所以,不该归档的、不该进馆的、文件重复的档案进馆颇多。特别是建国超过50年以后,半数左右长期保管的档案逐年超过保管期的最上限,这些档案实际上绝大多数已失去保存和利用的价值,但它们仍占据着档案管理的各种资源。
2.避免浪费策略
面对数字化方法的选择,剔除无用,避免浪费应该是一种长久策略,把大量失去保存价值的档案先剔除,避免把无用档案数字化,再造数字化垃圾。
三、优选档案数字化技术与业务路线
档案数字化建设周期长,信息技术又处在快速发展之中,各个档案馆数字化基础和条件不同。从本馆实际出发,优选档案数字化技术与业务路线特别重要。
(一)计算机新技术与档案数字化业务的有机结合
信息技术的发展给档案数字化效率和质量的提高带来深刻的影响,本着技术为需求服务的理念,无论是利用哪一种档案管理系统,都要适应档案数字化流程重组和再造需要,适时进行软件升级,通过软件升级固化技术与流程重组与创新,使档案数字化的效果更好。同时,设计符合国家标准与适应自身需要的数据库结构,使档案数字化的过程优化,数字化档案的利用快捷。
(二)档案鉴定与数字化同步
鉴定与数字化同步的目的是加快数字化档案信息的利用。在计算机网络环境下同步进行档案鉴定与数字化工作是发展趋势。这种档案鉴定是以剔除无用档案为前提,以鉴定档案开放为主,按需求筛选全文数字化档案,为适时提供数字化档案信息服务打基础的过程。
(三)档案数字化与上网利用同步
数字化档案分开放与不开放两种。在计算机网络环境中,在确定档案开放与不开放的同时,开放档案即上互联网。开放与不开放档案数据在局域网中即时使用。
档案数字化及管理流程重组不可能一次到位,它是一个管理思想不断地变化的过程,适时把新技术和新理念纳入进去是非常重要的。
四、细化档案数字化操作方法
实践证明,在计算机网络环境下,档案数字化和利用服务工程以建立流水作业线,提高工作效率和效益为最佳方式。
(一)优化配置各种资源
档案数字化建设需要投入,特别是建设初期软硬件配置投入较大,建成后也要保持一定的运行成本。地方档案馆在具备一定档案数字化条件的基础上,要按照成本效益最大化理论,根据不同的情况,进行档案专业人员和数字化技工人员、计算机和扫描设备的合理搭配,优化档案数字化各种资源配置,提高档案数字化建设的投入产出比,构建档案数字化投入小产出大的新模式。
1.计算机网络环境下档案数字化与利用服务工程流水线资源配置案例
(二)首先建立文件级目录数据库
满足一般检索和管理的需要,建好档案文件级目录数据库。目前,绝大多数综合档案馆,由于没有实现全部档案的文件级目录机检,查找档案不快、不准、不全的问题普遍存在。另外,档案的统计单位主要是卷和延长米,而档案的最小单位是文件的件数,以件为单位的底数不清是普遍存在的问题。所以,把文件级目录数据库建设作为一项基础性工作,在提高档案的查全率、查准率的同时,利用计算机实现档案以件数为基本单位的管理是非常必要的。
1.高度重视文件级目录数据录入的前期处理。档案馆的案卷来自各个立档单位,案卷是由文档人员在档案局业务人员指导下形成的。但是,由于文档人员变动频繁、档案业务指导面多线长,案卷质量难以适应计算机精确管理的需要,加之个别文件形成时的先天不足,给文件级目录数据库建设带来许多麻烦。实践证明,进行文件级目录录入的前期处理,抛开原有的文件目录,按卷内实有文件一一录入,把题名不反映主题、目录与实体不符等一系列问题一并处理是非常必要的。
2.科学合理地设计数据库结构。文件级目录数据库结构包含三方面功能为最佳。一是符合国家有关标准及实际情况,文件题名、责任者等满足文件检索需要的字段。二是存毁、开放、扫描等数字化加工阶段利用的字段。三是数据录入、校对、鉴定、审查等标明责任的字段。
3.数据质量是数据库的生命。建立在计算机环境下,以上网公开利用为根本目的文件级目录数据库,与纸质文件目录有本质的区别。纸质文件目录有问题只有档案馆内部少数人知道,利用者并不清楚。但是,文件级目录数据库进入网络,特别是向社会公开的部分,对数据库的质量要求是相当高的,数据质量也是当前制约许多数据上网利用的瓶颈之一。
(三)适时建立专题数据库
满足特殊检索需要,适时建立档案专题数据库。馆藏档案仅靠文件级目录数据库是不可能解决全部检索问题的。随着客观需要的变化,对某一专题档案有集中利用的需求是经常发生的,突击建立专题数据库,满足社会需求,是档案馆与时俱进的突破口,也是充分发挥档案作用的最佳时机。主要把握三个方面:一是根据馆藏档案内容确定专题数据库的总体布局。二是按需求分期建立专题数据库。三是根据文件内容和检索需要分别设立不同的专题数据库结构。
(四)优选建立全文数据库
满足信息检索的需要,建立档案全文数据库。按照国家档案局提出的重点的、利用频繁的档案首先实现全文数字化的要求,按照“二八”定律,即以20%的努力达到80%的效果,通过多年档案利用统计数据分析,优先全文数字化档案的全宗、年代。在网络中、在文件级目录的基础上同步进行档案存毁、开放、数字化鉴定与筛选,进而形成与文件级目录一一对应的全文数据库,并确保数字化档案的真实、准确。
(五)档案数据库的管理
为了档案数字化与利用同步和数据安全管理的需要,档案数据库分在建数据库和成果数据库两大类。
1.在建数据库的设立。在建数据库是为了数字化加工所设立的动态库,是数据不断变化的数据库。例如,设立文件级目录数据录入库,它是每个录入人员都分配给操作权限的动态库,属于在建数据库。而完成的文件级目录数据库则是成果库。但是,在鉴定及全文数字化加工过程中它又成为全文数字化加工在建数据库。
2.成果数据库的使用。成果数据库只分配使用权限,只有特殊需要时经批准才分配数据改变的操作权限。
3.数据的管理与监督
建立技术负责人、超级管理员、数据管理员连锁责任制,实行审批者没有数据操作权,超级管理员只允许分配权限不允许使用数据操作权,数据管理员只有需要时经批准使用数据操作权,用后即刻收回。给予单位领导和相关中层干部全部数据的查看权,每天24小时可以时时对数据质量进行监督,形成数据管理监督新机制。
(六)数字化档案利用服务工程
数字化档案利用服务工程是以搞活数字化档案利用的目的,以局域网、政务网、互联网为平台,通过建立数据安全管理制度、网络安全运行制度和具有法律责任的网管、数据管理员、数字化加工人员、提供利用人员连锁责任制,环环相扣,从措施上保证数字化档案的准确。通过防火墙、CA认证、数字水印、电子签章、权限控制等计算机新技术,从技术上保证数据的安全,利用网络实现档案的法律效力,实现远程为利用者提供快捷、准确数字化档案的目标。
1.在局域网上应用
在局域网内,档案在建和成果数据库所有接待人员都有检索权限,对只进行目录数字化的档案实行现用现扫描全文的方法使之达到已全文数字化的档案一样效果,利用网络技术实现数字化档案利用替代档案原件利用、计算机打印件替代复印机复印件、电子签章替代手工盖章、接待人员和利用者不接触档案原件的目标。从而起到了运用数字档案高效利用、保护原件的作用。并积累了利用者凭加盖电子签章的数字档案打印件办理社会保险的成功案例,其数字化档案的法律效力得到认可,为档案馆参与电子政务开辟了新途径。
2.在互联网上应用
利用档案网站,通过CA证书等安全手段,不但实现了领导远程数据上传的审批,主要是开展开放档案远程查询、下载、打印。特别是把CA证书发给立档单位或使用单位档案室,为CA用户远程提供档案证明和数字化档案法律效力的体现,减少异地现场查询的不便,使档案馆参与电子政务成为现实。
五、加强档案数字化工作的行政管理
档案数字化涉及档案馆内部许多部门,加强组织管理工作显得十分重要,“三分技术七分管理”同样适合档案数字化与利用服务工程。各个档案馆涉及档案数字化加工和利用的内部组织机构设置不尽相同,但应按照效率优先的原则,在计算机环境下,把数据录入、鉴定、数字化加工、整理、数字化档案利用形成一个流水线,打破内部行政分工界限是发展趋势。无论是采取那种组织形式,优化人员组合重新分工在所难免,各个档案馆在组织实施方面有所不同是必然的。
1.加强计划管理
档案数字化建设是一项复杂的系统工程, 针对实际的调研和论证,运用科学方法预测,制定科学配置各种资源进行档案数字化的总体规划和年度专项计划,通过计划谋求管理系统的外部环境、内部条件、决策目标三者在动态上的平衡,实现管理决策所制定的各项目标。
2.强化组织实施
实施是一个复杂的活动过程,档案数字化建设又是一项全新的工作,技术含量高,涉及到许多因素,在实施过程中会出现各种各样的矛盾和困难,会遇到来自各方面的干扰,实施特别强调解决问题的及时性。通过创新行政管理与技术管理相互作用的新机制,实施有效的组织、指挥、协调、激励工作,保证档案数字化的计划目标的顺利实现。
3.增强管理的技术含量
档案数字化的建设过程贵在控制,重在管理。利用计算机进行档案数字化,任何一个逻辑错误,都会给数据的管理和使用带来麻烦或隐患。在互联网上公开不真实、不准确的档案,将在世界范围内产生不良影响。特别是在网络环境下的流水作业,上一道工序一定要为下一道工序负责,各道工序工作量的对等与匹配同样重要,这必然要求行政、技术、质量管理的网络化。实践证明,建立数字化进度数据库、数字化质量反馈库、档案利用登记数据库,给局馆领导和相关人员分配使用权限,通过技术手段将全面质量管理思想引入档案数字化建设,实现全程管理、适时控制,达到强化数字化档案质量保证体系的目的。
档案数字化与利用服务工程是一项长期的任务,需要从理论上解决的问题很多,需要在实践中探索的问题也不少,我们将继续深化研究与实践。
第2篇:档案数字化方案制定与实施
关于档案数字化的实践与思考
当前,我国信息化发展战略的实施,电子政务的推进,为我国档案事业发展提供了难得的机遇。加强档案信息化建设是档案事业适应时代和社会发展的必然选择,是加速档案管理现代化的客观要求,是提高档案服务水平的必由之路,势在必行。对此,作为管理和拥有大量产权产籍信息资源的房产档案部门,为更好地适应形势发展的要求,我们着眼未来,运用数字化、信息化技术,对档案数字化进行了有益的实践与探索。
一、档案数字化的意义
1、档案数字化的含义
档案数字化是指利用计算机技术、扫描技术、数字成像技术、数据库技术、多媒体技术、存储技术等高新技术把各种载体的档案资源转化为数字化的档案信息,以数字化的形式存储、网络化的形式互相联结,利用计算机系统进行管理,形成一个有序结构的档案信息库,及时提供利用,实现资源共享,是档案信息化建设的重要内容。目前,大多数档案馆保存的档案信息形态主要以纸质、缩微胶片和底片等载体形式存在,只适应于传统的管理与传播方式,即实施手工管理和以点到点的传播,即便是经过编研等初步加工,编辑印发档案资料,实现以点到面的传播,其覆盖面也还是太小,很难达到社会化程度。档案信息资源的经济价值和社会价值也难以充分实现,更难适应当代“数字化生存”的形势。档案原件数字化,对档案信息的现代化管理、使用和传播等都具有很重要的作用。
2、档案数字化的主要内容
①档案目录信息的数字化,建立档案目录数据库。
②载体档案的数字化,如纸质档案、照片档案及录音录像档案等的数字化,建立档案影像数据库或多媒体数据库。
3、档案数字化的主要作用
①档案数字化是档案信息化建设重要内容。档案信息化建设的核心是资源建设。资源建设包括两大方面任务:一是现有馆藏档案的目录数据库建设和馆藏重要纸质档案和照片、录音、录像档案的数字化;
二是现行电子文件归档与电子档案管理。
②档案数字化能有效地保护档案原件。⑴、代替原件使用,保护档案原件。⑵、数字化副本异地保存,输出磁盘、磁带供永久保存。这样可使这些档案资料在出现天灾人祸的情况下不致于遭到毁灭性的破坏。⑶、恢复档案材料模糊褪变的字迹及对污损残缺照片档案的修复。
③档案数字化能改善档案的利用方式。⑴不再受“孤本”的限制,一份文件可以同时提供给所有需要它的人共享。⑵数字影像文件可以通过计算机局域网或者广域网进行异地传输,使异地调阅利用成为可能。扩大了档案的利用空间,让更多的人们来了解档案,利用档案。⑶“时间”不再受限制,利用者可以随时使用自己需要的文件。档案数字化以后,将已开放的档案上网,这样所有利用者就可以在任何时间上网利用档案信息资源。
④档案数字化是传统档案馆走向数字档案馆的必经之路。数字档案馆无疑是21世纪各级各类档案馆的发展方向。尽管当前它的具体组成结构、组织管理模式还处于探索之中,可其“馆藏”的数字化特征是肯定的,传统档案的数字化将是其“馆藏”的重要组成部分。
二、档案数字化的实践
1、档案数字化工作回顾
为了加快实现档案的现代化管理,方便检索和提供利用,我馆多年来花大力气致力于档案信息库建设和档案的数字化工作。1993年,我馆购置微机,独立开发人事档案管理系统,开始档案数字化的工作,使得全局职工基本情况在电脑中一览无遗,工资情况也能被系统所显示。1998年开发文书档案管理软件,利用电脑管理文书档案目录。经过这些年的努力工作,我们将馆藏所有文书档案、人事档案全部录入电脑,并实现了电脑查询,极大方便了档案管理。2002年,我馆与市房地产产权处合并,而产权处在1995年,开发出产权产籍管理软件,房产交易办证实现电脑化办公,并在实践中不断完善程序,将绝大部分产权产籍档案录入电脑,为全市房产发证加快了办事流程,减少了出现错误的几率。
2、实施档案数字化工程的必要性
首先,大力推进国民经济和社会信息化,以信息化带动工业化,实现社会生产力的跨越式发展,是党中央抓住信息化这一机遇,在党的十五届五中全会作出的战略决策。为了适应国家信息化建设和档案事业发展要求,2002年11月25日,国家档案局制定下发了《全国档案信息化建设实施纲要》,指出了“十五”期间档案信息化建设的指导思想、目标与主要任务。
其次,随着城市建设的快速发展,老百姓购房办证数量的激增,为保障尽可能缩短老百姓办理权证时间,不出现发证错误和重复发证,传统管理根本不能满足要求。
最后,2002年10月随着市房地产档案馆与市产权监督管理处的合并,档案管理工作出现了新的局面。湘潭市产权监督管理处开始建设湘潭市首个GIS系统——湘潭市房地产GIS系统,该系统最基础的工作也是最重要的工作是档案数字化工作(或称档案数据导入工作),只有保证档案数字化才能保障房地产GIS系统的基础的牢靠。
3、档案数字化工程的定位
产权产籍档案数字化工程是湘潭市房产局房地产GIS系统的子项目,旨在将海量产权产籍档案信息化、数字化,实现房地产GIS系统底层数据的全数字化,并通过建立后的系统实现“以图管房”,减少办证错误,提高办证时效,并通过GIS系统数据统计,向各职能管理部门和政府宏观调控部门提供数字化的档案信息及较为精确的统计报告,更好地为城市建设和房地产市场管理服务。
4、档案数字化工程需求分析 需处理量:A、产权档案:馆藏产权档案共计35万多卷。B、房产抵押、担保、司法查封档案:房产抵押档案12900余卷,担保档案2050余卷,司法查封档案1500余卷。C、正常业务:2003年9月1日之后的所有正常业务档案。
处理措施:划分时间线2003年9月1日,区分处理方式。时间线之前的档案将其档案实体整理与装订,各类档案详细录入相关页面数据,档案原件通过数字照相技术扫描;
时间线之后的档案,按照新开发的正常办证流程来实现数字化。
5、档案数字化工程的内容
将所有各类档案进行规范整理,然后,分成档案鉴定、档案扫描、档案导入三个大的环节,11个小环节分类录入服务器数据库。不仅仅将档案原件扫描生成图片存储,并将档案原件上记载的55项相关重要业务数据真实、准确的录入数据库。
6、档案数字化工程实施情况
需求分析与设备考察阶段:调查分析馆藏情况,包括档案的类型、载体形态与状态、馆藏数量等基本情况。根据馆藏情况制订档案数字化的科学规划,确定项目需求,根据需求考察当前各种高速扫描系统的集成解决方案。在设备考察阶段我们特别注意这么几个问题:A、档案数字化设备配置计划的成套性。B、档案数字化设备的配套性,也就是文档扫描仪和数字照相机优缺点对比,通过不断的实践,我们觉得数字照相机更加适应我们的工作。C、档案数字化项目硬件与软件的集成性。D、档案数字化方案与我馆需求的适应性。总之,考虑到档案信息数字化要经过一个较长的过程,因此我们从实际需要和长远打算出发,力求确保电脑、照相机、操作人员等设施人员数量的成龙配套,使其具有较强的支撑能力和扩展能力。
系统实验阶段:2002年底,项目开始立项。组织业务、技术骨干远赴深圳、上海、黑龙江佳木斯市等地实践考察,2003年6月,正式成立房地产GIS系统领导小组、数据导入小组,调集相关业务、技术精英加入团队,正式开始实验阶段的工作,新购进了12台电脑微机,4台佳能数码相机,4台EPSON激光打印机,一台工作站服务器,设备安装调试完毕。通过前期和软件公司合作,共同开发我们所需要的软件。探索档案数字化工作在快速系统下,档案前期整理、档案扫描、质量检查、扫描文件管理、后期整理等全过程的协调配合问题,并探讨在高速系统下如何解决某些技术问题。经过近一年的测试,我们对整体系统流程和配套软件、数据库的性能有更进一步的了解,在项目的运作模式和系统管理等方面积累了一定的经验,同时,也锻炼了一支技术过硬的队伍,为系统的正式运行打下了基础。
项目实施阶段:本项目是一个长期、流程化运作的系统,从建立开始就必须确保能长期高速、稳定运行。在系统的开发与研究方面有一个时间周期,现把工作计划分为以下几个阶段:
①、系统总体方案框架设计:
2002年12月—2003年6月,完成系统总体框架,生成详细可行性分析报告,及相关配套业务标准、各类管理制度。
②、系统建立:
2003年6月—2003年10月,系统建立,包括:硬件配置及软件的开发。
③、系统试运行:
2003年10月—2004年2月。
④、系统正式运行:
2004年2月起,系统正式运行,同学校签订合作框架协议,调集员工和学生共100多人,经过一段时间的业务及技能培训,参与系统的正式运行,在运行中不断完善升级。
三、对档案数字化的思考
1、提高认识,统筹规划
首先必须在思想上充分认识档案信息资源的重要意义,在当今信息公开程度越来越高的形势下,档案的文化性质和社会性质逐步强化,利用的范围和对象将逐步扩大。在这个信息时代,只有当档案信息资源在社会主义现代化建设中发挥重要作用时,档案和档案工作的意义和价值才能充分地全面地展现出来。
其次,作好统筹规划。将大量的档案数字化,是一个庞大的系统工程。首先要做好馆藏情况的调查,包括档案的类型、载体形态与状态、馆藏数量、档案信息利用等基本情况。根据馆藏情况制订档案数字化的科学规划,包括服务器、电脑、扫描设备等硬件的购置计划和数字化处理规划。档案数字化实施处理规划应贯彻“突出重点,分步进行”的原则,对馆藏重点和利用率高的档案先行数字化,早日满足大多数利用者的需求。
最后,档案数字化是一项费时较长的工程,在大规模、流程化的数字化过程中,所有档案原件都需从档案库房分批大量取出,一定要保障档案原件的完整,不允许出现损毁和遗失的现象。
2、加强基础工作,认真做好档案数字化
①、档案数字化必须有所选择。针对馆藏“浩瀚”的档案资源,不加选择地全部数字化是不可能的、也是不必要的。我们应该根据一定的原则确定哪些馆藏档案原件应该数字化、哪些档案原件中哪些页不需要数字化。
②、做好数字化时扫描参数的优化设置。扫描系统扫描参数的选择和确定对扫描数字影像质量有着较大影响,其中扫描分辨率直接关系到扫描文件的清晰度和还原效果。我们在选择分辨率时应根据实际需要综合考虑,包括扫描文件的可阅读性、存储空间、输出打印质量等。
③、做好档案数字化的全程控制。在档案数字化过程中,要注重全面的质量检查,加强数据的质量控制。质量检查应包括以下几方面内容:A、数字化前的档案整理检查。要进行数字化的档案原件必须完整、排序正确,对折损严重影响扫描质量的原件应预先修整。B、数字化中的人员业务培训。数字化工作是需要人来完成的,人员业务培训不过关,直接导致返工,间接导致成本的增加,时间段的延长。C、数字化后的数据质量、图像质量检查。录入后的档案信息要做到非常高的正确率,扫描后的文件图像应保持档案的原貌,字迹清楚不失真,无错扫、漏扫,对文件图像质量有问题的应重新扫描。
3、开展档案数字化问题的研究,及时解决数字化进程中的疑难问题。
档案数字化是档案工作中的一项新内容,不可避免地会遇到一些新情况、新问题。比如,数字化档案信息压缩及存储的关键技术问题;
业务形态于现有技术手段相抵触;
数字化档案信息安全、保密技术问题;
数字化档案信息的访问形式与安全控制问题;
数字化档案信息知识产权问题;
数字化档案信息的法律地位问题。针对这些新情况、新问题,应在抓档案原件数字化工作的同时,组织力量开展档案数字化问题的研究,及时解决工作中的一些业务问题和相关技术性问题,同时澄清和统一思想认识,确保档案数字化工作的顺利开展。
另外,必须加强档案数字化和数字化档案信息管理人才的培养。只懂得计算机技术或只懂得纸质等载体档案管理知识的人无法胜任此项工作,所以应加强这方面技术人员的培养。
第16届国际档案大会刚刚闭幕,此次会议的主题是:“档案、管理与发展:描述未来社会”。我们应不断学习最先进的档案管理模式,不断走出去看看,开拓眼界,才能跟上时代发展的主旋律。
国土房管档案馆档案影像管理系统
一、需求分析
----国土房管档案影像管理系统,其核心是完成纸面档案的影像化管理工作,将传统的纸面文档管理转变为对影像文档的管理,将传统的对纸面文档的数据索引方式转变为面对影像文档进行索引的方式,从而为业务的开展提供足够的、快速的信息保障,进而为提高工作效率打下坚实基础。
----系统要求:分别成立专职的扫描工作点、索引工作点、查询工作点。扫描工作点主要进行集中的扫描工作,开展索引前纸面文件的预处理;
索引工作点主要完成索引数据的录入,数据入库、生成相关业务报表、建立影像文档库等工作;
查询工作点可以是本单位内局域网上的任意多个工作站。
----以下对已掌握的需求要点分别进行分析,以及提出解决建议:
1、档案科目分类
需求:档案业务单式种类较多、分类查询方式也较多样 系统要求:软件在分类、录入上应当实现简便、快捷。
2、档案规格、尺寸
需求:虽然档案的尺寸、规格基本相同,但考虑到可能要涉及到的附件纸张规格有不同规格和纸张质量(薄厚),这对扫描仪应当有着较高的要求。
系统要求:采用能够实现多种规格尺寸的档案、档案可以实现同时扫描的设备,不必对规格、尺寸做任何限制和要求。
3、档案处理手续
在处理电子文档过程中,所有的档案都要按照类别、顺序号排列,但是如有缺漏要立即发验,保证文档的完整。原始档案和影印件要准确无误的保存起来。
系统要求:系统工作流程定义时,避免流程的逆转,要求图像扫描和处理时要准确无误,不能存在纠偏变形、遗失档案和要素等问题。
4、档案、档案要素
需求:档案的数量和格式不具有绝对固定性,不定期的会增加一些档案,档案的格式也存在变更的可能性。
系统要求:软件可根据档案数量、种类和要素的变化,可以自定义档案和要素。
5、档案纸张
需求:档案的纸张的质量差别虽然不是很大,但要保证原始档案的完整性;
另外,有的手写体和印刷体字迹不很清晰。
系统要求:不能撕坏纸张;
必须能够对字迹进行增强;
扫描是能够自动识别纸张的薄厚,对于一部分年久的纸面文档,应采用平板扫描的方式进行处理。
6、档案的信息处理:
系统要求:历史档案处理,需要采用两台高端的扫描仪、2台中端自动进纸扫描仪,5台平板扫描,多台数码照相机,扫描时需人手做前期整理工作,以及后期的档案归档工作。
完成所有的历史档案的处理需要准备不低于1.3T的存贮空间。
7、扫描方式
需求:档案的扫描不进行分散扫描,分散扫描会造成各口工作人员的工作效率的极大下降,并且扫描后的文档较为混乱,不利于后续的索引工作。
系统要求:在减少硬件投入的情况下,有利于提高工作效率,减少扫描的工作环节和更有效地进行质量控制,扫描之前应对被扫描的档案进行归类整理,以方便扫描,扫描过后由QA进行质量检查。
8、正确索引
需求:要求写入数据库的索引数据要确保正确。
系统要求:为了确保索引相关信息被正确入库,可灵活采用一次录入,二次较对,或操作人员两次录入的工作方式,系统自动校对。
9、影像文档及数据安全
需求:档案管理部门所涉及的档案,对安全性及其保密性有很高的要求。
系统要求:可对影像化的档案资料进行加密。
10、影像文档的查询
需求:按一定的权限要求进行系统设置,完成查询的需求。
系统要求:采用安装客户端的方式,按一定的权限要求进行系统设置,完成查询的需求。
11、备份归档
需求:国土房管档案影像管理系统要求提供可靠的数据存储与备份。
系统要求:按现有的数据量以及计划中的投资,可以采取大容量存储设备磁盘阵列和磁带机作近线备份的方式保存数据。
12、查询响应速度
需求:系统查询速度需要考虑多用户、多数据时系统要能达到较佳的响应速度。
系统要求:影响系统查询速度的因素主要有三个:网络带宽、影像文件大小及并发用户的数量。所以影像文件的调阅速度基本上由周边网络设备设决定。
二、解决方案
1、目标
----国土房管档案影像管理系统担负着档案的管理的任务,是一个专职处理档案的职能部门,通过为国土房管档案影像管理系统建立档案影像管理系统,引入新一代的文件管理技术,为国土房管档案影像管理系统建立原始档案的影像档案库,以达到加强原始档案的管理、提高管理效率、降低管理成本、实现资料的快速查询及共享的目的。
2、概述
----信息行业作为知识经济时代的核心产业之一,近年来一直以惊人的速度在不断发展,而以纸面文件作为媒介的各种信息资料也呈爆炸性增长。如何有效管理这些信息资料,不断提高信息的使用效率,已经成为一个重要课题。
3、现状
----国土房管档案影像管理系统的在日常业务中,会产生大量档案,档案多以纸面文档的方式产生,以传统的数据处理方式进行处理,纸面档案每天都在大量地产生,再加上历史遗留文档,数量是非常惊人的,其中所涉及的信息数量也非常庞大。对于这些档案及信息,如何进行分类、保存和归档,录入、高效的查询,一直是一件非常棘手的事情。在传统模式下,总是被以下几个难题所困扰:
● 检索、查询和日常管理麻烦,工作效率不高;
● 纸面文档不好保存,很容易被损坏或弄污;
● 管理效率低下,管理成本居高不下;
● 档案调阅及信息利用效率较低;
● 工作低效率、高成本;
----从以上的介绍,不难看仅仅用手工进行纸面档案的管理有很大局限性,在信息技术飞速发展的今天,也越来越不合时宜了。如何利用最新科技,完成纸面档案的电子化管理工作已经成为当务之急。
4、影像技术简介
电子影像是指各类文档的电子照片。
----影像技术是指将各种文档制作成电子照片,使这些文档的采集、分发、使用、管理、存储完全电子化的相关技术,而传统的电子化技术是把文档上的信息制作成电子数据,把文档的流转和处理转化为数据的流转和处理。
----影像系统是指对经影像化处理的文档完成数据录入、查询、调阅、批改、存储等功能的一整套解决方案,通过方案的实施能有效的解决传统手工纸面文档管理所无法解决的难题,具体有以下几方面:
● 原始文档电子影像化备份;
● 可靠安全的数据管理;
● 文档“影像原件”的高效查询;
● 在减少工作难度的同时,进一步推进管理工作的规范化。
----文档影像化作为一种先进的信息管理手段,一经采用,必将大大提高纸面文档及数据的管理效率,降低成本,改进服务,提高信息利用率。
影像技术应用的可以分不同阶段开展 ● 初级阶段:影像化存档:
完成文档影像化工作及影像文件查询 不涉及工作流技术
不涉及业务过程
● 深化阶段:影像化业务处理:
工作流技术与影像技术结合 融入业务处理过程 从后台走向前台
三、详细的技术方案设计
1、工作流程设计
注:当有以下情况发生时,工作流程按以下的规定进行:
A. 扫描QA时发现漏扫、误扫、扫描质量太差:重新扫描。
B. 索引时发现漏扫、误扫、扫描质量太差:重新扫描。
C. 自动校对时发现有误:取有误的输入数据对照文件重新修改,计入日志,生成相应报表。
接收档案
对所接收的纸质文件,根据一定的规则按类别、按份数完成文档的第一次整理工作。
确立批次
以加入标识纸的方式,对每一份档案进行分隔;
以一定的份数为一批,系统将自动生成批次号(注:也可以采用条码自动识别的方式进行分页及生成流水号,但采用条码方式需要加大软、硬件的投入。)
2、扫描 中高速扫描
系统采用PANASONIC 高速扫描仪KV-SS905CCN 2台、中速扫描仪KV-S7065CCN 2台,以每个批次为单位,放入扫描仪的自动进纸进行扫描。扫描时,自动生成档案的分类、分页。
3、影像处理
扫描质检
检查扫描的电子影像文件是否有漏扫、误扫和扫描质量欠佳等,以保证扫描输出高质量的电子影像文件。
进行扫描质检时可以采取扫描完后,在扫描工作站上进行扫描的电子影像文件进行质检。
扫描补漏
对于有质量问题的影像文件建议全批重扫以减少操作复杂性,个别情况下可以用平板扫描仪、数码照相机对那些漏扫、误扫和扫描质量欠佳的文件进行追加扫描。
4、原始档案装订入库
在对扫描后的电子影像文件检查无误,将原始档案采用常用的档案管理方式装订及入库。
5、索引
在索引时可采用一人两次录入,系统自动较对,对系统较对不一致的数据,进行校验及录入。
6、数据归档 接收数据及相应的报表,数据分别供业务数据库使用及影像文档库使用。
7、归档备份
本系统采用一台服务器、一个专用磁盘阵列对索引文件、影像文件进行备份;
在进行索引文件备份可以采用定时备份或定容量备份,还可以采用不定时备份,这样影像文件服务器遭到灾难性破坏,可以直接将所备份的索引文件恢复。
8、检索、查询、管理影像文件
在对影像文件进行查询时,基于本系统的在局域网里的查询,采用安装工作站软件的方式,生成查询日志。
5系统结构及配置
四、系统结构
系统结构如下图所示:
系统功能
我们设计的解决方案,由以下几个子系统功能组成:
高速扫描
由高速扫描软件提供高速扫描图像资料的功能,把客户的原始资料转换为电子影像资料。由高速扫描员使用。把保存的数据送到质量检验工序。
质量检验及数据录入
影像质量检验与部分索引录入是把影像质量有问题和数据不正确的影像资料找出来,由质检员使用。索引的资料将会分别放在影像库中及数据库之中。
系统管理
本系统提供的维护和生产情况查询功能,由系统管理员使用。
安全管理
本系统分系统管理员、高速扫描员、质检员和查询客户。其中系统管理员负责整个系统的管理,拥有系统的所有权限。高速扫描员、质检员有相对应的工序使用权。而查询客户只拥有影像资料的查询权。
生产日志查询
可统计和查询在各工序间的未处理资料情况;
可统计和查询资料保存到影像数据库的情况。
出错处理
如果在使用过程中发现索引信息有误,系统管理员可以删除错误纪录,调出相应存放地中的资料重新扫描并建立索引。
影像查询
本系统提供资料影像查询功能,使业务人员可以通过EZDOC影像管理系统随时查找需要的影像数据,查询相应的影像文件;
影像文件在查看时可以有放大、缩小、旋转、打印的功能;
记录查询日志。
校验功能
系统可以与其它系统的有机联接,可以自动与业务系统提供之数据进行对比。
数据备份
数据备份分为两个部分:影像文件索引信息数据库备份、影像文件备份。
对于影像文件索引信息数据库的备份,电子档案管理系统不再另外提供备份功能,而是直接使用数据库管理系统的备份、恢复功能,保证数据库的完整性、有效性、可恢复性。
有关影像文件的备份:电子档案影像索引之后,首先存储于影像文件服务器,然后,系统自动完成备分机的备份任务。
5.3.2系统特点
无业务流程的逆转
国土房管档案影像管理系统要求:“准确”、“迅速”、“安全”、“方便”。自然,在业务流程中尽可能避免业务流程逆转,也就是说:在影像扫描的过程中尽可能避免档案重新扫描、档案漏扫等问题。流程的逆转会增加数据错误的可能,流程逆转的环节越多错误可能性越大。
用户可以自定义档案分类
档案种类繁杂,而且档案种类、档案要素并不固定,而且可能发生变化,如果系统将档案类别做成固定方式,则无法适合业务的发展。于是,我们在系统中为用户提供了一个开放式接口,可以让客户按照自己的方式增加、修改一些档案分类和档案要素。——不用编程,全部通过鼠标即可完成。
用户可选择当前扫描、输入的文档类型
虽然,每天处理的档案的种类和数量较大,但并不是每种档案都有——通常数量大的主要分布在大业务上,有些档案通常几天出现一次。如果每天都要建立所有的分类,这将消耗不必要的存储空间。因此,我们提供了对当前要扫描档案类别的选择功能,客户可以根据当前业务情况进行选择。
用户可以自己确定档案的要素
据上所述,我们的档案类别差异很大,而且不定期在发生着变化,那么,档案的数据要素也在发生着变化,为了让客户更好的适应这种变化,我们提供一个开放式档案要素设定。可以根据具体的档案设置、更改某些要素。
多种安全保护模式
软件登录是采用密码方式。
数据库系统及影像文件也做了加密工作,防止他人修改影像数据和数据库数据。
质量控制
在扫描过程中若出现漏扫、误扫或影像质量不好的问题,通过有效的工作日志的管理,解决以上问题。
档案数字化方案研究
课题组
《档案数字化方案研究》项目对档案数字化优化策略与原则、技术路线与支持、流程重组与再造、操作方法与步骤进行了全面的研究,达到了档案数字化全过程优化和管理系统整体优化的目的,形成了完整的档案数字化方案和成功的实践案例。国家档案局组织的专家鉴定委员会结论是:“该项目基于长春市档案馆以档案利用为导向、渐进性的档案数字化实践,提出了档案数字化工作的指导思想、优化原则和优化策略,符合国情,符合现代管理理念,对全国各档案馆的相关工作具有较大的参考价值;
注重档案数字化工作与档案数据库建设、档案信息网络开发的有机衔接,提出了系统优化的技术路线,规划设计了档案鉴定与数字化同步、档案数字化与上网利用同步、多种档案数据库建设同步的流程,并成功地付诸实践,实现了档案数字化与上网利用的低成本、高效率、高效益。同时,运用CA认证、数字水印、电子签章等技术,为网上档案信息资源安全、准确利用提供了技术保证,也为档案管理部门提供了很好的实践模式”。该项目获国家档案局2006年优秀科技成果二等奖的同时,长春市档案馆被国务院信息化工作办公室和国家档案局确定为传统载体档案数字化试点单位。
一.档案数字化的指导思想
以优化理论为指导,以用户需求为导向,以利用档案为目的,充分应用计算机软硬件功能,最大限度地发挥人力资源和数字化加工设备能力,兼顾保护档案原件的要求,保证数字化档案的真实可靠,更好地发挥档案信息资源的作用。
二、档案数字化的优化原则
实用性原则:针对馆藏档案具备重复利用和紧急利用两大特点,急用、常用档案优先数字化是档案数字化的首选。
开放性原则:互联网给档案信息资源共享提供了超越时空的条件,国家民主政治建设和政府信息公开催促档案解密和开放,开放档案及时数字化是实现其社会共享的前提。
价值性原则:重要档案优先数字化具有档案利用和档案保护双重意义,是网络时代更好实现档案价值的客观需要。
抢救性原则:计算机存储给档案抢救开辟了了新的途径,档案数字化是保护濒危档案原件最经济和便捷的方法。
时效性原则:档案数字化加工与数字化档案利用同步实现,是充分利用计算机网络技术,更好、更快地实现档案数字化效益的最佳途径。
三、档案数字化的优化策略
需求导向策略:社会需求是制定和调整档案数字化工作策略的“风向标”。汇集多年档案利用情况统计,把利用频繁档案的进行综合分析,科学地圈定优先档案数字化的范围。并建立快速反应机制,执行常用档案继续做与急用档案突击做的计划,达到数字化档案利用即时见效的目的。
本级为主策略:地方档案馆保存的本级永久档案是数字化的重点。进入信息时代,馆际间重复的上级档案文件,与其分头进行数字化及开放鉴定,不如发挥中国特色档案管理体制的优势,由上级档案行政管理部门组织,向馆际共建、共享数字化、开放鉴定成果的方向发展,尽量减少档案馆多层的重复劳动。
分步实施策略:馆藏档案数字化不可能一步到位,而且随着时间的推移,档案室进馆范围的档案将陆续移交到档案馆,这些档案采取馆室共建、共赢、共享的数字化策略非常有意义。
剔除无用策略:馆藏现行档案是否进馆往往由立卷人员决定,加之保管期限表比较笼统,馆藏不该归档、不该进馆、重复档案颇多。特别是建国超过50年以后,市以下档案馆长期保管的档案逐年超过保管期的上限。因此,开展档案价值鉴定,剔除无用,以免再造数字化垃圾,避免资源浪费应是长久的策略。
四、技术路线的优化选择 档案鉴定与数字化同步:从利用上讲,解决制约档案信息资源共享的主要瓶颈---档案开放鉴定问题是当务之急;
从成本上讲,档案价值鉴定是避免失效档案数字化的最佳方法。只有这样,才能控制档案数字化投入与产出比例失调、数量很大共享很少的问题。
多种档案数据库建设同步:一是首先建立文件级目录数据库。满足一次检索需要,建好文件级目录数据库。目前,绝大多数档案馆,因没实现全部档案的文件级目录机检,查档不快、不准、不全的问题不可避免。所以,把文件级目录数据库建设作为基础性工作,是提高档案查全率、查准率必经之路。二是适时建立专题数据库。随着社会发展,对某一专题档案集中需求时有发生,突击建立专题数据库,满足社会需求是发挥档案作用的最佳时机。三是优选建设全文数据库。满足档案信息资源开发利用需要,优选建设全文数据库。按照国家档案局提出的利用频繁档案首先数字化的要求,遵循“二八”定律(即以20%的努力达到80%的效果),同步开展档案全文数据库建设。
档案数字化与上网利用同步:档案数字化的根本目的是充分发挥其作用。通过计算机网络技术,实现档案数字化与局域网上利用同步,开放档案数字化与互联网上利用同步。
五.重组和再造的优化流程 为发挥计算机网络的优势,重组和再造优化流程的实质,就是对档案数字化整个工作流程进行系统分析,不但要打破原有业务规程,还要改变行政管理分工,进行全方位的变革。档案数字化的任何一个细节都会对整体产生影响,轻者降低效率,重者决定成败。长春市档案馆高度重视每一个细节,再造和优化了上百个流程和内部标准,保证优化技术路线的顺利执行。
六.档案数字化示范案例----长春模式
从2004年开始,长春市档案馆以科研课题为先导,以项目管理为手段,以效益实现为检验标准,组建并成功运行档案数字化工作组织架构、资源配置、数字化加工、上网利用“一站式”流水作业线,探索档案数字化和网上利用服务工程优化模式,终于闯出一条独特的档案数字化之路。
(一)实施三个工程,建立一个团队
长春市档案馆把信息化带动作为首位战略,视为一把手工程、班子工程、全员工程突出抓,并创新管理机制,打破行政分工,在计算机网络环境下,建立了行政领导、指导专家(技术业务总负责)、专业人员、外聘技工20人的长期流程团队,并与现有计算机和扫描设备进行合理搭配。该团队由局(馆)党组直接领导,馆技术部门提供支持,管理部门提供档案,专家提供指导,创立了高效的组织体系,搭建了投入小产出大机制框架。
(二)集中四个环节,坚持流水作业
文件级目录数据录入是档案数字化的基础,档案鉴定是档案信息资源共享的前提,全文数字化是提升档案服务水平的途径,整理是档案文件实体管理主要环节,把上述四个环节集中,是提高工作效率和质量的最佳选择。长春市档案馆四集中流水线上,目录数据录入岗位安排业务和技工7名、档案鉴定岗位安排5人、档案数字化加工4人、档案实体整理4人,在网络环境下实行集中办公和流水作业。
(三)数字化成本降低,数字化速度加快
由于采用高效的组织体系和优化的技术路线,已有20万件档案走下流水线。
低成本主要体现在:20万件档案缓销剔出占24.7%,留存档案占75.3%;
留存的75.3%档案,全文数字化占25.6%,现用现扫占49.7%,比全部扫描节省费用40%以上。同时,三年时间建成数据库50个,文件级数据库120万条(包括20万件全文);
专题数据库120万条;
照片数据库2000张;
资料数据库5000条,案卷级目录数据库23万条;
现行文件和政府公开信息1万余件(条)。局域网运行档案目录数据260万余条,20万件全文;
互联网运行档案目录数据120万条,8万件全文。完成这样规模的数据库建设,全部人工费只有58.4万元(包括流程团队档案干部的工资),经济成本很低,时间成本很少。
高效率主要体现在:价值鉴定、开放鉴定、数字化筛选、原件扫描、实体整理同步完成,比各项分步做效率高数倍,同时有现用现扫的方法配套,投入少量设备,相当于将20万件(200万页)档案全部扫描的效果。
(四)利用方式变革,社会效益显著
为充分发挥网络优势,长春市档案馆采取了直接与间接相结合的方法提供利用。
1、直接提供利用:对数字化档案全文,在局域网内,接待人员利用网络检索后直接打印,为用户提供数字化档案打印件。在互联网上提供数字化档案全文下载、打印服务。并通过CA认证、电子签名等安全技术,对特定的用户直接提供加盖电子签章的数字化档案打印件,已有案例。
2.间接提供利用:对目录数字化档案,在局域网内,接待人员机检到档案后通知档案库管人员,档案库管人员调出原件全文扫描后,通过网络打印机直接传输打印件,由接待人员提供给用户。
目前,长春市档案馆基本实现了三个替代:网络检索替代手工目录检索,查看数字化档案替代查看纸质档案,网络打印替代手工复印。
高效益体现在:档案全文数字化占馆藏档案的10%,提供数字化档案占利用率的70%。为上万人提供了档案证明,公众成为档案数字化的最大受益者。档案数字化成果得到社会公众,上级档案和信息化部门,当地党委、政府,国内外同行的普遍赞誉,数以百计的留言、锦旗、感谢信、奖励证书、媒体报道就是最好的证明。
档案数字化解决方案
档案数字化是指采用扫描仪或数码相机等数码设备对纸质档案进行数字加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。
公司装备多种扫描设备:高速扫描仪、零边距扫描仪、宽幅扫描仪、书刊扫描仪,可处理各类纸质文档。可根据不同文档的材质、幅面大小及内容,提供不同的电子化扫描及索引(著录)解决方案,并可根据客户需求量身制定扫描加工方案。
经验丰富的实施生产队伍
自2002年开展数字化扫描加工业务以来,掌握了较全面的专业知识及积累了丰富的工作经验。
成熟的管理机制、有效的管理控制手段。
严谨的质量控制手段,可实现扫描加工过程中各个环节的质量控制和自动化的量化记录,可确保扫描加工的影像、索引的正确性。
严格的客户财产保全制度及控制手段。可确保客户文档资料、数据在扫描加工服务中的安全性、保密性。
先进、灵活的扫描加工生产系统
公司自主研发的扫描加工生产软件系统,基于工作流的任务机制,实现流水线式的生产模式,可根据客户的需求灵活的配置、调整,以适应不同客户、不同类型文档的加工任务。
包括:文件、档案、文献、资料、报纸、书刊、杂志、合钉本、汇编 扫描模式:黑白二值、灰度、彩色 扫描分辨率:150DPI~2400 DPI 保存格式:TIFF、JPG、CEB、PDF等。
扫描加工生产软件系统针对文件、档案管理工作的特点,通过集合图像处理、OCR等多项自动化智能技术,实现处理扫描图像自动纠偏、除黑边、去污等处理,实现扫描文件自动命名与装订,生成多页TIF文件,通过OCR识别技术实现电子文件元数据半自动获取,在大幅度提高扫描加工的工作效率的同时,可以完成电子文件元数据的获取工作,并在保证扫描图像文件质量前提下,以最低的容量存储文件。
主要功能介绍
①自动扫描与目录图象属性加工设置;
②自动倾斜校正/去黑边/去白页/加粗/A3切割为A4;
③前置处理设置:去斑、亮度/对比度、颜色通道设置;
④自动文件命名;
⑤自动装订(将多个单页TIF文件合并为1个多页TIF文件),支持固定页分割、白页分割、标志按钮分割;
⑥自动JPG输出质量设置;
⑦自动扫描页计数(见主界面扫描计数器),目录中文件与页数自动统计。
根据各档案馆(室)在处理历史档案问题的经验,结合我公司图像处理技术上的优势,特提出了档案数字化制作流程及相应的技术参考。
1、档案分类整理
档案分类整理是指将案卷按扫描要求进行分解整理,包括原件的拆卷、起钉、粘贴页撕开。并按扫描后的电子文件组织形成进行分类,以便扫描时的批次处理。
2、档案交接
分类整理后的档案按时间先后或其他分类项顺序提出,并按实际卷(页)数填写详细的档案交接清单,并由双方管理人员签字。
3、标引著录
标引著录为了方便查阅与管理,打印制作档案目录及档案封面,对文字录入的准确性要求较高,但著录的文本域并不是完全统一的在某一页面上,一些文本域要在多个文件中选择,所以录入时需要相关档案管理人员进行指导,制作相应的《文字录入工作说明书》,确保文本域录入的准确率。
4、档案的扫描
原件的扫描与存储格式完全按照国家档案管理的统一标准要求扫描。扫描图像使用先进的图像扫描处理软件,扫描人员可根据原稿质量,对系统进行定义,如倾斜校正、去污等批处理功能。在由系统自动处理功能的同时,扫描人员根据原件的实际情况做相应的调整,如超大页面的处理、纸张颜色深浅及薄厚的处理、扫描时可根据不同原件的情况,调整图像的分辨率、明暗度以及扫描方式和扫描速度,确保在扫描图像质量清晰的情况下,使原件完好无损。图像的分辨率正常情况下为150dpi ,如遇字间距和行间距过密、原件本身是复印件等字迹不清楚的情况,可适当增加扫描的分辨率,但要保证图像清晰的同时,又不影响远程查询和浏览的速度。
5、图像处理
档案数字化制作模块中的图像处理采用自动化处理和人工处理相结合的方式,确保图像质量的完美。通过对图像进行校对,确保图像顺序正确,在校对时,发现不合格图像及时返回前一工序进行改正。
1)污渍、黑白、偏斜处理 2)全文字面的扫描密度 3)粘帖页与表格 4)插页
5)照片页的处理
6)存储格式与面页空间 分辨率:100-300dpi 图像格式:TIF、JPG、PDF、CEB 储存空间:A4,黑白二值,40-50KB/页
6、质量检验
对扫描处理完成后的图像页进行检验,对档案拆分、扫描、修正、去污、插图、照片的处理以及文本和图像页的匹配等质量进行全面检验。对文本域录入与文本录入域的标引、文件的页号及页数进行对比,对扫描前图像页的标引与扫描后的图像页的编号与页数进行对比,发现不合格的登记清单并退回上一流程重新处理。
7、挂接
文本域录入和扫描处理检验后的图像成品,由系统自动进行文字图像与系统的匹配挂接。挂接到档案数据库系统中后,进行再次的成品验收。
8、案卷整理
档案整理工作严格按照国家档案局规定的相关标准和本单位实际情况进行有序的整理,安排专人负责案卷合并与整理。
9、入库交接
装订还原后的档案按时间先后或其他分类项顺序入库,并按实际卷(页)数填写详细的档案交接清单,并由双方管理人员签字。
档案资料是历史的见证、社会的财富,无论在国内还是国外都对其价值与重要性给予了高度的重视。但是,由于传统的档案保存方式一直采用纸张保存和目录式管理,不仅占用了大量库房空间,管理成本高,保管时易损坏,如纸张易黄、易粘、易脆,而且查阅、利用非常不便;
虽然目前有部分单位使用计算机管理,但其多数是基于目录级的管理,文档资料本身仍以纸张形式存在,其管理、查询与利用仍需要在库房中进行,因此并没有解决传统纯粹纸张化文档资料管理所固有的成本高、效率低、原件容易损毁等问题。
如何安全、有效地管理日益庞大的档案信息并能满足快速查询的需求?建立一套完整的、自动化的、扩展性强的文档信息管理系统已势在必行。
一、目前现状
1.传统的档案数据库中分类信息复杂,需靠手工查询纸张原件,响应速度慢。
2.由于档案量巨大,当需要查询档案时,需花费几个小时甚至一天的时间在档案室查找。耗时、耗力。
3.由于档案需长期保存,为提高存储环境,避免可能造成文档纸张受潮、虫蚀以及火灾等灾害,每年大量投
入文档的保管经费已在所难免,且因无备份而又为每年不得不有的文档损失担忧。
4.由于档案需反复查阅,不可避免的存在原件受损或遗失,给文档的保管与利用带来管理上的困扰。
5.在已认知的低档平板扫描仪录入的方式下,大量文档的电子化进程是不可想象和解决的,且大量电子化文
档如何管理、查阅、应用有待全面解决。
二、解决方案
高速文档扫描仪:富士通扫描仪 E-DOCscan 文档自动扫描软件
MaxAttach NAS 4000存储器
服务器:自选
数据库:SQL或Oracle 大型数据库软件
软件:数字化档案管理软件
操作系统:
服务器端 Windows2000Server+IIS5.0 以上
客户端 Windows9X+IE5.0 以上
其它设备:打印机、条码打印机等
档案数字化方案制定与实施
长春市档案局 梁 伟 李学广
馆藏传统载体档案数字化的问题,许多地方档案馆进行了实践,积累了一定的经验,对全国档案数字化建设起到了推动作用。但是,总结以前我国档案数字化建设的不足和失误,往往不是信息技术支持不够,而是绝大多数都知道搞数字化,但档案数字化目的是利用的主题不突出,忽略档案开放鉴定与数字化档案利用的逻辑关系,对先剔除无用档案后开展数字化的思路不明确,没很好研究档案数字化的整体效果就大张旗鼓地做起来了。进而出现数字化目录数据和全文数据不对应、找不着或不好用等问题不少,档案数字化的量虽多,但能上网利用或者说能上互联网利用的很少,数字化返工的现象比较突出,使有限的资金投入并没有体现在数字化档案的利用效益上,这一点已引起档案系统管理和技术高层领导的重视,许多实践工作者已开始进行有益的探索。
面对网络时代公众迫切需要远程、公开、快捷的档案信息,面对馆藏浩瀚如海的案卷,面对当前我国档案数字化需要解决的一系列问题,长春市档案馆与中国人民大学信息资源管理学院共同承担了国家档案局科技项目《档案数字化方案研究》。该项目经过课题研究人员的共同努力,已取得初步研究成果。通过课题研究,对档案数字化方案的研究提出了一些观点和看法,大家交流和讨论。
一、确定档案数字化指导思想与原则
档案数字化指导思想是:以需求为导向,以利用为目的,充分利用计算机软硬件功能,最大限度发挥人力资源和数字化加工设备能力,保护馆藏档案原件完好,保证数字化档案真实准确,更好地发挥档案信息资源的作用。
档案数字化原则是:遵循重要档案数字化的价值性原则、常用档案数字化的实用性原则、开放档案数字化的开放性原则、褪迹档案数字化的抢救性原则,解密档案数字化的及时性原则,目录数字化与全文数字化分步的时效性原则,档案数字化加工与利用同步的一致性原则。
二、明确档案数字化策略
(一)需求导向,急用先上策略
1.需求导向策略
社会需求对档案利用的影响应该是档案工作者特别关注的问题。我们用统计数字加以分析。
(1)随着编史修志工作纳入各地工作规划,1986年全国省(区、市)综合档案馆接待编史修志查档卷数占利用总卷数的69%。随着编史修志阶段性高潮过去,2003年全国省(区、市)综合档案馆接待编史修志查档卷数占利用总卷数的28%。下降41个百分点。(此数据来自国家档案局法规司保存的档案统计年) (2)随着社会保障制度的建立和国有企业改革的深入,长春市档案馆查阅工人调配档案卷数占利用总卷数的百分比,由2002年的1%增加到2004年的占利用总卷数的68%。(此数据来自长春市档案馆利用统计数据库) 由此看出,国家、地方新政策的出台和工作部署对档案利用的影响程度。从宏观上讲,档案利用已实现了两个转变,服务重点由政治领域转变为经济领域,服务对象由机关干部扩展到公众百姓,特别是为百姓提供凭证案例急剧上升。用动态观念研究当前与长远社会对档案的需求,并指导档案数字化与利用服务工程实践应该是档案部门的必然选择。
2.急用先上策略
地方档案馆馆藏档案数量众多。但并不是所有档案都在现实中利用,有相当大一部分多年不用。2004年全国省(区、市)综合档案馆档案平均利用率仅为1.6%。虽然档案馆众多全宗中当地党委、政府全宗利用率高是一般规律,但其他全宗利用情况往往和政策、时间的变化而变化,影响更大。所以,各级地方档案馆按照近期利用统计情况和发展趋势确定数字化的先后顺序是科学的选择,利用优化理论进行档案数字化筛选,快速反应,突击完成急用档案数字化任务,能够达到更好地发挥档案作用的目的,实现即时投入使用的预期。(此数据来自国家档案局法规司保存的档案统计年报) (二)本级为主,分步实施策略
(1)本级为主策略
根据档案馆职能分工和档案来源原则,各级地方档案馆永久档案绝大多数是本级机关形成的,一般都占50%以上,这部分档案自然是当地档案馆数字化的重点。同时,地方档案馆都保管着大量的上级档案文件,馆际之间上级档案文件重复是必要的,这些纸质文件来源一般都是上级机关统一印制的。进入信息时代,地方档案馆都面临着保管的上级档案文件全文数字化问题,特别是上级档案文件的开放鉴定审查问题,与其各地分头审查上级档案文件开放和进行数字化,不如国家档案局着手进行档案全文数字化和开放鉴定分工、协作,向馆际共建、共享已有鉴定和数字化成果的方向发展。地方档案馆坚持本级为主的原则,根据需要和可能适时、适量地进行利用频繁政策性上级档案文件的全文数字化,以满足当前工作的急需,尽量减少档案馆多层的重复劳动。
(2)分步实施策略
馆藏档案数字化不可能一步到位,而且档案室进馆范围档案陆续进馆,进馆范围档案实施档案数字化馆室共建、共赢、共享的策略非常重要。在具体实施过程中,文件级目录数据库建设是最基础性的工作,是第一位需要建全的,但并一定是文件级目录数据库建成后再建其它数据库。专题数据库建设是根据现实需要而适时建立。全文数据库建设是满足信息检索需要而必须加快建设的数据库。
(三)剔除无用,避免浪费策略
1.剔除无用策略
地方档案馆馆藏现行档案主要来自于机关各个立档单位,其档案文件进馆的决定权掌握在立档单位文档人员手里,加之国家档案保管期限表几经修改和许多条款至今还比较笼统,所以,不该归档的、不该进馆的、文件重复的档案进馆颇多。特别是建国超过50年以后,半数左右长期保管的档案逐年超过保管期的最上限,这些档案实际上绝大多数已失去保存和利用的价值,但它们仍占据着档案管理的各种资源。
2.避免浪费策略
面对数字化方法的选择,剔除无用,避免浪费应该是一种长久策略,把大量失去保存价值的档案先剔除,避免把无用档案数字化,再造数字化垃圾。
三、优选档案数字化技术与业务路线
档案数字化建设周期长,信息技术又处在快速发展之中,各个档案馆数字化基础和条件不同。从本馆实际出发,优选档案数字化技术与业务路线特别重要。
(一)计算机新技术与档案数字化业务的有机结合
信息技术的发展给档案数字化效率和质量的提高带来深刻的影响,本着技术为需求服务的理念,无论是利用哪一种档案管理系统,都要适应档案数字化流程重组和再造需要,适时进行软件升级,通过软件升级固化技术与流程重组与创新,使档案数字化的效果更好。同时,设计符合国家标准与适应自身需要的数据库结构,使档案数字化的过程优化,数字化档案的利用快捷。
(二)档案鉴定与数字化同步
鉴定与数字化同步的目的是加快数字化档案信息的利用。在计算机网络环境下同步进行档案鉴定与数字化工作是发展趋势。这种档案鉴定是以剔除无用档案为前提,以鉴定档案开放为主,按需求筛选全文数字化档案,为适时提供数字化档案信息服务打基础的过程。
(三)档案数字化与上网利用同步
数字化档案分开放与不开放两种。在计算机网络环境中,在确定档案开放与不开放的同时,开放档案即上互联网。开放与不开放档案数据在局域网中即时使用。
案字及理程组可
档数化管流重不能
一次到位,它一个管理思想不断地变化的过程,适时把新技术和新理念纳入进去是非常重要的。
四、细化档案数字化操作方法
实践证明,在计算机网络环境下,档案数字化和利用服务工程以建立流水作业线,提高工作效率和效益为最佳方式。
(一)优化配置各种资源
档案数字化建设需要投入,特别是建设初期软硬件配置投入较大,建成后也要保持一定的运行成本。地方档案馆在具备一定档案数字化条件的基础上,要按照成本效益最大化理论,根据不同的情况,进行档案专业人员和数字化技工人员、计算机和扫描设备的合理搭配,优化档案数字化各种资源配置,提高档案数字化建设的投入产出比,构建档案数字化投入小产
是出大的新模式。
1.计算机网络环境下档案数字化与利用服务工程流水线资源配置案例
(二)首先建立文件级目录数据库
满足一般检索和管理的需要,建好档案文件级目录数据库。目前,绝大多数综合档案馆,由于没有实现全部档案的文件级目录机检,查找档案不快、不准、不全的问题普遍存在。另外,档案的统计单位主要是卷和延长米,而档案的最小单位是文件的件数,以件为单位的底数不清是普遍存在的问题。所以,把文件级目录数据库建设作为一项基础性工作,在提高档案的查全率、查准率的同时,利用计算机实现档案以件数为基本单位的管理是非常必要的。
1.高度重视文件级目录数据录入的前期处理。档案馆的案卷来自各个立档单位,案卷是由文档人员在档案局业务人员指导下形成的。但是,由于文档人员变动频繁、档案业务指导面多线长,案卷质量难以适应计算机精确管理的需要,加之个别文件形成时的先天不足,给文件级目录数据库建设带来许多麻烦。实践证明,进行文件级目录录入的前期处理,抛开原有的文件目录,按卷内实有文件一一录入,把题名不反映主题、目录与实体不符等一系列问题一并处理是非常必要的。
2.科学合理地设计数据库结构。文件级目录数据库结构包含三方面功能为最佳。一是符合国家有关标准及实际情况,文件题名、责任者等满足文件检索需要的字段。二是存毁、开放、扫描等数字化加工阶段利用的字段。三是数据录入、校对、鉴定、审查等标明责任的字段。
3.数据质量是数据库的生命。建立在计算机环境下,以上网公开利用为根本目的文件级目录数据库,与纸质文件目录有本质的区别。纸质文件目录有问题只有档案馆内部少数人知道,利用者并不清楚。但是,文件级目录数据库进入网络,特别是向社会公开的部分,对数据库的质量要求是相当高的,数据质量也是当前制约许多数据上网利用的瓶颈之一。
(三)适时建立专题数据库
满足特殊检索需要,适时建立档案专题数据库。馆藏档案仅靠文件级目录数据库是不可能解决全部检索问题的。随着客观需要的变化,对某一专题档案有集中利用的需求是经常发生的,突击建立专题数据库,满足社会需求,是档案馆与时俱进的突破口,也是充分发挥档案作用的最佳时机。主要把握三个方面:一是根据馆藏档案内容确定专题数据库的总体布局。二是按需求分期建立专题数据库。三是根据文件内容和检索需要分别设立不同的专题数据库结构。
(四)优选建立全文数据库
满足信息检索的需要,建立档案全文数据库。按照国家档案局提出的重点的、利用频繁的档案首先实现全文数字化的要求,按照“二八”定律,即以20%的努力达到80%的效果,通过多年档案利用统计数据分析,优先全文数字化档案的全宗、年代。在网络中、在文件级目录的基础上同步进行档案存毁、开放、数字化鉴定与筛选,进而形成与文件级目录一一对应的全文数据库,并确保数字化档案的真实、准确。
(五)档案数据库的管理
为了档案数字化与利用同步和数据安全管理的需要,档案数据库分在建数据库和成果数据库两大类。
1.在建数据库的设立。在建数据库是为了数字化加工所设立的动态库,是数据不断变化的数据库。例如,设立文件级目录数据录入库,它是每个录入人员都分配给操作权限的动态库,属于在建数据库。而完成的文件级目录数据库则是成果库。但是,在鉴定及全文数字化加工过程中它又成为全文数字化加工在建数据库。
2.成果数据库的使用。成果数据库只分配使用权限,只有特殊需要时经批准才分配数据改变的操作权限。
3.数据的管理与监督
建立技术负责人、超级管理员、数据管理员连锁责任制,实行审批者没有数据操作权,超级管理员只允许分配权限不允许使用数据操作权,数据管理员只有需要时经批准使用数据操作权,用后即刻收回。给予单位领导和相关中层干部全部数据的查看权,每天24小时可以时时对数据质量进行监督,形成数据管理监督新机制。
(六)数字化档案利用服务工程
数字化档案利用服务工程是以搞活数字化档案利用的目的,以局域网、政务网、互联网为平台,通过建立数据安全管理制度、网络安全运行制度和具有法律责任的网管、数据管理员、数字化加工人员、提供利用人员连锁责任制,环环相扣,从措施上保证数字化档案的准确。通过防火墙、CA认证、数字水印、电子签章、权限控制等计算机新技术,从技术上保证数据的安全,利用网络实现档案的法律效力,实现远程为利用者提供快捷、准确数字化档案的目标。
1.在局域网上应用
在局域网内,档案在建和成果数据库所有接待人员都有检索权限,对只进行目录数字化的档案实行现用现扫描全文的方法使之达到已全文数字化的档案一样效果,利用网络技术实现数字化档案利用替代档案原件利用、计算机打印件替代复印机复印件、电子签章替代手工盖章、接待人员和利用者不接触档案原件的目标。从而起到了运用数字档案高效利用、保护原件的作用。并积累了利用者凭加盖电子签章的数字档案打印件办理社会保险的成功案例,其数字化档案的法律效力得到认可,为档案馆参与电子政务开辟了新途径。
2.在互联网上应用
利用档案网站,通过CA证书等安全手段,不但实现了领导远程数据上传的审批,主要是开展开放档案远程查询、下载、打印。特别是把CA证书发给立档单位或使用单位档案室,为CA用户远程提供档案证明和数字化档案法律效力的体现,减少异地现场查询的不便,使档案馆参与电子政务成为现实。
五、加强档案数字化工作的行政管理
档案数字化涉及档案馆内部许多部门,加强组织管理工作显得十分重要,“三分技术七分管理”同样适合档案数字化与利用服务工程。各个档案馆涉及档案数字化加工和利用的内部组织机构设置不尽相同,但应按照效率优先的原则,在计算机环境下,把数据录入、鉴定、数字化加工、整理、数字化档案利用形成一个流水线,打破内部行政分工界限是发展趋势。无论是采取那种组织形式,优化人员组合重新分工在所难免,各个档案馆在组织实施方面有所不同是必然的。
1.加强计划管理
档案数字化建设是一项复杂的系统工程, 针对实际的调研和论证,运用科学方法预测,制定科学配置各种资源进行档案数字化的总体规划和年度专项计划,通过计划谋求管理系统的外部环境、内部条件、决策目标三者在动态上的平衡,实现管理决策所制定的各项目标。
2.强化组织实施
实施是一个复杂的活动过程,档案数字化建设又是一项全新的工作,技术含量高,涉及到许多因素,在实施过程中会出现各种各样的矛盾和困难,会遇到来自各方面的干扰,实施特别强调解决问题的及时性。通过创新行政管理与技术管理相互作用的新机制,实施有效的组织、指挥、协调、激励工作,保证档案数字化的计划目标的顺利实现。
3.增强管理的技术含量
档案数字化的建设过程贵在控制,重在管理。利用计算机进行档案数字化,任何一个逻辑错误,都会给数据的管理和使用带来麻烦或隐患。在互联网上公开不真实、不准确的档案,将在世界范围内产生不良影响。特别是在网络环境下的流水作业,上一道工序一定要为下一道工序负责,各道工序工作量的对等与匹配同样重要,这必然要求行政、技术、质量管理的网络化。实践证明,建立数字化进度数据库、数字化质量反馈库、档案利用登记数据库,给局馆领导和相关人员分配使用权限,通过技术手段将全面质量管理思想引入档案数字化建设,实现全程管理、适时控制,达到强化数字化档案质量保证体系的目的。
档案数字化与利用服务工程是一项长期的任务,需要从理论上解决的问题很多,需要在实践中探索的问题也不少,我们将继续深化研究与实践。
档案数字化加工服务
提供纸质档案数字化加工服务
所谓数字化(digitization)是指用计算机技术将模拟信号转换为数字信号的处理过程。纸质档案数字化就是采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。纸质档案数字化的基本原则是使档案信息资源能准确、方便、快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会或行业对档案利用的需求。
1、档案数字化加工的基本原则
1) 确定数字化对象应当对所要进行数字化的对象按照一定的原则和方法进行确认,只有符合一定要求的纸质档案文献才能进行数字化加工。
2)符合国家法律法规纸质档案的数字化,必须符合国家档案开放规定或本行业相关规定。
3)价值性原则属于归档范围且应永久或长期保存的、社会利用价值高的档案可列入数字化加工的范围。
2、数字化加工流程 纸质档案数字化加工的基本环节主要包括:档案整理、档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份、成果管理等。
3、数字化建设的目标
数字化建设的目标是使档案馆(室)现有的档案文件资料全部实现数字化处理,建立健全档案目录数据库、现行文件全文数据库和多媒体数据库(照片、音频、视频等),通过数据接口和政务办公系统连通,用先进的数字化档案管理系统提供安全、高效的管理和利用,实现真正的资源共享。
4、数字化的意义
1)提高工作效率,降低档案利用成本
数字化加工项目完成后,社会公众(开放档案)和单位的各级领导、各部门或下属单位都能通过数字化档案管理系统即时查询利用所需要的电子文档数据原文(件)信息,避免了传统档案利用方法对档案资料实体的多次辗转所造成的大量时间浪费和重复劳动现象,从而提高工作效率,降低档案信息利用的成本。
2)最大限度保管和保护库存档案实体安全
由于传统的档案保存方式一直采用纸张保存和目录管理,不仅占用了大量的库存空间,而且利用仍需到库房,管理成本高,档案易受损,如纸张发黄、发粘、发脆等。因此目录级档案管理并不能从根本上解决档案原件易损坏等问题。实现档案数字化管理可以通过权限控制直接在网上查阅打印,减少了对库存档案的调阅次数和复印次数,降低了库存档案的老化速度,解决了档案反复借阅利用和档案保管的矛盾,从而可以最大限度地对库存档案进行有效的保管和保护,确保档案实体安全。
3)阳光政务 提升形象
库存档案实现数字化、电子化管理,既是各级档案管理部门贯彻科学发展观,实施国家档案事业“十一五”规划的大事,又是促进档案管理信息化、现代化的具体举措;
既是实际工作的需要,也是亮点工程。是一项利国利民具有重要意义的事情。数字化项目完成后,不仅档案管理和利用手段实现了现代化,档案利用效率大大提高,档案发挥的作用显著,还可以大大提升单位形象,符合政府和企事业单位各项工作科学化、规范化、网络化、信息化的整体发展要求。
广州依贝盛软件科技有限公司纸质档案数字化加工中心,拥有先进的扫描加工设备和专业的扫描队伍,面向全国用户单位提供专业文档影像解决方案和快速高效的加工服务。依靠在档案资源数字化建设方面的独特优势,以及在文档数字化扫描方面积累的丰富的经验,对于文档资料的整理、扫描和提供利用等扫描加工的各个环节,均能够提供给用户优质与专业的方案和服务。
加工中心将遵照国家相关的数字化加工标准,按照用户的需求,提供对纸质文件资料的数据录入、扫描、条目挂接、压缩、光盘刻录、生成查询与浏览系统等业务。
5、服务范围
广州依贝盛科技档案数字化工程事业部严格遵守数字化行业标准和保密规定,开展政府公文档案、国土档案、城建房地产档案、医药卫生档案、银行金融档案、企事人事档案、声像档案等整理、扫描和数字化加工,涵盖纸质档案、照片档案、缩微胶片、多媒体声像档案等形式,为各级各类政府机关、档案馆、城建、学校、医院、法院、金融、保险、物流等单位提供高品质的档案数字化服务。
6、档案数字化工程示意图
浅论房地产权属档案的数字化管理——德阳市房地产管理处
浅论房地产权属档案的数字化管理
德阳市房地产管理处
房地产权属档案是城市房地产行政管理部门在房地产权属登记、调查、测绘、权属转移、变更等房地产权属管理工作中直接形成的有保存价值的文字、图表、声像等不同形式的历史记录,是城市房地产权属登记管理工作的真实记录和重要依据,是城市建设档案的组成部分。
随着科学技术的发展,以计算机技术为核心的现代信息处理技术正在深入到房地产档案管理之中,档案管理以手工管理为主的传统手段正在发生变化,逐渐向采用现代先进技术手段过渡。通过网络为支撑的计算机技术,极大地促进了房地产档案管理模式的重大改变,实现了房地产档案信息收集、整理、查询、利用管理的现代化。档案数字化,其手段就是对档案实现全文存储,它在档案信息管理系统中采用目录进行管理,把全文信息、图像信息及其例览功能集成于目录数据中进行管理,以目录数据为检索人口,从而实现档案图文信息的全文检索,具有查询速度快、保存期限长、内容全面完整,档案利用不受时间、地点限制的优点
数字化房地产权属档案的建立是对登记发证所产生的产权产籍信息库的重要完善,登记发证所产生的信息只是数字化权属档案库的检索条目,即电子目录,通过该检索条目,可以不接触档案而查阅各种原始资料,全面了解房屋的产权状况。
一、建立数字化权属档案的条件已成熟
目前,国内几乎所有城市的房管部门都已采用计算机系统进行登记发证,并采用局域网、数据库技术对登记信息进行管理,但真正全面实现了权属档案数字化的地方并不多,其原因除实现权属档案数字化还没有一套完整的标准和规范外,很重要的一点在于受当时技术条件的限制,例如没有成熟的大容量存储技术、高速扫描技术、模糊识别技术等。随着科学技术的日益发展和计算机应用的普及,实现房地产档案管理现代化的条件已逐步成熟。换成以磁盘、光盘或磁带为载体的档案,首先要进行数字化处理,扫描和数字照相是最常用的技术。高速扫描技术能够实现每分钟上千页的双面扫描,是以前每分钟只能扫描几页的单面扫描技术无法比拟的。数码相机虽也可以实现档案快速成像,但对操作人员的技术要求较高,且不易实现程序控制。因此,高速扫描仪的出现,为档案数字化提供了最现实的手段。
图像处理技术,要保证数字化档案图像清晰、又不能占用过多的存储空间,以提高在网络应用中的传输效率,必须对扫描图像进行分析,在不影响效果的前提下自动采用更高效的存储、压缩格式,还要实现对图像的自动识别分类,提高建库效率;
对要求全文存储。全文检索的档案资料,在扫描建库时,还需用到汉字识别技术。
数字化档案必须有大容量、高效率的存储介质,以前,由于技术的限制,硬盘存储容量小、成本高,因而普遍采用容量大、成本低的光盘库作为介质。近年来,硬盘技术飞速发展,容量、可靠性均大幅提高,而成本却下降了许多。目前,专用存储克服了光盘库检索速度慢、机械故障高的缺点。
另外,通过十多年的信息化建设,各地房管部门都培养了一批信息技术方面的专业人才,工作人员的计算机使用技能也大幅提高,各级领导也对本单位信息化建设前所未有地重视,把它作为提高管理服务水平和效率的重要手段,投入了大量人力、物力进行建设。
二、房地产数字化权属档案的内容
房地产权属档案数字化是指将传统的以纸张、录音带、录像带为存储介质的各种原始档案资料,通过扫描(数码摄像)、压缩、转化等手段转换成图片文件、声音文件和录像文件,再运用分级存储管理技术将图片、声音、录像等文件和索引字段存储于磁盘、光盘、磁带等大容量的存储介质上,并可通过各种方便的查询手段迅速地检索出所需要的档案资料,可以发布到局域网、广域网、企业内部网、国际互联网,最终实现“数字化档案馆”。
数字化房地产权属档案管理应包括以下内容:
1、目录管理
目录管理是指房地产权属档案管理机构对归档的房地产权属文件材料进行分类编目,划分密级,编制检索工具的工作。由于采用计算机进行登记发证,各地房地产权属档案的目录管理已基本实现了从簿式目录、卡片式目录向电子目录的转变,产权登记中的房屋所有权人、丘(地)号、房屋坐落(街道名称、幢号、房号)、房屋平面图号,他项权登记中的权利人,公、检、法查封登记中的被执行人、查封冻结标的地址,合同备案登记的合同号、买受人、房屋坐落等条目均可自动生成电子目录,作为查询检索条件,只要定义好电子目录与图象库的数据库记录的连接条件,即可根据要求检索到要求的资料。数字化档案对目录管理有特殊的要求:
首先,要提供强大的系统编目功能,工作人员可以根据应用需要生成档案目录表,查询某一件(宗)产权登记的资料,或查询某一种类型档案资料,通过编目,可以简单快速查阅。其次,要便于系统权限的设置,在数字化档案系统中,电子目录是检索查阅档案资料的唯一人口,根据服务对象的类型,电子目录应能判断是否允许用户进入。另外,还要便于档案统计,档案统计是对所有档案的不同类别的详细情况做出报表。所有这些都有利于档案管理人员对档案管理做出及时有效的决策。
2、档案数字化
档案数字化过程即指房地产权属档案的收集、整理和归档。根据《城市房地产权属档案管理办法》,属于建档范围内的文件材料主要有三类:第一类是房地产权利人、房地产权属登记确权、房地产权属转移及变更、设定他项权利等有关的证明和文件;
第二类是房屋及其所占用的土地使用权权属界定位置图:房地产分幅平面图、分丘平面图、分层分户平面图等;
第三类是房地产产权登记工作中形成的各种文件材料,包括房产登记申请书、收件收据存根。权属变更登记表、房地产状况登记表、房地产勘测调查表、墙界表、房屋面积计算表、房地产登记审批表、房屋灭籍申请表。房地产税费收据存根等。这些文件材料页面大小、纸张厚薄、纸质均木一致,扫描建档中应有人工辅助过程,辅助工作融合到实物档案的人工整理归档的过程中;
对于超大页面,可以采用工程扫描仪扫描,或低成本的数字照相方式;
分幅平面图、分丘平面图、分层分户平面图已实现计算机制图的,可以直接转换为位图格式存储。如直接存储矢量图,查阅时还需要安装专门的工具软件,不利于档案的方便利用,并且归档后的资料已不能修改,保留矢量图已无必要。档案扫描过程与目录管理实现无缝连接,省去为文件取名、建立对应关系等多余步骤,提高建档效率。提高建档效率在档案数量庞大的房地产权属档案管理部门具有特别重大的意义,即使每页的扫描建档时间只节约几秒,最终对整个工作进度的影响可能是几个月,甚至上年。扫描图像的存储有两种方式:文件方式和数据库方式,文件方式虽然简单易于实现,但在检索效率和安全性方面都得不到保障,只适合于速度、安全性要求不高的小型档案库。即使采用数据库方式,当档案数量大时,如几十万卷档案的记录数就有几百万,方案设计时应注意选择高性能、大容量的存储系统。
3、档案管理网络化
网络化(包括局域网和互联网)应用是房地产权属档案的利用的主要形式,只有实现档案管理网络化,才能真正体现档案数字化的各种优势,及时为房地产权属登记、房地产交易、房地产纠纷仲裁、物业管理、房屋拆迁、住房制度改革、城市规划、城市建设等各项工作提供服务。实现档案管理网络化解决了以前利用档案的种种不便,可以使档案利用不受时间和空间的限制,多人同时查询档案,不发生冲突。这些功能的实现,让使用单位提高工作效率,提高档案信息的共享程度,优化社会资源的配置。
三、数字化房地产权属档案管理的原则
数字化档案作为档案的一种基本形式既有档案的基本特征,具有普通档案不具备的特点,如信息的非人工识别性、对系统设备的依赖性、信息与载体的可分离性、信息的易改性等,因此,数字化档案的管理有其特殊原则。
l、全程管理是数字化权属档案管理的基础
全程管理是指必须建立一个完整的管理体系,对数字化房地产权属档案从产生到永久保存或销毁的整个生命周期进行全程管理,这是基于信息技术而建立的数字化档案管理理念,包括档案管理的规则、方法、质量要求,以及档案从收集、整理、归档、利用各阶段活动统筹兼顾,以实现整个系统(软、硬件及信息)资源的最大共享和最大效益。
2、真实性、完整性是数字化权属档案的根本
真实性是指数字化档案的内容、结构在经过建立、利用后保持不变,与原始状态一样,完整性要求记录房地产权属登记活动的档案内容要件齐全,内容。结构及背景信息没有缺损。真实性、完整性既是一种观念,又是这种观念通过技术手段在管理中的体现,需要分别制定真实性、完整性的标准。
3、可读性是数字化权属档案存在的意义
可读性指档案经过存储、传统、压缩。加密等处理后仍然能够以可识读、可理解的方式输出,并保持真实性。如不能保证档案的准确检索查阅利用,数字化档案也就失去了存在的价值。保障档案的可读性措施应贯穿于全部管理工作的始终,要统一数字档案的存储格式、软件环境,准确保存加密文件的加密、解密方式。
4、安全性是实施数字化权属档案的保障
安全性指的是系统硬件和软件免受自然灾害和人为破坏的能力,也指防止房地产权属档案的散失、泄密。安全性保障应从制度着眼,技术手段着手,健全安全保密制度,合理设置用户权限,坚持定期数据备份。
四、对房产管理部门建立数字化权属档案的建议
权属档案的数字化管理是房地产管理现代化的重要组成,当前正处于起步阶段,针对有关实际情况提出几点建议:
l、房地产权属档案的数字化应当建立统一标准。国家档案局已就电子文件档案制定了标准,为全国性电子文件管理提供了普通规范。房地产权属档案的特性决定了其管理的独特性,当前已经建立了权属数字化档案的地方由于各种原因,没有统一的规范和标准,有的在建设过程中还走了不少弯路,使用效果也不甚理想,因此,当务之急是建立一套适合于房地产管理的数字化档案标准,规范和指导各地的权属档案现代化工作。
2、房地产权属档案数字化管理是一项系统工程,它不可能一蹴而就,必须在总体规划的指导下,分阶段有步骤地实施。数字化过程必须充分考虑到房地产档案管理部门历史上形成的数量庞大的存量档案,以及每年数量急增的新增档案,分别规划设计合理的建档流程。对存量档案,可以考虑将利用率高、当前有效的权属登记资料先行建档,以保证数字化档案库能在较短的时间内产生利用价值;
新增档案的数字化过程最关键的是不能影响日常正常的登记发证工作,建档工作可安排在发证后,实物归档前进行。
3、培养一批既懂房地产业务,又精通数字化档案管理的人才。数字化档案管理是一项跨学科、实践性较强的工作,这种复合性人才是当前档案管理中迫切需要的,培养这种人才应当引起重视。
第3篇:档案数字化建设方案
档案数字化建设方案
档案工作的数字化建设是顺应潮流,适应时代发展的新举措、新要求,档案做为原生的信息资源,其重要性正日益凸显出来,逐步掌握信息技术为档案工作服务,为社会主义经济建设服务,为社会主义精神建设服务。
档案数字化是数字档案建设最基础的工作,传统载体的档案经高科技技术加工成数字档案形式,通过局域网、政务网、互联网进行计算检索、阅读电子档案,为迎接档案信息服务新环境的挑战、提高管理水平、提高效率、增强档案部门的服务水平、为档案内部管理及面向客户服务提供高效率的全面服务。
完整的档案数字化建设流程包括案卷交接、档案整理、目录著录、档案扫描、图像处理、OCR文字识别、数字校对、数字质检、数据挂接、整理还原、案卷入库等环节。
业务流程
纸质档案数字化标准:DA/T31-2005《纸质档案数字化技术规范》 DA/T18-1999《档案著录规则》 1.制订批次计划
为在数字化处理过程中对纸质档案进行有效管理以及对数字化处理进行有效控制,需对馆藏档案的数字化处理分批次进行。
2.档案出库交接
根据档案数字化加工批次计划进行出库,对出库的档案进行完整性检查。
对通过完整性检查的档案,进行数量确认,并详细登记《资料出库单》。
确保资料的交接过程中的数量正确性,完整性;
3.目录著作
按照文件数据库目录结构与目录著录要求以及《档案著录规则》(DA/T18)等标准,规范需要目录补录的档案目录内容,包括确定档案目录的著录项、字段长度和内容要求等,规范案卷题名、文件名、责任者、起止页号和页数等。
4.档案整理
对出库待加工的档案进行扫描前处理,使之成为能够进行扫描的形态。
拆除装订
影响扫描工作进行的档案,应拆除装订物。
资料及档案内的成册资料严禁拆除。
区分扫描件和非扫描件
区分同一案卷(卷、件)中的扫描件和非扫描件。
页面修整
对破损严重、无法直接进行扫描的档案,先期进行技术修复,折皱不平影响扫描质量的原件进行相应技术处理(压平和烫平等)后再进行扫描。确保较薄纸张(如信纸、便笺纸)、破损纸张、底灰较深(如草浆纸、油印纸)、字迹较浅(如铅笔字迹)等纸张的状况较较差的档案扫描图像清晰。
档案整理登记
详细记录档案整理后每份文件的起止页号和页数等情况。
装订
扫描完成后,档案按原档案保管单位要求进行重新装订,保持每页档案原有的排列顺序不变、案卷不掉页、右边和底边整齐。
5.档案扫描
黑白扫描采用(300dpi)TIFF格式,彩色扫描采用(300dpi)JPG格式。
照片以原色彩为准(600dpi)TIFF格式扫描。
保证扫描图像效果原原件吻合。
大幅面档案采用大幅面工程扫描仪或小幅面扫描后进行图像拼接处理。
需要进行OCR文字识别的档案,扫描分辨率≥300dpi。
对资料等成册材料不宜拆卷的,采用不拆卷扫描仪扫描。
核对每件文件的扫描页码、页数与实际的文件页码、页数是否一致。
图片命名时一定要正确,不能出现图片颠倒、错乱等现象。
扫描时保证档案原件不被损坏。
6.图像处理 纠偏
偏斜的图像进行纠偏处理,倾斜不超过3度,方向不正确的图像进行旋转还原,以符合阅读习惯。
去污
图像页面中影响图像质量的杂质如黑点、黑线、黑框、黑边等进行去污处理。
图像拼接
大幅面档案进行分区扫描形成的多幅图像进行拼接处理,合并为一个完整图像,以保证档案数字化图像的完整性。
栽边处理
去除多余的白边,缩小图像文件的容量,节省存储空间。
深浅度调整
图像深浅度不一致时进行修复,保证图像的深浅度一致。
7.OCR识别
运用先进的OCR识别软件,对扫描的图像进行文字识别
8.图像存储
采用TIFF、JPG格式存储,存储时选择的压缩率在保证扫描的图像清晰可读的确前提下,尽量减小存储容易为准则。
供网络查询的扫描图像,存储为PDF文件格式,进行过文字识别的,形成文件文字层。
纸质档案目录数字库中的每一份文件,都有一个与之相应的唯一档号,以该档号为这份文件扫描后的图像文件名。
多页文件可采用该档号建立相应文件夹,按页码顺序对图像文件命名。
9.数据质检
关键项检验和整理数据质量抽检。
抽检工作由专为进行操作,操作结果进行记录。
数据采用全检方式,合格率要求达到95%以后确保质量。
10.数据挂接
运用批量挂接与单张挂接的方式,将目录库与图像库一一对应起来,并生成索引文件。
汇总挂接
档案数字化转换过程中形成的目录数据库与图像数据库,通过质检环节确认“合格”后,通过网络加载到数据服务器终端汇总,实现批量、快速挂接。
数据关联
以纸质档案目录数据库为依据,将每一份纸质档案文件扫描所得的一个或多个图像存储为一份图像文件,通过每一份图像文件的文件名与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系,实现档案目录数据库和图像文件的批量挂接。
11.数据自检
建立严格的质量检测体系,对加工的数据进行自检,自检必须达到《档案馆纸质档案数字化验收标准》的,才能递交进行验收。
12.数据验收 目录数据库、图像文件及数据挂接的总体质量。
数据校对员进校对过程不接触任务纸质档案,根据扫描的图像结果来进行校对。
首批数据采用全检方式
以后批次采用抽检的方式检查已完成数字化转换的所有数据,包括目录数据库、图像文件、数据挂接的总体质量。
根据《纸质档案数字化加工验收标准》进行检查。
档案实体验收必须逐卷清点,按档案数量、文件状况、卷内文件页数与顺序、装订要求等进行检查。
13.数据备份
经验收合格的完整数据及时进行备份。
同一份文件,不跨二片DVD片号
光盘表面标示光盘片编号并注明光盘目录索引信息
光盘片刻录完成后,与影像系统档案进行比对一次,确保档案资料无遗漏及正确性。
14.成果管理
加强对纸质档案数字化的成果管理,确保安全、完整和长期可用。
15.档案入库
重新整理后的档案按照顺序返还,对档案的完整性进行检查。拆除过装订物的档案按原档案保管单位重新装订,保持每页档案原有的排列顺序不变。
以上就是小编为大家整理有关于档案数字化建设实施方案,档案数字化管理方案的相关内容,如果您想要了解更多信息,可持续关注我们。
推荐访问:数字化 档案 实施方案 档案数字化建设实施方案 档案数字化管理方案 档案室数字化建设方案