公共记录办公室的北爱尔兰(PRONI)是官方档案,北爱尔兰。它的作用是保持记录的历史、社会和文化的重要性,让他们可用的信息、教育和享受公共。PRONI大大再保险吧街上目录网站,一个全新的用户界面和最新的云计算技术和ABBYY Aetopia。
挑战
其中最常用的资源的公众记录办公室是街上目录,日期从1819年到1900年。
这些都是有价值的老书包含清单的名称、地址和职业的居民北爱尔兰以及商业机构的列表操作在城市及周边城镇。他们是一个至关重要的资源,为历史和系谱的研究者和是一个非常有用的来源各种各样的研究如跟踪一个特定的人的位置或检查当一个公司在业务。系谱学家可以,例如,搜索一个地址找到谁住在很多年前。
这些卷,以前在开放存取在PRONI搜索房间,非常严重利用公共。本文在一些卷非常脆弱,因此,他们在风险。有些页面已经被丢失或损坏和进一步处理将危及他们的长期保存。因此,它是决定扫描目录,并提供一个搜索工具,这将使用户能够找到关键字的章节目录,在一个特定的目录或在任何目录。
解决方案
最近PRONI开始一个项目数字化的每一页目录(约20000),然后把它们放到网上,让世界各地的族谱研究者搜索每一个字。扫描的文档存储在云上使用Aetopia的数字资产管理系统,MediaCore,和每一个单词是数字化和定位使用最新的云OCR SDK ABBYY运行在微软Windows Azure。
“我们提供云和预置安装,所以在寻找一个基于云的OCR引擎来避免需要安装软件在多个地点,”麦格拉思说,Aetopia艾丹的首席执行官。“一个关联的ISV ABBYY技术已经使用了多年来推荐我们看ABBYY基于他们的声誉最高的质量OCR。”
除了一个更友好的和直观的用户界面新网站现在包括的面搜索”,允许用户探索目录设置通过应用各种过滤器。也可以用“搜索等价物”,允许读者等同“雅。“詹姆斯或“地理。“乔治,例如,所以,如果他们寻找一个其他的术语也被返回。个人搜索术语,描述了用户可以搜索条件的个人联合国滴答立即刷新搜索结果。
结果
云服务的OCR ABBYY简单的集成,有效,安装在与Aetopia的架构,特别是没有需要购买额外的服务器来处理OCR处理。服务上的需求,一个真正的优势当项目要求大容量处理在短期内或偶尔发生高峰负荷。除了优质的光学字符识别结果ABBYY也能,提高视觉de斜质量原始扫描,这被视为一个主要的好处PRONI。详细的OCR位置信息(提供的XML)是无价的项目,因为它允许Aetopia团队的开发人员创建一个复杂的搜索词高亮”功能的应用程序,导致街道目录从最终用户的广泛积极的反馈。
“ABBYY开发者账户很容易设置和门户提供了所有需要的文档和帮助在开始,包括一个可下载的示例代码,”麦格拉思说。“定价选择适合我们PRONI街目录这是一个批量过程和我们知道的确切数字文件需要送到ABBYY。ABBYY云已经一致赢得OCR对我们。”
街上目录在线系统完善了现有的数据库和记录是可用的电子,如阿尔斯特,在契约Freeholders记录和索引的遗嘱。在下一章PRONI持续的工作是使更多的可用资源在线。
发表于2025-07-03 14:23:44
发表于2019-06-04 11:21:00
发表于2019-06-04 10:05:00
发表于2019-06-04 09:03:00
发表于2019-06-04 08:29:00
发表于2019-06-04 06:47:00
发表于2019-06-03 22:00:00
发表于2019-06-01 13:59:00
京ICP备11027698号 CopyRight 2010-2015 All Rights Reserved