新华社多媒体数据库搜索引擎应用案例
发表于:2007-06-09来源:作者:点击数:
标签:
新华通讯社作为国家通讯社,信息管理应用服务系统担负着采集、发布、管理各类文字及图片信息的重大任务。其采集的信息涉及政治、外交、经济、文教、科技、法律等各个领域并具有信息量大、权威、准确、及时 、丰富等特点。不仅为国内外的新闻机构和企事业单位
新华通讯社作为国家通讯社,信息管理应用服务系统担负着采集、发布、管理各类文字及图片信息的重大任务。其采集的信息涉及政治、外交、经济、文教、科技、法律等各个领域并具有信息量大、权威、准确、及时
、丰富等特点。不仅为国内外的新闻机构和企事业单位提供大量的新闻素材,同时也承担国家重大活动的新闻报道工作。
新华社多媒体clearcase/" target="_blank" >cc">数据库始建于1999年,采用TRS全文检索的核心技术,2002年,TRS公司与新华社技术局再次合作实施了新华社多媒体数据库英文检索引擎的提速改造,提速后的系统对于多媒体数据库的全文检索能够达到3~5秒左右响应。目前,多媒体数据库中已经存储了数千万条多媒体信息,数据容量接近8T,内容涵盖中、英、法、西、阿、俄等9大主流语种,以文字信息为主,包含图片、图表和音视频信息。
新华社多媒体数据库底层采用TRS和
Oracle协同工作的解决方式,由TRS完成千万级数据的索引检索服务,由Oracle 完成信息制作流程,检索方式分为本地联机检索和远程
网络检索两种方式,可进行精确检索、模糊检索、全文检索、对各检索入口项实行任意联合组配检索;可实现多级检索,逐级细化检索条件,直至命中满意的检索结果;能够对检索结果排序。提供中英文全文检索功能,中文按词进行全文检索,具有智能词库机制。对图片可按分类号、作者、拍摄时间、拍摄地点、照片文字说明等项检索,其中文字说明项可实现中文按词全文检索。支持逻辑库功能,支持跨库检索。支持文字资料和图片资料的系统链接。
新华社多媒体数据库作为新华社核心存储的地位也在不断加强,从以前分散的存储逐步向统一存储、统一管理、统一服务方向发展。在这个过程中,新建设的其他应用系统中,TRS也积极的参与了广泛的应用研究,并在很多系统中直接集成了TRS全文检索的核心功能,以保证数据的检索
性能和统一数据的要求。
|
原文转自:http://www.ltesting.net
|