• 软件测试技术
  • 软件测试博客
  • 软件测试视频
  • 开源软件测试技术
  • 软件测试论坛
  • 软件测试沙龙
  • 软件测试资料下载
  • 软件测试杂志
  • 软件测试人才招聘
    暂时没有公告

字号: | 推荐给好友 上一篇 | 下一篇

清华同方知网 全文数据库管理系统解决方案

发布: 2007-6-09 20:13 | 作者: seanhe | 来源: | 查看: 97次 | 进入软件测试论坛讨论

领测软件测试网 全文数据库管理系统是清华同方知网(北京)技术有限公司完全自主开发的,以管理海量非结构化数据对象为主,具备智能信息处理能力的国产文档数据库系统,包含全文检索和智能信息
处理两个模块。KBase全文检索速度已处于国际领先水平,基于海量语料库的自动分类、自动标引、自动摘要功能已经实现实用化。

体系结构

技术特点

支持主流操作系统 全文数据库管理系统支持Windows、主流LinuxUNIX平台。

海量非结构化数据对象管理 全文数据库管理系统全文检索的查全率和查准率居于国际领先水平,单表管理的记录数能达到4GB,单表能管理的数据容量达到TB级,分区表的容量达到PB级。目前KBase已成功应用于数据量高达2TB的中国期刊网。

大规模并发处理能力 全文数据库管理系统支持多服务器群集,通过虚表的方式集成其它KBase数据库的表,实现分布式计算,提供了大规模并发处理的能力。

高效的全文检索能力 全文数据库管理系统全文检索速度高达500G/S,百万级的文献量相似检索速度达到毫秒级,支持实时信息排重。KBase系统的查准率、查全率在同类产品中处于领先地位。

易用的检索语言 全文数据库管理系统提供了一种类似SQL的查询语言——KSQL。

完整的应用开发接口 提供.Net组件、COM组件、Java组件、ODBC、ADO、等数据库访问接口,并且针对有较高底层开发要求的用户提供完整的二次开发接口,提供Z39.50、OAI等透明网关接口。

支持多种编码 全文数据库管理系统提供对 GB2312、BIG5、GBK、GK18030、UNICODE的直接支持。

强大的智能信息处理能力 KBase集成了文本挖掘引擎、NLP自然语言处理引擎和概念关系词典,包含自动分类器、自动聚类器、关键词自动标引器、内容相似性分析器、自动文摘器、信息过滤器、特征词分布规律分析器、通用关联规则分析器等组件。

性能指标

KBase各项性能指标已经达到了国际先进水平:

  • 全文检索速度: 500GB /秒

  • 相似检索速度: 100万文献量/20毫秒

  • 单表支持最大记录个数:40亿

  • 单表支持最大容量:8 TB(分区表最大容量 2PB)

  • 可同时跨库检索最大数:255个

  • 拥有400万数量级的概念关系词典

  • 延伸阅读

    文章来源于领测软件测试网 https://www.ltesting.net/


    关于领测软件测试网 | 领测软件测试网合作伙伴 | 广告服务 | 投稿指南 | 联系我们 | 网站地图 | 友情链接
    版权所有(C) 2003-2010 TestAge(领测软件测试网)|领测国际科技(北京)有限公司|软件测试工程师培训网 All Rights Reserved
    北京市海淀区中关村南大街9号北京理工科技大厦1402室 京ICP备10010545号-5
    技术支持和业务联系:info@testage.com.cn 电话:010-51297073

    软件测试 | 领测国际ISTQBISTQB官网TMMiTMMi认证国际软件测试工程师认证领测软件测试网