科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网网络频道不需要索引的检索系统

不需要索引的检索系统

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

针对图书情报以及各个政府机构、企事业单位文献信息中心信息资源的检索,日本富士通公司特提出基于瞬索的文献信息系统检索系统解决方案。

作者:转载自《每周电脑报》 2005年10月9日

关键字: 富士通 瞬索 搜索引擎

  • 评论
  • 分享微博
  • 分享邮件
日本富士通公司以瞬索(XML 数据搜索引擎)为代表的瞬索系列软件已发展成为全面基于Internet 的包括数据转换、数据加工整理、数据维护、信息发布与检索在内的全线产品。针对图书情报以及各个政府机构、企事业单位文献信息中心信息资源的检索,日本富士通公司特提出基于瞬索(XML 数据搜索引擎)的文献信息系统检索系统解决方案。

方案简介
Interstage Shunsaku Data Manager,中文名称为“瞬索XML 数据搜索引擎” (以下简称瞬索),具有高速数据检索、跨越多个数据源的集成检索、便捷的全文检索、对于非结构化数据的检索及不需要索引(no index)等特点。

如果原有系统的RDB数据库中存在大量的文献数据,对这些文献数据的检索,会出现检索速度慢,检索结果不全等问题。现在我们利用瞬索替换原有文献系统的查询部分,通过把瞬索与现存系统结合使用的方式,提高了响应性能,实现了查询的高速化,从而避免了由于响应的恶化给业务处理带来的不良影响。

系统构建
本方案在原有系统的基础上,以瞬索为基础的查询系统代替原有基于RDB 的查询系统,RDB中的数据通过转化,转化成为XML 数据存入瞬索中。

瞬索的系统构筑采用了把所有的数据从头开始以一定的速度按顺序进行读入的简单的“全文检索方式”,一般来说,不设定索引的话,全文查询的查询速度会比较低。但是, 瞬索由于采用了 “SIGMA 技术”,“高速多载运行技术”,以及“刀片服务器技术”,即使是在查询条件复杂或访问集中情况下,也能保证稳定的查询性能。

技术应用
SIGMA技术 瞬索使用的SIGMA 查询技术,不论是在只有一个查询条件时,还是在使用复杂查询条件时,都能实现稳定的查询性能。无论查询关键词有多少个,都能通过SIGMA 技术把这些关键词合成起来生成a u t o m a t o n ,这个 automaton 对查询对象数据依次进行匹配,并读入符合查询条件的数据。在使用这种技术的查询系统上,对含有100 多个数据项的合成查询条件进行多方面的查询时,所需要的时间是使人惊叹不已的“1 秒钟之内”!

刀片服务器的有效利用技术 刀片服务器的有效利用技术是指在查询处理时,数据自动地分散到多个刀片服务器上同时进行并列处理。瞬索通过使用SIGMA 技术和高速多载运行技术,可以在各种情况下保证稳定的查询性能,只要将数据分散到各个CPU(刀片服务器)上,通过这些 CPU(刀片服务器)的同时运作,就可以实现全CPU 的同时查询处理。这样,利用刀片服务器技术,只要根据查询数据量和查询时间的要求,简单地增设CPU(刀片服务器),就能使性能得到保证。

现有资源的XML 化 瞬索提供把 CSV 形式的数据,或是储存在RDB 中的数据转换成XML型数据输入文件的标准工具。数据变换应用程序用FTP、JDBC 等调出需变换的数据,再调出提供XML 型数据变换工具的API,然后利用变换工具把数据输出为XML 数据(文件) 。这样一来,企业现有资产的CSV 形式数据和储存在R D B 中的数据就可以通过 Shunsaku 得到有效的利用。

(责任编辑:张竺)

    • 评论
    • 分享微博
    • 分享邮件
          邮件订阅

          如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

          重磅专题
          往期文章
          最新文章