加载中 ...
首页 > 软件介绍 > 网站建设 正文

起点R3全文检索产品

2019-03-24 15:59:26 来源:沈阳软件公司 作者:沈阳软件开发

企业搜索系统

起点R3全文检索产品是于2008年开始研发,定位为新一代强大的,高性能的JAVA全文检索产品,从2009年开始,每年以两个大版本,10多个小版本的演化速度在不停发展,以适应各个行业对全文检索功能、性能的需求。在起点R3全文检索产品上,您可以定义各种类型的数据源,包括网站、电子邮件、内容仓库, CMS、文件系统等。起点R3全文检索产品具备高性能的分布式计算能力,能够通过简单配置实现高可用集群。通过扩展计算能力,起点R3能够支持几十T的文件信息。起点R3支持包括中英文、新老维文等超过15种语言文字的多语言检索。起点R3具备强大的内容采集能力,默认提供本地文件系统、数据库、邮件、网络文件系统、FTP、Domino、DBMS、CSV。起点R3全文检索引擎支持增量索引,支持数据库数据更新,能够通过可视化的方式对索引字段进行管理。起点R3全文检索产品基于开源项目,能够很容易的集成Hadoop和HBase。起点R3全文检索产品对二次开发也非常友好,对所有的二次开发开放了全功能的API,能够以XML或JSON格式交换数据,支持的二次开发语言包括:JSP、PHP、Java、Python、C#等等。
  起点R3全文检索产品从 2009年开始同时以开源项目的形式发布在SourceForge上,您可以下载起点R3开源版本的全部源代码。起点R3开源版本在国内外下载次数已超过10000次数,国内用户占80%,美国用户占5%,欧洲用户占8%,其他占2%,起点R3全文检索产品得到了全球用户的共同关注和参与,经过多年的维护和发展,起点R3在国内开源领域已全面领先。


面向客户: 大型企业搜索用户;大中型门户网站、电子商务网站客户,系统集成商、档案管理、知识库、协同办公平台及其生产厂商;图书馆、金融、通信、专利行业等大数据量客户;
应用领域: 网站、网站群的站内搜索;企业应用系统及企业门户的数据集成;企业内部ERP、MIS系统的数据整合;档案、图书馆、专利平台的数据检索;在金融、通信、公安行业的大数据量下的相关应用。

功能特点

1.多操作系统、多平台支持
起点R3支持的操作系统、应用服务器、数据库如下:操作系统 Windows NT / 2000 Server/2003 Server;Linux 2.0及以上;Sun Solaris2.3及以上、IBM AIX4.2及以上、HP-UX 10.10及以上、Compaq True64 UNIX 3.2、SGI IRIX6.3及以上应用服务器 支持IIS 5.0以上、Tomcat、WebSphere、WebLogical等其它必备环境 JDK1.6 以上版本2.支持多数据源检索,结构化和非结构化数据统一管理、检索起点R3全文检索产品能够检索数据库全文检索、文件系统内容全文检索支持包括TEXT、HTML、RTF、MS OFFICE、PDF、图片、OpenOffice、XML等多种格式文件的存储、索引和检索支持图像、文字、音频、视频等多媒体数据的关联管理与统一检索支持多种结构化数据类型的管理:日期类型、数字类型、字符类型、货币类型、经纬度数据等可以通过指定文件所在目录进行导航式检索,支持50多种文件类型。根据用户需要产品也支持从其它各类专有数据源获取要检索的数据内容,例如:ECM系统、其它数据池等等。起点R3也支持多个数据库的跨库检索。3.多语种、多编码管理支持中英文、新老维文、回文等语言文字的混合检索。系统内核支持UTF-8/GBK/GB2312/GB18030/BIG5/JP等十多种编码格式。 4.智能化的检索服务起点R3全文检索产品在全文检索过程中采用相关智能技术以达到迅速、准确、全面定位目标信息。例如采用相关度分析技术,使相关度较高的结果排在结果列表的前面,相关度较低的结果排在后面,并屏蔽无用和错误的信息;构造强大的语义规则库,使系统能够正确地判断与检索词相关的同义词、近似词、上位词、下位词,帮助用户判断结果的相关度,并进行进一步的查询;支持完善的信息分类体系,对检索结果自动分类或者信息聚类;提供智能化的概念扩展查询等。通过这些技术,能够满足大多数智能化搜索需求。5.海量数据高效处理起点R3全文检索产品不仅提供了快速检索功能(在千万级数据下,全文检索能在1秒钟之内完成),同时也有着高效的海量数据处理能力。每小时能处理百万的数据库数据,或是几十万篇的文档。包括中文的分词和建立数据索引,起点R3开源版本在国外一些研究机构项目中的最高数据量到达 25亿条,存储内容超过20T。6.中文分词技术中文分词是搜索引擎必须具备的技术之一,应用中文分词技术才能使搜索结果更加符合用户习惯,更加接近用户的期望结果,起点R3全文检索产品集成了中文分词技术,并有着120万词库的支持,用户也可以根据自己的需要和行业特色来添加和维护词库。中文分词技术的准确率和召回率都达到96%以上。 7.强大、灵活的安全控制策略提供系统级、数据库级、记录级以及字段级四级安全控制策略,控制粒度能够以可视化方式配置。提供数据文件内容加密、索引加密、库结构文件加密等安全机制。支持通信传输加密,实现128位SSL的安全访问加密控制。与第三方安全系统集成,支持Windows AD、Domino、LDAP以及其他第三方用户管理和权限系统集成。 8.搜索结果多样化展现方式无论是数据来源于数据库中,或者是各类文件,对于搜索的展示结果,用户可以通过接口或外包中科融研开发进行个性化、多样化的展现,也可以类似数据库那样,对于数据字段进行自由调用查询和展现。10.支持多种语言开发接口,与业务系统无缝集成起点R3全文检索产品以REST方式提供多种语言开发接口,支持的语言包括.NET,JAVA,PHP等。可与各类WEB应用进行无缝集成。同时提供完善的二次开发API手册帮助及应用示例。11.提供丰富检索语法结合搜索业务的需要,起点R3全文检索产品提供丰富的检索语法支持,包括多字段组合查询、多字段组合排序、支持模糊匹配查询、支持大于,等于,小于,不等于操作符、支持*?等模式匹配,支持位置运算符,字符串的先后顺序、字符的后方截词、中间截词等等。也可以根据用户需要定制开发特殊检索规则。 12.分布式系统支持当信息数量超过一台计算机的负载能力,而无法达到要求的查询效率,或是系统需要承受更大的访问压力时,分布式系系统无疑是最好的解决方案。通过分布式系统的支持,系统的数据负载能力可以从几千万提高到几十亿,甚至更多。13.操作简易、维护方便

“沈阳软件公司”的新闻页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与

我们联系删除或处理,客服QQ:55506560,稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同

其观点或证实其内容的真实性。