XML数据交换技术 数据挖掘工具
XML是一种结构化置标语言,针对文档的语义信息进行结构化的标注。具有规范的结构、强大的数据描述能力与易扩展性。
跨平台应用
支持多种操作系统平台,经过严格测试。 数据挖掘研究院
主要功能
数据挖掘研究院
智能采集
数据挖掘论坛
概述 数据挖掘论坛
自动、定时地采集互联网信息内容,并对信息进行收集、整理、归类、存储,统一管理获取的信息,把互联网上的海量信息数据转化为可利用的本地信息。 数据挖掘交友
功能 数据挖掘实验室
1.模板制作器基于网页源文件(HTML代码和RSS)进行内容获取。
2.管理配置对站点频道集中分组管理,设定优先级以及多服务器管理。 数据挖掘交友
3.分布式采集服务部署于多台服务器上,支持新闻、论坛、博客的信息采集。 数据挖掘交友
应用 数据挖掘实验室
网络舆情收集整理,网络新闻采编,建立企业情报信息库,政府行业网站采集,社会化垂直搜索网站数据源。 数据挖掘研究院
运行环境 数据挖掘研究院
Windows 2000及更高版本,支持多种操作系统。 数据挖掘研究院
智能检索
概述 数据挖掘工具
方正智思全文检索以传统的检索与面向海量数据的Web检索为基础,结合自然语言理解技术与数据挖掘技术的最新研究成果,快速检索海量数据,以多种检索方式准确的获取所需信息。 数据挖掘论坛
功能
1.文本自动分词,词与词间隔自动标记,自动辨识语素和单字词,合成词和短语。 数据挖掘交友
2.采用字索引与词索引相结合的方式提高查全率与查准率。
3.倒排索引记录词频率TF、文档频率DF、逆向文档频率IDF、位置等信息。 数据挖掘交友
4.采用分段逐层合并的索引组织模式,提高海量数据建索引速度。