引言
近年来,随着市场竞争越来越激烈,信息对商业的影响日益增大,人们需要从大量的数据中发现有用的、前瞻性的信息或知识,数据挖掘技术即数据库中的知识发现日益重要。数
据挖掘是从大量数据中发现有效的、新奇的、潜在有用的和最终可理解的模式的过程[4]。数据挖掘方法有统计学方法,聚类,决策树,人工神经网络,关联规则,时间系列分析等等。
金融数据挖掘是数据挖掘的一个重要应用领域。它是一个富有挑战性的领域,一方面,从大量的金融数据中找到数据间的关系和规律,对于国家宏观调控,经济工作者和投资者都有特别重要的意义,另一方面,金融数据具有变化迅速,规律隐蔽,人为干扰性大,数据量大等特点,目前尚无特别有效的分析工具。
最常见的金融数据分析方法称为比率分析。所谓比率是指金融量之间的比值,如一股净收益,流动资产周转率等。由于两个公司的规模、行业的不同,直接采用金融量进行比较是不合适的。比率分析在一些预测性任务中被证明很有效,尤其是破产预测和客户信用的评价。从金融量出发,我们可以定义许多金融比率。在金融领域里,这些金融比率之间构成层次关系,用户可以选择不同层次上的比率进行分析。
聚类分析是一种重要的数据挖掘方法,它采用一定的距离准则和相似性准则对对象集合合并或分割,使得合并或分割后类内距离小、类间距离大。聚类分析的结果形成一棵聚类树,分析聚类结果,我们可以得到对象之间相近和相异的地方。本系统采用聚类分析方法分析上海和香港的股市上市公司,依据不同层次上的金融比率,可分别得到聚类的结果。综合多层次聚类分析的结果,用户可以对公司间的相似关系有较深的了解,从而帮助使用者作出正确的判断和投资行为。 数据挖掘研究院
本系统建立在Web服务器之上,采用三层体系结构,即用户层、应用层和数据库层。用户层采用网络浏览器作为用户与系统之间的桥梁,实现用户的输入、选择和计算结果的返回显示。中间层实现在网络服务器之上,系统采用Java Servelet编程。Java Servelet是服务器端的一种Java编程技术。用户通过Http协议从浏览器端向服务器发出服务请求,服务器根据用户的不同要求调用相对应的servlet程序。Servlet程序可获得用户的输入数据,根据用户的要求驱动数据库,从数据库中得到数据,对数据进行计算,并将结果还回到数据库和用户接口。数据库层采用ORACLE数据库技术实现数据存储、查询、增删。Java 程序和数据库之间采用JDBC编程接口实现连接,也就是说,Java程序通过JDBC直接操纵数据库。
本文下面的内容是这样安排的:第二节介绍系统的体系结构,第三节介绍聚类算法,第四节是系统实现,第五节是系统测试,最后,第六节是结论。 数据挖掘研究院
http://www.dmresearch.net/uploads/20060102/1000000001.pdf 数据挖掘实验室

