java操作xml编程实例(sax) — JAVA频道

 

数据挖掘交友

 

数据挖掘论坛

  数据挖掘交友

  数据挖掘论坛

  数据挖掘论坛

 

 

数据挖掘论坛

  数据挖掘实验室

XML文档样本: 


 
 
 Bob  
 New York  
 


代码: 
package xmltest; 
import javax.xml.parsers.*; 
import org.xml.sax.*; 
import org.xml.sax.helpers.*; 
import java.io.*; 




public class SaxTest extends DefaultHandler { 


// 重载DefaultHandler类的方法 
// 以拦截SAX事件通知。 
// 
// 关于所有有效事件,见org.xml.sax.ContentHandler 
// 
public void startDocument( ) throws SAXException { 
System.out.println( "SAX Event: START DOCUMENT" ); 


public void endDocument( ) throws SAXException { 
System.out.println( "SAX Event: END DOCUMENT" ); 

数据挖掘交友




public void startElement( String namespaceURI, 
String localName, 
String qName, 
Attributes attr ) throws SAXException { 
System.out.println( "SAX Event: START ELEMENT[ " + 
localName + " ]" ); 

// 如果有属性,我们也一并打印出来... 
for ( int i = 0; i < attr.getLength(); i++ ){ 
System.out.println( " ATTRIBUTE: " + 
attr.getLocalName(i) + 
" VALUE: " + 
attr.getValue(i) ); 




public void endElement( String namespaceURI, 
String localName, 
String qName ) throws SAXException { 
System.out.println( "SAX Event: END ELEMENT[ " + 
localName + " ]" );  数据挖掘交友


public void characters( char[] ch, int start, int length ) 
throws SAXException { 

System.out.print( "SAX Event: CHARACTERS[ " ); 

try { 
OutputStreamWriter outw = new OutputStreamWriter(System.out); 
outw.write( ch, start,length ); 
outw.flush(); 
} catch (Exception e) { 
e.printStackTrace(); 


System.out.println( " )" ); 




public static void main( String[] argv ){ 

System.out.println( "Example1 SAX Events:" ); 
try { 

// SAXParserFactory spFactory = SAXParserFactory.newInstance(); 
// SAXParser sParser = spFactory.newSAXParser(); 


// 建立SAX 2解析器...  数据挖掘交友
XMLReader xr = XMLReaderFactory.createXMLReader("org.apache.xerces.parsers.SAXParser"); 

// 安装ContentHandler... 
xr.setContentHandler( new SaxTest() ); 

// 解析文件... 
xr.parse( new InputSource( 
new FileReader( "exampleA.xml" )) ); 


}catch ( Exception e ) { 
e.printStackTrace(); 





 当前SAX API有两个版本。第二版中的类名和方法名与第一版都有出入,但是代码的结构是一样的。
    SAX是一套API,它不是一个解析器,所以这个代码在XML解析器中是通用的。要让示例跑起来,你将需要一个支持SAX v2的XML解析器。我用Apache的Xerces解析器.代码如下
// 建立SAX 2解析器... 
XMLReader xr = XMLReaderFactory.createXMLReader("org.apache.xerces.parsers.SAXParser"); 

// 安装ContentHandler... 
xr.setContentHandler( new SaxTest() ); 
SAX API 的说明书通俗易读。它包含了很多的详细内容。而使用SAX API的主要任务就是创建一个实现ContentHandler接口,一个供XML 解析器调用以将分析XML文档时所发生的SAX事件分发给处理程序的回调接口。 

方便起见,SAX API也提供了一个已经实现了ContentHandler接口的DefaultHandler适配器类。 

一但实现了ContentHandler或者扩展了DefaultHandler类,你只需直接将XML解析器解析一个特定的文档即可。 

我们的第一个例子扩展DefaultHandler将每个SAX事件打印到控制台。这将给你一个初步的映象,以说明什么SAX事件将会发生及以怎样的顺序发生。 

下面介绍一下其它操作XML的API
stax(simple stream api for xml)作为jsr已经出现几年时间了,可能不如sax,dom(及其他基于其上的工具包比如jdom,jaxp,etc)为众人所知。可能也是因为最近xfire的火热 导致它的知名度有所提升吧。(题 外话,好象有不少知识点一直都是默默无闻的,只有随着某项技术的流行才突然变的为人所知道了,比如ThreadLocal本来我们一直没有接触,很多人可能一直都不知道它的存在,但随着它在spring ,hibernate这些流行的技术里的灵巧的应用,一下子就被很多人谈及及应用了。可见我们的水平还是属于跟在老外屁股后面跑的水平)。 数据挖掘交友
通过和dom,sax这两种大家熟知的xml解析方式的比较,可以容易的看出它的特点。
dom通过把整个tree 文档读入内存进行操作,可以随意对文档进行操作,非常灵活。但缺点是对内存的资源耗费比较大。
sax不同于dom把整个文档读入内存的方式,它是直接对 xml文件进行操作。速度快,基本上不占用什么内存资源。缺点看看它的名字就知道了(simple api for xml),基于event的方式(这点和stax类似),但是是通过callback的方式把对xml的遍历权交给sax parser了。这样导致我们不能灵活控制对xml文件的访问。

stax通过stream的方式来解决sax,dom各自的缺点,同时具有他们大部分的优点(我想底层实现是不是通过直接操作文件流的方式,还没有看它的实现的src,不敢乱说)。stax主要有两中粒度不同的操作方式 ,一种基于event, 另一种更底层的实现基于cursor。初一看实现方式有点象sax,因为都是基于event的。但是sax把访问控制权交给parser(通过callback))了,我们很难控制iterat过程。stax允许我们自己控制iterat.
所以stax的优点如下:基于stream的方式,不象dom耗费内存资源。又可以自己控制对xml的iterat,不象sax把控制权交给parser).还有一个优点就是可以在iterat的过程中随时cancel。虽然sax 也可以通过 throw saxexception的方式中断iterat过程,但毕竟不是一中优美的解决方案。当然stax的还提供了以stream的方式进行write xml的操作。

?具体的stax应用可以看ibm的系列教程文章,比较老了了点。http://www-128.ibm.com/developerworks/xml/library/x-tipstx/

具体实现,除了bea的一个ri实现外,不知道还有其他的实现没有(stax jsr好象最早由bea提出来)?

个人感觉stax的应用还是有些麻烦,期待(或则是不是已经有了?)能有更高层次的封装(类似于jdom,jaxp实现之类的)。


数据挖掘实验室



[数据挖掘专家] [数据挖掘研究院] [数据挖掘论坛] [数据挖掘实验室]
上一篇:Java编程学习:自己DIY一个JSP日历 — JAVA频道
下一篇:Java初学者应该搞懂的六个问题 — JAVA频道
最新评论共有 0 位网友发表了评论 , 查看所有评论
发表评论( 不能超过250字,需审核,请自觉遵守互联网相关政策法规。 )
匿名?
数据挖掘网站导航 数据挖掘论坛导航
  • 数据挖掘工具
  • 数据挖掘论坛
  • DataCruncher - Cognos
  • MineSet - MathSoft
  • Intelligent Miner - GainSmarts
  • Sqlserver - SAS - Clementine
  • CART - Weka - WizSoft
  • NeuroShell - ModelQuest
  • data mining tools - Darwin
  • 数据挖掘交友
  • 数据挖掘博客
  • 数据挖掘工具
  • 数据挖掘资源
  • 数据挖掘技术算法
  • 数据挖掘相关期刊、会议
  • 研究院联盟合作专区
  • 数据挖掘基础与相关技术
  • 数据挖掘厂商与就业
  • 数据挖掘研究者乐园
  • 知名厂商数据挖掘工具资料
  • 国内数据挖掘实验室
  • Foreign Data Mining Lab
  • 热点关注
  • 尚学堂J2EE和MLDN的J2EE视频教程哦
  • 有谁知道ERROR:JDWP Unable to get
  • com.microsoft.sqlserver.jdbc.SQLServerEx
  • 急~Eclipse3.3语言包,VEP插件
  • 毕业5年了,大家一个月全部收入能拿多少(税
  • org.hibernate.exception.ConstraintViolat
  • hibernate抛出could not fetch initial val
  • hibernate left outer join 出错 Path expe
  • myeclipse5.1.0和myeclipse6.0有什么区别。
  • spring如何动态获取bean,如何动态调用getB
  • 论坛最新话题
  • Foundations of Statistical Natural Langu
  • Game Theory meet Data Mining: A Recent P
  • System Building: How does it help or hin
  • 数据挖掘与Clementine培训
  • 新手报到
  • 求 SASEM 客户流失预测分析
  • 数据挖掘工程师/搜索研究院—北京——无线
  • 数据挖掘入门介绍(如何着手数据挖掘)
  • Information Overload Survey Results
  • The INEX 2005 Workshop on Element Retrie
  • 相关资讯
  • 不安装jre能运行JAVA程序吗?
  • Java的模板引擎Velocity用户手册
  • 成为java高手的八大条件
  • 简化Java代码的技巧
  • JAVA的网络功能与编程
  • 用java读取各种计算机文件系统的文件列表
  • 怎样拿下SUN公司的SCJP认证?
  • Borland以全额现金交易收购VMGEAR
  • 用JNI技术提高Java的性能
  • 用Java编写HTML文件分析程序
  • 数据挖掘实验室资料
  • 数据挖掘博客地址
  • 数据挖掘实验室网站地址
  • Prepare for Medicare audits by using dat
  • 注册成为SAS用户与爱好者俱乐部会员
  • 水南梅
  • 明日烟
  • 新人报道
  • 下载
  • 厦门服务器托管,450元/月—0592-5177319 高
  • 买空间送域名--0592-5177319 高静