用VB.NET和XPath简化XML导航

发表于:2007-06-30来源:作者:点击数: 标签:
用VB.NET进行XML导航 XML文档可能包含1~1000个或者更多的元素。你可能需要访问XML文档包含的全部数据,或者访问这些数据的一个选定的子集。XPath提供了定位和选择XML子集的语法,从而简化了这一任务。.NET框架使用XPathNavigator类来执行XPath命令,但要想利
用VB.NET进行XML导航

XML文档可能包含1~1000个或者更多的元素。你可能需要访问XML文档包含的全部数据,或者访问这些数据的一个选定的子集。XPath提供了定位和选择XML子集的语法,从而简化了这一任务。.NET框架使用XPathNavigator类来执行XPath命令,但要想利用它,必须有一个可用的XML文档。

可用.NET XPathDocument类来处理一个XML文档的创建或检索。这个类提供了大量方法和属性,但我们重点关注的是CreateNavigator方法。该方法创建一个和XML文档对应的XPathNavigator对象。在本文的例子中,将使用下面这个基本的XML文档:

<?xml version="1.0" encoding="utf-8" ?>
<sites>
<website>
<name type="Application Development">Builder.com</name>
<link>www.builder.com</link>
</website>
<website>
<name type="Information Technology">TechRepublic</name>
<link>www.techrepublic.com</link>
</website>
<website>
<name type="Technology News">News.com</name>
<link>www.news.com</link>
</website>
</sites>

假定上述XML存储在一个本地文件中,例如C:\builder.xml,你可用以下VB.NET代码为其指派一个XPathNavigator对象:

Dim xpathDoc As XPathDocument
Dim xmlNav As XPathNavigator
Try
xpathDoc = New XPathDocument("c:\builder.xml")
xmlNav = xmlDoc.CreateNavigator()
Catch ex As XPathException
System.Console.WriteLine("XMLException: " + ex.Message)
Catch ex As Exception
System.Console.WriteLine("Exception: " + ex.Message)
End Try

注意,用于访问XML文档的代码封闭在一个try/catch块中,以便处理可能发生的任何运行时异常。另外要注意,你需要包括以下命名空间,以便在自己的代码中利用XML类:

imports System.Xml.XPath

该命名空间允许你直接使用需要的类,而不必包括完全限定名称。除了迄今为止用到的类之外,在处理XML数据时还要用到XPathNodeIterator和XPathExpression类。

XML数据导航

XPathNodeIterator类包括以下用于遍历XML文档的方法:

  • MoveTo——转到XML文档内的一个特定节点
  • MoveToNext——转到下一个同辈节点,当前节点用作基节点
  • MoveToPrevious——转到上一个同辈节点,当前节点用作基节点
  • MoveToRoot——转到XML文档的根节点
  • MoveToParent——转到当前节点的父节点

以下示范代码展示了如何运用这些方法:

Dim xpathDoc As XPathDocument
Dim xmlNav As XPathNavigator
Dim xmlNI As XPathNodeIterator
xpathDoc = New XPathDocument("c:\builder.xml")
xmlNav = xpathDoc.CreateNavigator()
xmlNI = xmlNav.Select("/sites/website")
While (xmlNI.MoveNext())
System.Console.WriteLine(xmlNI.Current.Name + " : " + xmlNI.Current.Value)
End While

上述代码遍历由XPath表达式(例如/sites/website)返回的所有节点。表达式返回所有website节点,并将sites节点当作父节点(也就是根节点)。MoveNext方法可由XPathNodeIterator基类使用,但前面列出的其他方法要求一个节点作为起点。当前节点是用XPathNodeIterator类的Current属性来访问的。

以下示范代码对上例进行了扩展,它使用MovePrevious方法在初始循环之后反向遍历节点列表:

Dim xpathDoc As XPathDocument
Dim xmlNav As XPathNavigator
Dim xmlNI As XPathNodeIterator
xpathDoc = New XPathDocument("c:\builder.xml")
xmlNav = xpathDoc.CreateNavigator()
xmlNI = xmlNav.Select("/sites/website")
While (xmlNI.MoveNext())
System.Console.WriteLine(xmlNI.Current.Name + " : " + xmlNI.Current.Value)
End While
Do
System.Console.WriteLine(xmlNI.Current.Name + " : " + xmlNI.Current.Value)
Loop While (xmlNI.Current.MoveToPrevious())

可用其他方法在搜索结果中遍历。除此之外,可利用大量属性来确定一个节点的特征。下面进行了简要总结:

  • HasAttributes——指明一个节点是否具有Attributes的布尔值
  • HasChildren——指明一个节点是否有子节点的布尔值
  • IsEmptyElement——指明当前节点是否为空的布尔值
  • Name——当前节点的名称
  • NodeType——节点类型
  • Value——与节点对应的文本值

以下代码利用上述2个属性来确定节点的特征:

While (xmlNI.MoveNext())
If Not (xmlNI.Current.IsEmptyElement) Then
System.Console.WriteLine(xmlNI.Current.Name + " : " + xmlNI.Current.Value)
End If
If Not (xmlNI.Current.HasAttribute) Then
// work with attributes
End If
End While

当然,使用XPath可以轻松地操纵节点。以下表达式将返回具有特定Attribute值的节点:

/sites/website[@Type="Technology News"]

定位所需数据

XPath规范简化了XML文档导航,本文的例子证明它极易上手。

原文转自:http://www.ltesting.net