123,123

當(dāng)前位置：首頁 > 范文|應(yīng)用文 > IT技術(shù)專欄 > 網(wǎng)絡(luò)編程

XML文件解析器TXml

來源：易賢網(wǎng) 閱讀：1529 次日期：2015-08-26 15:25:18

溫馨提示：易賢網(wǎng)小編為您整理了“XML文件解析器TXml”,方便廣大網(wǎng)友查閱！

前幾天看了開源的XML文件解析器TinyXml，它是怎么實(shí)現(xiàn)解析的沒怎么看懂，于是決定自己實(shí)現(xiàn)一個(gè)，反正最近不忙。先命名為TXml?，F(xiàn)在完成了解析和查詢功能，全部代碼加起來不到1000行，將會(huì)繼續(xù)完善它。源碼必共享

先簡(jiǎn)單說一下我的思路：

1：讀取XML文件信息，并存入一個(gè)字符數(shù)組中；

2：遍歷數(shù)組，將數(shù)組解析成一棵樹；

3：以路徑的方式查詢和按屬性查詢；

這個(gè)解析器最麻煩的地方就在怎么將字符數(shù)組解析成一顆樹。我們先看一下一個(gè)簡(jiǎn)單XML文件，他包括文件頭、節(jié)點(diǎn)、節(jié)點(diǎn)名稱及節(jié)點(diǎn)值、屬性名稱及屬性值，子節(jié)點(diǎn)、父節(jié)點(diǎn)、注釋等。

<?xml version="1.0" encoding="utf-8" ?>

<Items>

</Items>

簡(jiǎn)單介紹一下解析的實(shí)現(xiàn)，不太好說清楚，看代碼可能更容易理解一些。遞歸實(shí)現(xiàn)，每次都從一個(gè)節(jié)點(diǎn)開始解析，就是從字符“<”開始，到字符“>”結(jié)束，字符<后面就是節(jié)點(diǎn)的名稱，之后的就是節(jié)點(diǎn)屬性，字符>后一個(gè)字符如果不是<，那就是節(jié)點(diǎn)的值，如果是字符<,可能是子節(jié)點(diǎn)也可能是這個(gè)節(jié)點(diǎn)結(jié)束了。遇到字符<開始遞歸，空格和注釋直接被PASS。

代碼如下:

const char* TXmlParser::ParseContent(const char* p,XmlNode* baseNode)

{

if(p==NULL || !*p)

return NULL;

if(*p=='<')//開始一個(gè)節(jié)點(diǎn)

{

bool isNote;

p=SkipNote(p,isNote);//跳過注釋

if(isNote) {//是注釋

ParseContent(p,baseNode);

return NULL;

}

if(*p=='/')//結(jié)束節(jié)點(diǎn)

{

while(p!=NULL && *p && *p!='>')

{

p++;

}

++p=SkipWhiteSpace(p);

ParseContent(p,baseNode->parent);//新節(jié)點(diǎn)

}else{ //節(jié)點(diǎn)屬性

string name;

while(p!=NULL && *p && *p!='>' && *p!=' ' && *p!='/')

{

name.push_back(*p++);

}

XmlNode* node=new XmlNode(name,baseNode);

baseNode->AppendNode(node);

if(*p=='>')

{

++p=SkipWhiteSpace(p);

ParseContent(p,node);//新節(jié)點(diǎn)

}else{

p=GetAttr(p,node);

if(*p=='/')

{

while(p!=NULL && *p && *p!='<')

p++;

ParseContent(p,baseNode);//新節(jié)點(diǎn)

}else{

++p=SkipWhiteSpace(p);

ParseContent(p,node);//新節(jié)點(diǎn)

}

}else{//節(jié)點(diǎn)的值

GetNodeValue(p,baseNode);

}

按路徑的方式查詢。利用兩個(gè)數(shù)組實(shí)現(xiàn)，假設(shè)這兩個(gè)數(shù)組分別為A,B；第一次查詢將結(jié)果存入數(shù)組A，將A作為數(shù)據(jù) 源，將查詢結(jié)果存入B，清除A中的數(shù)據(jù)，將B作為數(shù)據(jù)源，將查詢結(jié)果存入A，反復(fù)進(jìn)行，最后A,B中有一個(gè)就是查詢結(jié)果。當(dāng)然也可以用遞歸實(shí)現(xiàn)，我們都知道遞歸太深容易爆線程棧，且性能低。

按屬性查詢。同樣沒有用遞歸實(shí)現(xiàn)，有個(gè)經(jīng)常出現(xiàn)的面試題：按層序打印一個(gè)棵樹。那么這里也是按層序查找，就是利用一個(gè)隊(duì)列，按根節(jié)點(diǎn)、根節(jié)點(diǎn)的直接子節(jié)點(diǎn)進(jìn)棧，一個(gè)個(gè)匹配，不匹配就出隊(duì)列。

//根據(jù)屬性查詢--利用隊(duì)列按層序查詢

XmlNode* XmlNode::SelectSingleNodeByAttr(const string& attrName,const string& attrValue,XmlNode* node)

{

if(node==NULL)

return NULL;

if(node->attribute!=NULL && (*node->attribute)[attrName]==attrValue)

{

return node;

}

queue<XmlNode*> list;

for(int i=node->ChildCount()-1;i>=0;i--)

{

list.push((*node->childNodes)[i]);

}

while(list.size()>0)

{

XmlNode* tmpNode=list.front();

if(tmpNode->attribute!=NULL && (*tmpNode->attribute)[attrName]==attrValue)

{

return tmpNode;

}

for(int i=tmpNode->ChildCount()-1;i>=0;i--)

{

list.push((*tmpNode->childNodes)[i]);

}

list.pop();

}

return NULL;

}

看了按屬性查找，我們就很容易知道，C#中ConfigurationManager讀取配置文件的大致實(shí)現(xiàn)，因?yàn)榕渲梦募芎?jiǎn)單，就是一個(gè)節(jié)點(diǎn)下面有多個(gè)節(jié)點(diǎn)，完全可以這樣實(shí)現(xiàn)，根節(jié)點(diǎn)基本可以無視，直接就是一個(gè)字典，KEY存key的值，VALUE存value的值，查找的時(shí)間復(fù)雜度就是 O(1)。

簡(jiǎn)單測(cè)試：

更多信息請(qǐng)查看網(wǎng)絡(luò)編程

上一篇：XML學(xué)習(xí)筆記（一）：XML中的命名空間

下一篇：C#提高xml讀寫速度方法

易賢網(wǎng)手機(jī)網(wǎng)站地址：XML文件解析器TXml

由于各方面情況的不斷調(diào)整與變化，易賢網(wǎng)提供的所有考試信息和咨詢回復(fù)僅供參考，敬請(qǐng)考生以權(quán)威部門公布的正式信息和咨詢?yōu)闇?zhǔn)！

相關(guān)閱讀網(wǎng)絡(luò)編程

Shell中如何刪除文本比較長(zhǎng)的行的實(shí)現(xiàn)方法10月30日

vue.js語法及常用指令10月30日

python 讀寫中文json的實(shí)例詳解10月30日

Objective-C Json 實(shí)例詳解10月30日

bootstrap table sum總數(shù)量統(tǒng)計(jì)實(shí)現(xiàn)方法10月30日