XML文件解析器TXml
來源:易賢網(wǎng) 閱讀:1183 次 日期:2015-08-26 15:25:18
溫馨提示:易賢網(wǎng)小編為您整理了“XML文件解析器TXml”,方便廣大網(wǎng)友查閱!

前幾天看了開源的XML文件解析器TinyXml,它是怎么實現(xiàn)解析的沒怎么看懂,于是決定自己實現(xiàn)一個,反正最近不忙。先命名為TXml?,F(xiàn)在完成了解析和查詢功能,全部代碼加起來不到1000行,將會繼續(xù)完善它。源碼必共享

先簡單說一下我的思路:

1:讀取XML文件信息,并存入一個字符數(shù)組中;

2:遍歷數(shù)組,將數(shù)組解析成一棵樹;

3:以路徑的方式查詢和按屬性查詢;

這個解析器最麻煩的地方就在怎么將字符數(shù)組解析成一顆樹。我們先看一下一個簡單XML文件,他包括文件頭、節(jié)點、節(jié)點名稱及節(jié)點值、屬性名稱及屬性值,子節(jié)點、父節(jié)點、注釋等。

<?xml version="1.0" encoding="utf-8" ?>

<!--注釋-->

<Items>

<item name="chentaihan">89757</item>

</Items>

簡單介紹一下解析的實現(xiàn),不太好說清楚,看代碼可能更容易理解一些。遞歸實現(xiàn),每次都從一個節(jié)點開始解析,就是 從字符“<”開始,到字符“>”結(jié)束,字符<后面就是節(jié)點的名稱,之后的就是節(jié)點屬性,字符>后一個字符如果不是<,那就 是節(jié)點的值,如果是字符<,可能是子節(jié)點也可能是這個節(jié)點結(jié)束了。遇到字符<開始遞歸,空格和注釋直接被PASS。

代碼如下:

const char* TXmlParser::ParseContent(const char* p,XmlNode* baseNode)

{

if(p==NULL || !*p)

return NULL;

if(*p=='<')//開始一個節(jié)點

{

bool isNote;

p=SkipNote(p,isNote);//跳過注釋

if(isNote) {//是注釋

ParseContent(p,baseNode);

return NULL;

}

if(*p=='/')//結(jié)束節(jié)點

{

while(p!=NULL && *p && *p!='>')

{

p++;

}

++p=SkipWhiteSpace(p);

ParseContent(p,baseNode->parent);//新節(jié)點

}else{ //節(jié)點屬性

string name;

while(p!=NULL && *p && *p!='>' && *p!=' ' && *p!='/')

{

name.push_back(*p++);

}

XmlNode* node=new XmlNode(name,baseNode);

baseNode->AppendNode(node);

if(*p=='>')

{

++p=SkipWhiteSpace(p);

ParseContent(p,node);//新節(jié)點

}else{

p=GetAttr(p,node);

if(*p=='/')

{

while(p!=NULL && *p && *p!='<')

p++;

ParseContent(p,baseNode);//新節(jié)點

}else{

++p=SkipWhiteSpace(p);

ParseContent(p,node);//新節(jié)點

}

}

}

}else{//節(jié)點的值

GetNodeValue(p,baseNode);

}

}

按路徑的方式查詢。利用兩個數(shù)組實現(xiàn),假設(shè)這兩個數(shù)組分別為A,B;第一次查詢將結(jié)果存入數(shù)組A,將A作為數(shù)據(jù) 源,將查詢結(jié)果存入B,清除A中的數(shù)據(jù),將B作為數(shù)據(jù)源,將查詢結(jié)果存入A,反復(fù)進行,最后A,B中有一個就是查詢結(jié)果。當(dāng)然也可以用遞歸實現(xiàn),我們都知 道遞歸太深容易爆線程棧,且性能低。

按屬性查詢。同樣沒有用遞歸實現(xiàn),有個經(jīng)常出現(xiàn)的面試題:按層序打印一個棵樹。那么這里也是按層序查找,就是利用一個隊列,按根節(jié)點、根節(jié)點的直接子節(jié)點進棧,一個個匹配,不匹配就出隊列。

//根據(jù)屬性查詢--利用隊列按層序查詢

XmlNode* XmlNode::SelectSingleNodeByAttr(const string& attrName,const string& attrValue,XmlNode* node)

{

if(node==NULL)

return NULL;

if(node->attribute!=NULL && (*node->attribute)[attrName]==attrValue)

{

return node;

}

queue<XmlNode*> list;

for(int i=node->ChildCount()-1;i>=0;i--)

{

list.push((*node->childNodes)[i]);

}

while(list.size()>0)

{

XmlNode* tmpNode=list.front();

if(tmpNode->attribute!=NULL && (*tmpNode->attribute)[attrName]==attrValue)

{

return tmpNode;

}

for(int i=tmpNode->ChildCount()-1;i>=0;i--)

{

list.push((*tmpNode->childNodes)[i]);

}

list.pop();

}

return NULL;

}

看了按屬性查找,我們就很容易知道,C#中ConfigurationManager讀取配置文件的大致實現(xiàn),因為配置文件很簡單,就是一個節(jié)點下 面有多個節(jié)點,完全可以這樣實現(xiàn),根節(jié)點基本可以無視,直接就是一個字典,KEY存key的值,VALUE存value的值,查找的時間復(fù)雜度就是 O(1)。

簡單測試:

更多信息請查看網(wǎng)絡(luò)編程
易賢網(wǎng)手機網(wǎng)站地址:XML文件解析器TXml
由于各方面情況的不斷調(diào)整與變化,易賢網(wǎng)提供的所有考試信息和咨詢回復(fù)僅供參考,敬請考生以權(quán)威部門公布的正式信息和咨詢?yōu)闇?zhǔn)!

2026國考·省考課程試聽報名

  • 報班類型
  • 姓名
  • 手機號
  • 驗證碼
關(guān)于我們 | 聯(lián)系我們 | 人才招聘 | 網(wǎng)站聲明 | 網(wǎng)站幫助 | 非正式的簡要咨詢 | 簡要咨詢須知 | 新媒體/短視頻平臺 | 手機站點 | 投訴建議
工業(yè)和信息化部備案號:滇ICP備2023014141號-1 云南省教育廳備案號:云教ICP備0901021 滇公網(wǎng)安備53010202001879號 人力資源服務(wù)許可證:(云)人服證字(2023)第0102001523號
云南網(wǎng)警備案專用圖標(biāo)
聯(lián)系電話:0871-65099533/13759567129 獲取招聘考試信息及咨詢關(guān)注公眾號:hfpxwx
咨詢QQ:1093837350(9:00—18:00)版權(quán)所有:易賢網(wǎng)
云南網(wǎng)警報警專用圖標(biāo)