❶ 如何用python輸出漂亮的xml文件
最近要用python處理一個xml文件。平時習慣了用xml.etree.ElementTree,結果發現此庫存在一些讓人無法忍受的缺點:
1. 無法處理comment和cdata
2. 輸出後的xml文件沒有換行,沒有縮進,十分難以閱讀
於是嘗試這用xml.dom.minidom,前兩個問題幾乎全部解決了。唯一讓人看著不爽的是minidom對於text的處理。比如,我期待的xml輸入如下:
[html]view plain
<prename="code"class="html"><prename="code"class="html"><root>
<host>192.168.0.1</host>
</root>
[html]view plain
<root>
<host>
192.168.0.1
</host>
</root>
[python]埋蔽view plain
defsave_xml(self,file_name):
xml_str=self.m_dom.toprettyxml(indent="")
repl=lambdax:">%s</"%x.group(1).strip()iflen(x.group(1).strip())!=0elsex.group(0)
pretty_str=re.sub(r'> s*([^<]+)</',repl,xml_str)
open(file_name,'w').write(pretty_str)
❷ 你好,我要是想通過python的ElementTree的XML介面實現xml的刪除,修改,創建的功能該怎麼編寫。麻煩了。
from xml.etree.ElementTree import ElementTree
from lxml import etree ##的下載安裝lxml的包
Class XMLData:
def readXML(self,xml_file):##xml_file為xml文件名
doc = etree.ElementTree(file=xml_file)
root = doc.getroot();
items = root.getchildren();
listctrldata = {};
index = 1;
for item in items:
itemchild = item.getchildren();
arr_name = [];
fot ic in intemchild:
if ic.text = None:
ic.text=''
arr_name.append(ic.text)
listctrldata[index] = arr_name
index+=1
return listctrldata
##修改xml
def write(self,xml_file,listctrldata):
doc = etree.ElementTree(file=xml_file)
root = doc.getroot()
listlen = len(listctrldata)
itemlen = len(root.getchilddren())
if itemlen > listlen:
for more in range(itemlen-listlen):
root.remove(root.getchildren()[0])
elif itemlen < listlen:
for less in range(listlen-itemlen):
item = root.getchildren()[0]
itemadd = etree.Element(item.tag)
for it in item.getchildren():
itadd = stree.Element(it.tag)
itemadd.append(itadd)
root.append(itemadd)
else:pass
j=1
for item in root.getchildren():
itemchild = item.getchildren()
k = 0
for ic in itemchild:
ic.text = listctrldata[j][k]
k+=1
j+=1
f = open(xml_file,"w")
f.write(etree.tostring(root,pretty-print = true))
f.close()
❸ Python編寫一個程序以嘗試解析XML/HTML標簽.
要給這段文字添加一個 root 標簽,然後對裡面的 node 進行遍歷。root 標簽的名字可以任意定(但是必須添加一個),我這里使用的 root 命名,對於其它的名字也一樣。如果你是直接讀取的 XML 文件,而不是字元串,可以將文件打開,然後把文件句柄傳入 ElementTree.parse() 函數,最後對其返回值進行遍歷。
fromxml.etreeimportElementTree
parsed=ElementTree.XML('''<root>
<composer>WolfgangAmadeusMozart</composer><author>SamuelBeckett</author><city>London</city>
</root>''')
outstr=[]
fornodeinparsed:
outstr+=['%s:%s'%(node.tag,node.text)]
print(''.join(outstr))
❹ 如何用Python創建生成xml文檔文件的方法
1、內存數據產生
2、產生xml內存對象(也就是DOM樹)
3、產生根對象
4、往根對象里加數據
5、把xml內存對象寫到文件
下面是一個創建xml文檔的簡單實例:
importxml.dom.minidom#在內存中創建一個空的文檔doc=xml.dom.minidom.Document()
#創建一個根節點Managers對象root=doc.createElement('Managers')
#設置根節點的屬性root.setAttribute('company','xx科技')
root.setAttribute('address','科技軟體園')
#將根節點添加到文檔對象中doc.appendChild(root)
managerList=[{'name':'joy','age':27,'sex':'女'},
{'name':'tom','age':30,'sex':'男'},
{'name':'ruby','age':29,'sex':'女'}
]foriinmanagerList:
nodeManager=doc.createElement('Manager')
nodeName=doc.createElement('name')
#給葉子節點name設置一個文本節點,用於顯示文本內容
nodeName.appendChild(doc.createTextNode(str(i['name'])))
nodeAge=doc.createElement("age")
nodeAge.appendChild(doc.createTextNode(str(i["age"])))
nodeSex=doc.createElement("sex")
nodeSex.appendChild(doc.createTextNode(str(i["sex"])))
#將各葉子節點添加到父節點Manager中,
#最後將Manager添加到根節點Managers中
nodeManager.appendChild(nodeName)
nodeManager.appendChild(nodeAge)
nodeManager.appendChild(nodeSex)
root.appendChild(nodeManager)#開始寫xml文檔fp=open('c:\wcx\Manager.xml','w')
doc.writexml(fp,indent=' ',addindent=' ',newl=' ',encoding="utf-8")
執行結果:
<?xmlversion="1.0"encoding="utf-8"?>
<Managersaddress="科技軟體園"company="xx科技">
<Manager>
<name>joy</name>
<age>27</age>
<sex>女</sex>
</Manager>
<Manager>
<name>tom</name>
<age>30</age>
<sex>男</sex>
</Manager>
<Manager>
<name>ruby</name>
<age>29</age>
<sex>女</sex>
</Manager>
</Managers>
6.用Python自帶的寫xml文檔的API去寫,比較方便,後期容易維護。如果直接用打開文件的方式,一行一行的去寫,比較費時,也難以維護。
❺ 如何用python操作xml文件,用dom
用replace應該可以的
xml = string.replace(xml, "<string name="version_string">(.*)</string>團隱", "<string name="version_string">(你想鏈雀要的棚或早東西)</string>")
❻ python中xml具體怎麼用
pipinstalllxmlpython2.7.9自帶pip安裝工具。看下面圖片,圖中顯示本人電腦已經安裝好了。1.直接下載的模塊文件中已經有了模塊的文件,有些模塊只有一個文件,比如較早版本的BeautifulSoup,有些是一個文件夾,比如新版本BeautifulSoup就是一個叫做bs4的文件夾。把這些文件直接到你的python路徑下的/Lib/site-packages文件夾中,比如C:/Python27/Lib/site-packages。之後就可以在程序里直接引用了:importBeautifulSoup或者frombs4importBeautifulSoup這是根據你放置的文件位置不同而決定的。網上有人說直接放在Lib文件夾中就可以了。的確這樣也行,但Lib文件夾中都是自帶的模塊,看一下就會發現我們用過的random、re等模塊的代碼文件。而外部模塊一般放在site-packages文件夾中。2.setup.py很多模塊里都附帶了setup.py文件,有同學直接雙擊了,然後發現沒有用。它的使用方法是從命令行去到setup.py所在的路徑下,運行pythonsetup.pyinstall仔細看一下安裝時輸出的信息可以發現,在線學習這個命令做的事情其實也就是幫你把模塊的代碼到site-packages文件夾。3.setuptools使用setuptools可以直接根據模塊名稱來自動下載安裝,不需要自己再去尋找模塊的安裝文件。不過在使用之前,你得先安裝setuptools自身。windows平台的32位python,可以直接下載setuptools的exe文件安裝。
❼ python寫xml中文本節點怎麼才能不換行
1、在python 2.x中,在print 'xxxx' 後面加一個逗號
print 'hello world',
2、python 3.x中,需要在函數內增加一個end欄位:
print('hello world', end='')
❽ 請問用python怎麼修改xml的節點值
from xml.etree import ElementTree
filePath = 'd:\\aaa.xml'
xmldoc = ElementTree.parse(filePath)
node = xmldoc.find('./string')
node.text = "win 7"
其實說實話,樓上的回答已經很清楚了.
不管什麼編程語言,要想學好,基礎一定要扎實.