A. python中json處理
python中json文件處理涉及的四個函數json.loads()、json.mps()、json.load()、json.mp()。
1)json.mps()
將一個Python數據類型dict進行json格式的編碼(字典->字元串)
eg:
age_dict = {'age1':'12', 'age2':'15'}
json_info = json.mps(age_dict)
print("json_info = {}".format(json_info))
print("json_info type = {}".format(type(json_info)))
2)json.loads()
將json格式數據轉換為dict(字元串->字典)
json_age ='{"age1": "12", "age2": "15"}'
dict_age = json.loads(json_info)
print("json_age = {}".format(json_age))
print("dict_age type = {}".format(str(type(dict_age))))
3)json.load()
讀取文件,將里json格式字元串轉化為dict
with open(test.json, 'r') as file:
contents = json.load(file)
print(contents)
4)json.mp()
將dict類型轉換為json格式字元串,存入文件
number = [1, 2, 3, 5]
file = 'number.json'
with open(file , 'w') as file:
json.mp(number, file)
B. 【Python】淺談python中的json
一 前言
最近一直在做開發相關的工作--基於Django的web 平台,其中需要從model層傳輸數據到view 層做數據展示或者做業務邏輯處理。我們採用通用的Json格式--Json(JavaScript Object Notation) 是一種輕量級的數據交換格式,易於閱讀和程序解析。
二 認識Json
2.1 Json 結構
常見的Json格式為 「名稱/值」對的集合,其中 值可以是對象,列表,字典,字元串等等。比如
backup_data = {"back_to_host": "dbbk0",
"ip_address": "10.10.20.3",
"host_name": "rac4",
"port": 3306}
2.2 使用Json
Python的Json模塊序列化與反序列化的過程分別是 編碼和解碼。這兩個過程涉及到兩組不同的函數
編碼 把一個Python對象編碼轉換成Json字元串,json.mps(data)/json.mp(data,file_handler)
解碼 把Json格式字元串解碼轉換成Python對象,json.loads(data)/json.load(file_handler)
在python中要使用Json模塊做相關操作,必須先導入:
import Json
2.3 主要函數
編碼函數主要有 json.mps(data)/json.mp(data,file_handler)
json.mps()的參數是將python對象轉換為字元串,如使用json.mps序列化的對象json_mps=json.mps({'a':1, 'b':2}) ,json_mps='{"b": 2, "a": 1}'
json.mp 是將內置類型序列化為json對象後寫入文件。
解碼函數主要由json.loads(data)/json.load(file_handler)
json.loads的參數是內存對象,把Json格式字元串解碼轉換成Python對象,json_loads=json.loads(d_json) #{ b": 2, "a": 1},使用load重新反序列化為dict
json.load()的參數針對文件句柄,比如本地有一個文件/tmp/test.json json_load=json.load(open('/tmp/test.json'))
具體案例參考如下:
In [3]: data={"back_to_host": "rac1",
...: "ip_address": "10.215.20.3",
...: "host_name": "rac3",
...: "port": 3306}
In [7]: json_str=json.mps(data)
In [8]: print json_str
{"ip_address": "10.215.20.3", "back_to_host": "rac1", "host_name": "rac3", "port": 3306}
In [9]: json_loads=json.load(json_str)
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-9-180506f16431> in <mole>()
----> 1 json_loads=json.load(json_str)
/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/json/__init__.pyc in load(fp, encoding, cls, object_hook, parse_float, parse_int, parse_constant, object_pairs_hook, **kw)
284
285 ""
注意 從上面的報錯信息來看 json.loads 傳參是字元串類型,並不是文件句柄,沒有 read()屬性。
In [10]: json_loads=json.loads(json_str)
In [11]: print json_loads
{u'back_to_host': u'rac1', u'ip_address': u'10.215.20.3', u'host_name': u'rac3', u'port': 3306}
In [12]: type(json_loads)
Out[12]: dict
In [13]: type(json_str)
Out[13]: str
利用mp 將數據寫入 mp.json
In [17]: with open('/tmp/mp.json','w') as f:
...: json.mp(json_str,f)
...:
yangyiDBA:~ yangyi$ cat /tmp/mp.json
"{\"ip_address\": \"10.10.20.3\", \"back_to_host\": \"rac1\", \"host_name\": \"rac3\", \"port\": 3306}"
yangyiDBA:~ yangyi$
利用json.load 將mp.sjon的數據讀出來並賦值給 data
In [18]: with open('/tmp/mp.json','r') as f:
...: data=json.load(f)
...:
In [19]: print data
{"ip_address": "10.10.20.3", "back_to_host": "rac1", "host_name": "rac3", "port": 3306}
三 小結
本文算是一篇學習筆記,主要對比了json.loads/json.load , json.mps/ json.mp 的使用差異 ,方便以後更好的使用json 。
以上為本次分享內容,感謝觀看。
C. Python爬蟲(七)數據處理方法之JSON
JSON 指的是 JavaScript 對象表示法(JavaScript Object Notation),是輕量級的文本數據交換格式,且具有自我描述性,更易理解。
JSON看起來像python類型(列表,字典)的字元串。
在之前的文章中,我們說到了怎麼用response的方法,獲取到網頁正確解碼後的字元串。如果還有不懂的,可以先閱讀 Python爬蟲(三)Requests庫 。接下來以有道翻譯為例子,說說怎麼通過網頁解碼後的字元串,提取到翻譯結果。
再結合上述有道翻譯的例子,得到字典類型的返回結果,並提取出來翻譯結果。
將上述例子的dict_json換成str字元串,再寫入文本中。
執行完上述的程序,會得到一個fanyi.txt的文件,其結果如下:{"type": "ZH_CN2EN", "errorCode": 0, "elapsedTime": 1, "translateResult": [[{"src": "\u4eba\u751f\u82e6\u77ed\uff0c\u6211\u7528python", "tgt": "Life is too short, I use python"}]]}。這樣子的一份文檔,中文部分顯示的是二進制,且格式非常不利於閱讀,這並不是我們想要的結果。好在json.mps()為我們提供的兩個方法,以幫助我們更好閱讀文檔。
1.ensure_ascii,能夠讓中文顯示成中文;
2.indent,能夠讓下一行在第一行的基礎上空格。
其用法如下:
D. python中如何遍歷json數組
1、創建python文件,testjson.py;
E. 如何用Python,查找json格式中指定的數據,然後輸出這些查找到的數據
用Python查找json格搏數鉛式中指定的數據輸出這些查找到的數據的操作步基好驟如下:
1,打開一個編輯器,例如sublime text 3,然後創建畢螞一個新的PY文檔。
F. py3筆記8:json結構的校驗
python中使用json模塊實現python對象與json的轉換
要處理的是文件而不是字元串,你可以使用 json.mp() 和 json.load() 來編碼和解碼JSON數據
Json Schema 是一個用於驗證Json數據結構的強大工具
使用范圍: 介面測試中數據值校驗、數據類型校驗、json數據結構校驗
官網: https://json-schema.org/understanding-json-schema/conventions.html
安裝: pip install jsonschema
type 關鍵字是json模式的基礎,指定架構的數據類型:string、number、object、array、boolean、null
object關鍵字,在python中對應的是dict類型
數組屬性array,用於有序元素
在python中,array類似於list或tuple
在Json,通常有2種方式驗證
1. 列表驗證: 任意長度的序列,其中每個元素匹配相同的模式
2. 元組驗證: 一個固定長度的序列,其中每個項目可能具有不同的模式
1. 列表驗證
2. 元組驗證
針對每一個元素解釋說明,默認校驗schema中設置的前n項
將items關鍵字設置成一個數組, 其中每個項目都是一個與文檔數組的每個索引相對應的模式,
也就是一個數組, 第一個元素模式驗證輸入數組的第一個元素. 第二個元素模式驗證輸入數組的第二個元素
例如, 在以下的模式, anyOf關鍵字用於表示給定值可能對任何給定的子模式有效。第一個子模式需要一個最大長度為5的字元串。第二個子模式需要一個最小值為0的數字。只要一個值對這些模式中的任何一個進行驗證,它就被認為整個組合模式有效。
{ 『anyOf』: [ {『type』: 『string』, 『maxLength』: 5}, {『type』:』string』, 『minimum』: 0 }]}
用於組合模式的關鍵字是:
該$schema關鍵字用於聲明JSON片段實際上是JSON模式的一部分。它還聲明了針對該模式編寫的JSON Schema標準的哪個版本。
建議所有JSON模式都有一個$schema條目,該條目必須位於根目錄下。因此,大多數情況下,您需要在架構的根目錄下: