1. 資料庫中的空值與NULL的區別以及python中的NaN和None
資料庫裡面的」空值」有兩種:空字元(「」)、空值(NULL)。
兩種存儲方式在資料庫中都很常見,實際中根據業務或者個人習慣可以用這兩種方式來存儲「空值」。那這兩種到底有什麼區別,下面通過例子直接來展示:
-- 創建表testcreate table `test` (`id` int not null ,`name` varchar(255) null ,`date` timestamp null ,`class` varchar(255) null );insert into test (id,name,date,class) values (1,'張三','2017-03-01','a班');insert into test (id,name,date,class) values (2,'李四','2017-03-02','');insert into test (id,name,class) values (3,'王五','c班');select * from test;1234567891011
兩種方式讀取的數據居然不一樣!
第一種把數據從MYSQL導出後,python讀取時,空值即為NULL;
第二種鏈接資料庫後,python能讀取表結構,資料庫的NULL對應列表中的None以及pandas中的NaN(如果欄位類型是時間,則為NaT)。而資料庫中的空字元,則被識別為空字元。
個人理解的等式
NULL(資料庫)=None(python列表)=NaN(pandas)
空字元(資料庫)=空字元(python列表)=空字元(pandas)
從csv中獲取數據時:空值(csv)=NULL(資料庫)=NaN(pandas)
轉為csv數據時:資料庫中的NULL空字元和pandas中的NaN空字元,都變成csv中的空值
在python處理完數據後,往資料庫寫數據的時候也一樣。注意注意!
2. Python中參數為None是什麼意思
python函數參數為None的時候,比如
def
req(self,
b=None),是因為這個函數是一個封裝函數,在沒有調用他的時候他的參數需要加上None。如果不加None值,不調用函數他會報錯。
一般會用在封裝類或者框架里。比如說框架一般會有一個總的調用函數,總的調用函數啟動,這次沒有獲取到值,執行到req函數時無法給req函數參數,那如果沒有參數req函數就會報錯。一般會報:『req()
missing
1
required
positional
argument:
'b'』但是如果參數為None就不會報錯。如果程序執行到req參數傳遞成功的話,參數就不會是None了。
所以None是一個防止報錯的機制。
3. Python3 & 基本數據類型(一)
Python提供的基本數據類型:數值(整型、浮點型、復數、布爾型等)、字元串、列表、元組、字典、集合等,將它們簡單分類如下:
通常被稱為整型,數值為正或者負,不帶小數點。
Python 3的整型可以當做Long類型使用,所以Python 3沒有
Python 2的Long類型。
Python 初始化的時候會自動建立一個小整數對象池,方便我們調用,避免後期重復生成!這是一個包含 262個指向整數對象的指針數組,范圍是 -5 到 256 。
Python的浮點數就是數學中的小數,類似C語言中的double。
浮點數 也就是小數,如 1.23 , 3.14 , -9.01 等等。但是對於很大或很小的浮點數,一般用科學計數法表示,把10用e替代, 1.23x10^9 就是 1.23e9 ,或者 12.3e8 , 0.000012 可以寫成1.2e-5 等等。
復數 由實數部分和虛數部分構成,可以用a + bj,或者complex(a,b)表示,復數的實部a和虛部b都是浮點。
對 與 錯 、 0 和 1 、 正 與 反 ,都是傳統意義上的布爾類型。
但在Python語言中,布爾類型只有兩個值, True 與 False 。請注意,是英文單詞的對與錯,並且首字母要大寫。
在Python中,0、0.0、-0.0、None、空字元串「」、空元組()、空列表[]、空字典{}都被當作False,還有自定義類型,如果實現了 nonzero ()或 len ()方法且方法返回0或False,則其實例也被當作False,其他對象均為True
布爾值還可以用and、or和not運算。
1)、and 運算是 與 運算,只有所有都為 True , and 運算的結果才是 True ;
2)、or 運算是 或 運算,只要其中有一個為 True , or 運算結果就是 True ;
3)、not 運算是 非 運算,它是單目運算符,把 True 變成 False,False 變成 True。
例如:
由以上案例可以看出,在做四則運算的時候,明顯把 True 看做 1 , False 看做 0 。
4)空值
空值不是布爾類型,只不過和布爾關系比較緊密。
空值是Python里一個特殊的值,用 None 表示(首字母大寫)。None不能理解為0,因為0是整數類型,而None是一個特殊的值。None也不是布爾類型,而是NoneType。
在某些特定的情況下,需要對數字的類型進行轉換。
Python提供了內置的數據類型轉換函數:
int(x) 將x轉換為一個整數。如果x是一個浮點數,則截取小數部分。
float(x) 將x轉換成一個浮點數。
complex(x) 將x轉換到一個復數,實數部分為 x,虛數部分為 0。
complex(x, y): 將 x 和 y 轉換到一個復數,實數部分為 x,虛數部分為 y。
Python字元串即可以用單引號也可以用雙引號括起來,甚至還可以用三引號括起來,字元串是以''或""括起來的任意文本。
例如:'abc',"xyz"等等。請注意,''或""本身只是一種表示方式,不是字元串的一部分,因此,字元串'abc'隻有a,b,c這3個字元。如果'本身也是一個字元,那就可以用""括起來,比如"I'm OK"包含的字元是I,',m,空格,O,K這6個字元。
字元串中包括特殊字元,可以用轉義字元來標識
但是字元串裡面如果有很多字元都需要轉義,就需要加很多,為了簡化,Python還允許用r''表示''內部的字元串默認不轉義
例如:
print r'\ \' #輸出:\ \
字元串的一些常見操作
切⽚是指對操作的對象截取其中⼀部分的操作
語法:序列[開始位置下標:結束位置下標:步⻓]
a. 不包含結束位置下標對應的數據, 正負整數均可;
b. 步⻓是選取間隔,正負整數均可,默認步⻓為1。
find():檢測某個⼦串是否包含在這個字元串中,如果在返回這個⼦串開始的位置下標,否則則返回-1。
index():檢測某個⼦串是否包含在這個字元串中,如果在返回這個⼦串開始的位置下標,否則則報異常。
rfind(): 和find()功能相同,但查找⽅向為右側開始。
rindex():和index()功能相同,但查找⽅向為右側開始。
count():返回某個⼦串在字元串中出現的次數。
replace():替換
split():按照指定字元分割字元串。
join():⽤⼀個字元或⼦串合並字元串,即是將多個字元串合並為⼀個新的字元串。
capitalize():將字元串第⼀個字元轉換成⼤寫。
title():將字元串每個單詞⾸字⺟轉換成⼤寫。
lower():將字元串中⼤寫轉⼩寫。
upper():將字元串中⼩寫轉⼤寫。
lstrip():刪除字元串左側空⽩字元。
rstrip():刪除字元串右側空⽩字元。
strip():刪除字元串兩側空⽩字元。
ljust():返回⼀個原字元串左對⻬,並使⽤指定字元(默認空格)填充⾄對應⻓度 的新字元串。
rjust():返回⼀個原字元串右對⻬,並使⽤指定字元(默認空格)填充⾄對應⻓度 的新字元串,語法和
ljust()相同。
center():返回⼀個原字元串居中對⻬,並使⽤指定字元(默認空格)填充⾄對應⻓度 的新字元串,語
法和ljust()相同。
所謂判斷即是判斷真假,返回的結果是布爾型數據類型:True 或 False。
startswith():檢查字元串是否是以指定⼦串開頭,是則返回 True,否則返回 False。如果設置開
始和結束位置下標,則在指定范圍內檢查。
endswith()::檢查字元串是否是以指定⼦串結尾,是則返回 True,否則返回 False。如果設置開
始和結束位置下標,則在指定范圍內檢查。
isalpha():如果字元串⾄少有⼀個字元並且所有字元都是字⺟則返回 True, 否則返回 False。
isdigit():如果字元串只包含數字則返回 True 否則返回 False。
isalnum():如果字元串⾄少有⼀個字元並且所有字元都是字⺟或數字則返 回 True,否則返回
False。
4. 資料庫中的空值與NULL的區別以及python中的NaN和None
NULL表示:不可用、未賦值、不知道、不適用,它既不是0也不是空格。記住:一個數值與NULL進行四則運算,其結果是NULL
空值和NULL的區別在於,在做count計算的時候:count(field_name),field_name的值為空值也會被計算在裡面(這一行統計有效),而NULL不會
python有兩種方式獲取數據:
1. 一種是把數據從MySQL中導出到txt或者csv,然後本地讀取;
2. 另一種是python直接鏈接資料庫,讀取數據;
第一種把數據從MYSQL導出後,python讀取時,空值和NULL在文件中都為NULL;Python讀取之後為NaN
第二種鏈接資料庫後,python能讀取表結構,資料庫的NULL對應列表中的None以及pandas中的NaN(如果欄位類型是時間,則為NaT)。而資料庫中的空字元,則被識別為空字元。