用python整理表格數據_python對資料庫表格裡面的內容增刪查改怎麼寫

① python中操作Excel最好用的模塊是

Python中的模塊也稱為庫，在Python中操作Excel的模塊有很多。

優缺點如下：

**1、Pandas模塊**

Pandas是Python的一一個開源數據分析模塊，可用於數據挖掘和數據分析，同時也提供數據清洗功能，可以說它是日前Python數據分析的必備工具之一。Pandas能夠處理類似電子表格的數據，用於數據快速載入、操作、對齊、合並、數據預處理等。

Pandas通過對Excel文件的讀寫實現數據輸入、輸出，Pandas支持.xls和.xlsx格式文件的讀寫，支持只載入每個表的單一工作頁。

import pandas as pd

df=pd.read_excel(r'E:ban.xlsx') #pandas 導入庫獲取excel表的數據內容

df`

**2、xlwings模塊**

xlwings模塊可以實現Python中調用Excel，也可以從Excel調用Python，這個模塊支持支持.xls和.xlsx格式文件的讀寫，支持對這類文件的操作，還支持使用VBA，具有強大的轉換功能，並且可以處理大部分數據類型。

**3、Xlrd模塊**

xlrd模塊可以讀取Excel文件，其對Excel文件的讀取可以實現比較精細的控制。雖然現在使用Pandas模塊讀取和保存Excel文件往往更加方便快捷，但在某些場景下，依然需要xlrd這種更底層的模塊來實現對Excel文件讀取的控制。

xlrd模塊支持.xls、.xlsx格式文件的讀取，但不支持寫信息。

**4、xlwt模塊**

前面xlrd模塊可以讀取Excel文件，但不能寫。而xlwt模塊可以寫、可以修改Excel文件，但不能讀，且只支持.xls格式文件的寫操作。

**5、xlutils模塊**

xlutils也是一個處理Excel文件的模塊，但它不能對Excel文件進行讀和寫的操作，但依賴於xlrd模塊和xlwt模塊。xlutils模塊支持.xls格式文件，不支持.xlsx格式文件。

**6、openpyxl模塊**

openpyxl模塊可以對.xlsx格式的Excel文件進行讀寫操作，特點是讀取快、寫入慢，且不能操作.xls格式文件。

**7、xlsxwriter模塊**

xlsxwriter模塊支持多種Excel功能，可以寫.xlsx格式的Excel文件，而且速度快、佔用內存空間小，但不支持讀或者修改現有的Excel文件。

**8、win32com模塊**

win32com模塊支持.xls、.xlsx格式的Excel文件的讀、寫和修改，讀寫速度快。但win32com模塊存在於pywin32的模塊中，自身沒有完善的文檔，使用起來不太方便。

**9、分析總結**

Pandas模塊把Excel當作數據讀寫的容器，為其強大的數據分析服務，因此讀寫性能的表現中規中矩。xlwings和win32com這兩個模塊都擁有很好的讀寫性能，強大的轉換器可以處理大部分數據類型，同時，可以在程序運行時，在打開的Excel文件中進行實時操作，實現過程的可視化。另外，xlwings模塊的數據結構轉換器使其可以快速地為Excel文件添加二維數據結構，而不需要在Excel文件中重定位數據的行和列，因此筆者認為，從讀寫的便捷性來看，xlwings模塊比較好用一些。

② python對資料庫表格裡面的內容增刪查改怎麼寫

本文主要給大家介紹了關於python模擬sql語句對員工表格進行增刪改查的相關內容，分享出來供大家參考學習，下面來一起看看詳細的介紹：
具體需求:
員工信息表程序，實現增刪改查操作：
可進行模糊查詢，語法支持下面3種:
select name,age from staff_data where age > 22 多個查詢參數name,age 用','分割
select * from staff_data where dept = 人事
select * from staff_data where enroll_date like 2013
查到的信息，列印後，最後面還要顯示查到的條數
可創建新員工紀錄，以phone做唯一鍵，phone存在即提示,staff_id需自增,添加多個記錄record1/record2中間用'/'分割
insert into staff_data values record1/record2
可刪除指定員工信息紀錄，輸入員工id，即可刪除
delete from staff_data where staff_id>=5andstaff_id<=10
可修改員工信息，語法如下:
update staff_table set dept=Market,phone=13566677787 where dept = 運維多個set值用','分割
使用re模塊,os模塊,充分使用函數精簡代碼,熟練使用 str.split()來解析格式化字元串
由於,sql命令中的幾個關鍵字元串有一定規律,只出現一次,並且有順序!!!
按照key_lis = ['select', 'insert', 'delete', 'update', 'from', 'into', 'set', 'values', 'where', 'limit']的元素順序分割sql.
分割元素作為sql_dic字典的key放進字典中.分割後的列表為b,如果len(b)>1,說明sql字元串中含有分割元素,同時b[0]對應上一個分割元素的值,b[-1]為下一次分割對象!
這樣不斷迭代直到把sql按出現的所有分割元素分割完畢,但注意這里每次循環都是先分割後賦值!!!當前分割元素比如'select'對應的值,需要等到下一個分割元素
比如'from'執行分割後的列表b,其中b[0]的值才會賦值給sql_dic['select'] ,所以最後一個分割元素的值,不能通過上述循環來完成,必須先處理可能是最後一個分割元素,再正常循環!!
在這sql語句中,有可能成為最後一個分割元素的 'limit' ,'values', 'where', 按優先順序別,先處理'limit' ,再處理'values'或 'where'.....
處理完得到sql_dic後,就是你按不同命令執行,對數據文件的增刪改查,最後返回處理結果!!
示例代碼# _*_coding:utf-8_*_# Author:Jaye Heimport reimport os def sql_parse(sql, key_lis): ''' 解析sql命令字元串,按照key_lis列表裡的元素分割sql得到字典形式的命令sql_dic :param sql: :param key_lis: :return: ''' sql_list = [] sql_dic = {} for i in key_lis: b = [j.strip() for j in sql.split(i)] if len(b) > 1: if len(sql.split('limit')) > 1: sql_dic['limit'] = sql.split('limit')[-1] if i == 'where' or i == 'values': sql_dic[i] = b[-1] if sql_list: sql_dic[sql_list[-1]] = b[0] sql_list.append(i) sql = b[-1] else: sql = b[0] if sql_dic.get('select'): if not sql_dic.get('from') and not sql_dic.get('where'): sql_dic['from'] = b[-1] if sql_dic.get('select'): sql_dic['select'] = sql_dic.get('select').split(',') if sql_dic.get('where'): sql_dic['where'] = where_parse(sql_dic.get('where')) return sql_dic def where_parse(where): ''' 格式化where字元串為列表where_list,用'and', 'or', 'not'分割字元串 :param where: :return: ''' casual_l = [where] logic_key = ['and', 'or', 'not'] for j in logic_key: for i in casual_l: if i not in logic_key: if len(i.split(j)) > 1: ele = i.split(j) index = casual_l.index(i) casual_l.pop(index) casual_l.insert(index, ele[0]) casual_l.insert(index+1, j) casual_l.insert(index+2, ele[1]) casual_l = [k for k in casual_l if k] where_list = three_parse(casual_l, logic_key) return where_list def three_parse(casual_l, logic_key): ''' 處理臨時列表casual_l中具體的條件,'staff_id>5'-->['staff_id','>','5'] :param casual_l: :param logic_key: :return: ''' where_list = [] for i in casual_l: if i not in logic_key: b = i.split('like') if len(b) > 1: b.insert(1, 'like') where_list.append(b) else: key = ['<', '=', '>'] new_lis = [] opt = '' lis = [j for j in re.split('([=<>])', i) if j] for k in lis: if k in key: opt += k else: new_lis.append(k) new_lis.insert(1, opt) where_list.append(new_lis) else: where_list.append(i) return where_list def sql_action(sql_dic, title): ''' 把解析好的sql_dic分發給相應函數執行處理 :param sql_dic: :param title: :return: ''' key = {'select': select, 'insert': insert, 'delete': delete, 'update': update} res = [] for i in sql_dic: if i in key: res = key[i](sql_dic, title) return res def select(sql_dic, title): ''' 處理select語句命令 :param sql_dic: :param title: :return: ''' with open('staff_data', 'r', encoding='utf-8') as fh: filter_res = where_action(fh, sql_dic.get('where'), title) limit_res = limit_action(filter_res, sql_dic.get('limit')) search_res = search_action(limit_res, sql_dic.get('select'), title) return search_res def insert(sql_dic, title): ''' 處理insert語句命令 :param sql_dic: :param title: :return: ''' with open('staff_data', 'r+', encoding='utf-8') as f: data = f.readlines() phone_list = [i.strip().split(',')[4] for i in data] ins_count = 0 if not data: new_id = 1 else: last = data[-1] last_id = int(last.split(',')[0]) new_id = last_id+1 record = sql_dic.get('values').split('/') for i in record: if i.split(',')[3] in phone_list: print('\033[1;31m%s 手機號已存在\033[0m' % i) else: new_record = '%s,%s\n' % (str(new_id), i) f.write(new_record) new_id += 1 ins_count += 1 f.flush() return ['insert successful'], [str(ins_count)] def delete(sql_dic, title): ''' 處理delete語句命令 :param sql_dic: :param title: :return: ''' with open('staff_data', 'r', encoding='utf-8') as r_file,\ open('staff_data_bak', 'w', encoding='utf-8') as w_file: del_count = 0 for line in r_file: dic = dict(zip(title.split(','), line.split(','))) filter_res = logic_action(dic, sql_dic.get('where')) if not filter_res: w_file.write(line) else: del_count += 1 w_file.flush() os.remove('staff_data') os.rename('staff_data_bak', 'staff_data') return ['delete successful'], [str(del_count)] def update(sql_dic, title): ''' 處理update語句命令 :param sql_dic: :param title: :return: ''' set_l = sql_dic.get('set').strip().split(',') set_list = [i.split('=') for i in set_l] update_count = 0 with open('staff_data', 'r', encoding='utf-8') as r_file,\ open('staff_data_bak', 'w', encoding='utf-8') as w_file: for line in r_file: dic = dict(zip(title.split(','), line.strip().split(','))) filter_res = logic_action(dic, sql_dic.get('where')) if filter_res: for i in set_list: k = i[0] v = i[-1] dic[k] = v line = [dic[i] for i in title.split(',')] update_count += 1 line = ','.join(line)+'\n' w_file.write(line) w_file.flush() os.remove('staff_data') os.rename('staff_data_bak', 'staff_data') return ['update successful'], [str(update_count)] def where_action(fh, where_list, title): ''' 具體處理where_list里的所有條件 :param fh: :param where_list: :param title: :return: ''' res = [] if len(where_list) != 0: for line in fh: dic = dict(zip(title.split(','), line.strip().split(','))) if dic['name'] != 'name': logic_res = logic_action(dic, where_list) if logic_res: res.append(line.strip().split(',')) else: res = [i.split(',') for i in fh.readlines()] return res pass def logic_action(dic, where_list): ''' 判斷數據文件中每一條是否符合where_list條件 :param dic: :param where_list: :return: ''' logic = [] for exp in where_list: if type(exp) is list: exp_k, opt, exp_v = exp if exp[1] == '=': opt = '==' logical_char = "'%s'%s'%s'" % (dic[exp_k], opt, exp_v) if opt != 'like': exp = str(eval(logical_char)) else: if exp_v in dic[exp_k]: exp = 'True' else: exp = 'False' logic.append(exp) res = eval(' '.join(logic)) return res def limit_action(filter_res, limit_l): ''' 用列表切分處理顯示符合條件的數量 :param filter_res: :param limit_l: :return: ''' if limit_l: index = int(limit_l[0]) res = filter_res[:index] else: res = filter_res return res def search_action(limit_res, select_list, title): ''' 處理需要查詢並顯示的title和相應數據 :param limit_res: :param select_list: :param title: :return: ''' res = [] fields_list = title.split(',') if select_list[0] == '*': res = limit_res else: fields_list = select_list for data in limit_res: dic = dict(zip(title.split(','), data)) r_l = [] for i in fields_list: r_l.append((dic[i].strip())) res.append(r_l) return fields_list, res if __name__ == '__main__': with open('staff_data', 'r', encoding='utf-8') as f: title = f.readline().strip() key_lis = ['select', 'insert', 'delete', 'update', 'from', 'into', 'set', 'values', 'where', 'limit'] while True: sql = input('請輸入sql命令,退出請輸入exit:').strip() sql = re.sub(' ', '', sql) if len(sql) == 0:continue if sql == 'exit':break sql_dict = sql_parse(sql, key_lis) fields_list, fields_data = sql_action(sql_dict, title) print('\033[1;33m結果如下:\033[0m') print('-'.join(fields_list)) for data in fields_data: print('-'.join(data))

總結
以上就是這篇文章的全部內容了，希望本文的內容對大家的學習或者工作能帶來一定的幫助，如果有疑問大家可以留言交流，謝謝大家對腳本之家的支持。

③ Python利器：如何處理pdf表格數據

大家好，我是Peter~

在很多情況下，我們都需要處理PDF格式的文件。尤其當我們遇到PDF表格數據需要進行提取，真的是一個令人頭疼的問題。

因為PDF文件不能像Word那樣直接復制，即使復制了再黏貼也可能會出現格式排版錯亂甚至亂碼問題。如何從一個PDF文件提取出表格數據？本文提供兩個解決方案：

首先提供的一種方法是從文字 PDF 中提取表格信息的工具：Camelot，它能夠直接將大部分表格轉換為 Pandas 的 Dataframe。

更多的詳細信息，請參考項目地址： https://github.com/camelot-dev/camelot

camelot的安裝有多種方式。如果有報錯，網上一般有解決方式：

1、通過conda安裝

2、使用pip進行安裝

3、通過GitHub進行安裝

首先將項目復制到本地：

然後進入文件中進行安裝：

下面通過一個案例來講解如何使用camelot。假設我們現在有一個只有一頁的PDF文件test.pdf：

1、先讀取文件

導出成csv格式的數據（方式1）

查看tables的相關信息：

導出方式2：

將數據轉換成DataFrame：

tabula的功能比camelot更加強大，可以同時對多個表格數據進行提取。項目的具體地址請參考： https://github.com/chezou/tabula-py

tabula的安裝是非常簡單的：

安裝之後檢驗這個庫是否安裝成功：

通過tabula這個庫來讀取PDF文件：

然後我們發現列表中唯一的一個元素就是dataframe：

將讀取到的數據輸出成CSV格式的文件：

上面讀取的PDF文件是比較簡單的，只有一頁，而且剛好是一個很標準的表格形式的數據，下面看一個比較復雜的例子：

下面是第一頁，第一列可以看成是索引：

在第二頁中有兩份表格，而且中間有很多的空白行：

第三頁的數據比較標准：

這3頁是在同一個PDF文件中，這3頁是在同一個PDF文件中，這3頁是在同一個PDF文件中

上面的紅色提示中我們看到：當沒有指定pages參數的時候，只會默認讀取第一頁的數據，所以列表的長度為1。

轉成dataframe後將原來的索引變成新的一列 （部分數據）

通過pages來讀取全部數據：

通過指定pages="all"：

同時獲取兩個表格的數據：

通過area參數來指定：

刪除在讀取的表格中我們不需要的欄位信息

可以將得到的數據輸出成不同格式的文件，以json格式為例：

我們可以看到

④ Python處理Excel效率高十倍(下篇)通篇硬幹貨，再也不用加班啦

《用Python處理Excel表格》下篇來啦！

身為工作黨或學生黨的你，平日里肯定少不了與Excel表格打交道的機會。當你用Excel處理較多數據時，還在使用最原始的人工操作嗎？現在教你如何用Python處理Excel，從此處理表格再也不加班，時間縮短數十倍！

上篇我們進行了一些事前准備，目的是用Python提取Excel表中的數據。而這一篇便是在獲取數據的基礎上，對Excel表格的實操處理。

第9行代碼用來指定創建的excel的活動表的名字：
·不寫第9行，默認創建sheet
·寫了第9行，創建指定名字的sheet表

第9行代碼，通過給單元格重新賦值，來修改單元格的值
第9行代碼的另一種寫法sheet['B1'].value = 'age'
第10行代碼，保存時如果使用原來的（第7行）名字，就直接保存；如果使用了別的名字，就會另存為一個新文件

插入有效數據
使用append()方法，在原來數據的後面，按行插入數據

·insert_rows(idx=數字編號, amount=要插入的行數)，插入的行數是在idx行數的下方插入
·insert_cols(idx=數字編號, amount=要插入的列數)，插入的位置是在idx列數的左側插入

·delete_rows(idx=數字編號, amount=要刪除的行數)
·delete_cols(idx=數字編號, amount=要刪除的列數)

move_range(「數據區域」,rows=,cols=)：正整數為向下或向右、負整數為向左或向上

舉個例子：

openpyxl.styles.Font(name=字體名稱,size=字體大小,bold=是否加粗,italic=是否斜體,color=字體顏色)
其中，字體顏色中的color是RGB的16進製表示

再者，可以使用for循環，修改多行多列的數據，在這里介紹了獲取的方法

Alignment(horizontal=水平對齊模式,vertical=垂直對齊模式,text_rotation=旋轉角度,wrap_text=是否自動換行)
水平對齊：『distributed』，『justify』，『center』，『left』，『centerContinuous』，'right，『general』
垂直對齊：『bottom』，『distributed』，『justify』，『center』，『top』

當然，你仍舊可以調用for循環來實現對多行多列的操作

設置行列的寬高：
·row_dimensions[行編號].height = 行高
·column_dimensions[列編號].width = 列寬

合並單元格有下面兩種方法，需要注意的是，如果要合並的格子中有數據，即便python沒有報錯，Excel打開的時候也會報錯。
merge_cells(待合並的格子編號)
merge_cells(start_row=起始行號，start_column=起始列號，end_row=結束行號，end_column=結束列號)

拆分單元格的方法同上
unmerge_cells(待合並的格子編號)
unmerge_cells(start_row=起始行號，start_column=起始列號，end_row=結束行號，end_column=結束列號)

create_sheet(「新的sheet名」)：創建一個新的sheet表

第11行，使用title修改sheet表的名字

remove(「sheet名」)：刪除某個sheet表
要刪除某sheet表，需要激活這個sheet表，即：將其作為活動表（關於活動表的定義請看前面文章開頭寫的有）下面8~11行代碼展示了原始活動表與手動更換活動表，第13行代碼刪掉活動表

背景知識
numpy與pandas
NumPy是 Python 語言的一個擴展程序庫，支持大量的維度數組與矩陣運算，此外也針對數組運算提供大量的數學函數庫；pandas 是基於NumPy 的一種工具，該工具是為解決數據分析任務而創建的，我們需要利用Pandas進行Excel的合並

1.下面的代碼生成了一個5行3列的包含15個字元的嵌套列表
（注意，第4行代碼：15是等於35的，如果是15對應43，或者16對應5*3都會報錯）
（注意，第5行代碼，雖然5行3列是15個數據，但是可以指定數據從1開頭，到16結束）

2.添加表頭
使用pandas庫的DataFrame來添加表頭。關於列印的結果，把最左側的一列去掉之後會發現結果很和諧，這是因為最左側的一列代錶行號。此時xx變數的類型是

xlsxwriter模塊一般是和xlrd模塊搭配使用的，
xlsxwriter：負責寫入數據，
xlrd：負責讀取數據。

1.創建一個工作簿

2.創建sheet表

3.寫入數據

導航:首頁 > 編程語言 > 用python整理表格數據

用python整理表格數據

與用python整理表格數據相關的資料