excel应用python处理数据_python如何处理excel

‘壹’ python之excel操作

在数据处理方面，Python 一直扮演着重要的角色，对于 Excel 操作，它有着完整且成熟的第三方库，使用也较为简单。

Python 中常用 Excel 操作库如下：

向 Excel 中写入一些数据。

通过 pip install xlwt 命令安装。

执行结果：

通过 pip install XlsxWriter 命令安装。

XlsxWriter 可以很方便的生成图表。

执行结果：

我们使用 xlrd 读取之前写入的数据，使用 pip install xlrd 命令安装。

之前写入的数据还有一个平均年龄是空着的，我们先读取之前写入的数据，再计算出平均值，最后将平均值写入。这里要用到 xlutils 模块，使用 pip install xlutils 安装。

执行结果：

‘贰’ python处理excel完整版

**1.2.1 新建保存工作簿(覆盖创建）

获取当前活动工作表的：

以索引值方式获取工作表：

以工作表名获取： wb['工作表名']，注意，此表达方式为切片显示，所以没有成员提示。很少用

循环工作表：很好用，一般用sheetnames

获取所有工作表名：wb.sheetnames

获取指定工作表名

修改工作表名称

新建工作表时的默认工作表名：

workbook.remove(工作表)

A1 表示法： 工作表['A1'] ，R1C1 表示法：工作表.cell(行号,列号)

2.工作表['起始行号': '结束行号']或者工作表['起始行号: 结束行号']，此方法是按行读取的数据。

3.工作表['起始列号': '结束列号']或者工作表['起始列号: 结束列号']，
此方法是按列读取的数据。

4.获取（按行）指定工作表所有已用数据：
list(workbook.worksheets[索引值].values)

按行求和（方法 1）

按行求和（方法）

按列统计平均值

按行获取工作表使用区域数据：worksheet.rows

按列获取工作表使用区域数据：worksheet.columns
获取工作表中最小行号：worksheet.min_row
获取工作表中最小列号：worksheet.min_column
获取工作表中最大行号：worksheet.max_row
获取工作表中最大列号：worksheet.max_column
获取单元格的行号：cell.row
获取单元格的列号：cell.column iter
方法获取指定区域：
1.按行获取指定工作表单元格区域：worksheet.iter_rows(……)
2.按列获取指定工作表单元格区域：worksheet.iter_cols(……)
可以通过 min_row、min_col、max_col、max_row 这几个参数进行单元格区域的控制

A1 表示法：工作表['A1']=值，R1C1 表示法：工作表.cell(行号,列号,值)

在最后一行写入数据：工作表.append(列表)

1.10.2 实例应用（九九乘法表）

最后加一列写优秀

‘叁’ python处理EXCEL数据

能提供一个样例文件或截个图看下具体是怎样的格式

‘肆’ Python处理Excel文件(csv, xls, xlsx)

Excel文件格式主要有csv，xlsx和xlsx，对于不同的格式，我们使用不同的包来进行处理。

其中， encoding='utf-8-sig' 是为了编码正常可以正确显示中文， spamreader 中的每一个 row 为list格式，可以循环取出每个单元格的值。

结果：

如果csv文件是数据类的，那么使用 pandas 包读写数据会更方便。

结果：

参数：

结果：

参数：

Excel文件有三层对象：工作薄、工作表和三元格，分别对应 openpyxl 包中的workbook、sheet和cell。

注： openpyxl 功能全面，还支持：合并单元格、数学运算、单元格格式、迭代器 ws.iter_rows() 操作等。

注： xlrd 打开为只读模式，不可修改。

结果：

‘伍’ 利用Python处理Excel数据

如果数据没有标题行，可用pandas添加默认的列名

不读取哪里数据，可用skiprows=[i]，跳过文件的第i行不读取

第一次出现的保留，其余删除

最后一次出现的保留，其余删除

** 对客户聊天记录进行分组 **

** 对符合多个条件进行分组**

需要对每一行进行权重设置，列表行数少可行，过多不可行
假设有4行数据，设置采样权重

自动生成数据的数量，均值，标准差等数据

相关系数在-1到1之间，接近1为正相关，接近-1为负相关，0为不相关

参考书籍：
《利用pythonj进行数据分析》
《从Excel到Python——数据分析进阶指南》

‘陆’ python可以处理excel数据吗

python处理excel数据的方法：1、使用xlrd来处理；2、使用【xlutils+xlrd】来处理；3、使用xlwt来处理；4、使用pyExcelerator来处理；5、使用Pandas库来处理。

‘柒’ 怎样用python，读取excel中的一列数据

用python读取excel中的一列数据步骤如下：

1、首先打开dos命令窗，安装必须的两个库，命令是：pip3 installxlrd；Pip3 install xlwt。

‘捌’ python如何处理excel

您好，方法
1、在python项目中，新建python文件，并依次导入xlrd和xlwt。
2、接着调用open_workbook()方法，打开一个excel文件。
3、调用sheet_by_name()方法，读取文件的sheet页。
4、如果是后面加了个s，sheet_names表示获取excel中所有的sheet页。
5、利用sheets()方法加序号，可以获取某个sheet页对象。
6、如果想要获取excel某个sheet页中记录的总数，使用nrows。
7、在cell()中传入两个值，一个行一个列，然后value获取对应单元格的值。

‘玖’ Python处理Excel效率高十倍(下篇)通篇硬干货，再也不用加班啦

《用Python处理Excel表格》下篇来啦！

身为工作党或学生党的你，平日里肯定少不了与Excel表格打交道的机会。当你用Excel处理较多数据时，还在使用最原始的人工操作吗？现在教你如何用Python处理Excel，从此处理表格再也不加班，时间缩短数十倍！

上篇我们进行了一些事前准备，目的是用Python提取Excel表中的数据。而这一篇便是在获取数据的基础上，对Excel表格的实操处理。

第9行代码用来指定创建的excel的活动表的名字：
·不写第9行，默认创建sheet
·写了第9行，创建指定名字的sheet表

第9行代码，通过给单元格重新赋值，来修改单元格的值
第9行代码的另一种写法sheet['B1'].value = 'age'
第10行代码，保存时如果使用原来的（第7行）名字，就直接保存；如果使用了别的名字，就会另存为一个新文件

插入有效数据
使用append()方法，在原来数据的后面，按行插入数据

·insert_rows(idx=数字编号, amount=要插入的行数)，插入的行数是在idx行数的下方插入
·insert_cols(idx=数字编号, amount=要插入的列数)，插入的位置是在idx列数的左侧插入

·delete_rows(idx=数字编号, amount=要删除的行数)
·delete_cols(idx=数字编号, amount=要删除的列数)

move_range(“数据区域”,rows=,cols=)：正整数为向下或向右、负整数为向左或向上

举个例子：

openpyxl.styles.Font(name=字体名称,size=字体大小,bold=是否加粗,italic=是否斜体,color=字体颜色)
其中，字体颜色中的color是RGB的16进制表示

再者，可以使用for循环，修改多行多列的数据，在这里介绍了获取的方法

Alignment(horizontal=水平对齐模式,vertical=垂直对齐模式,text_rotation=旋转角度,wrap_text=是否自动换行)
水平对齐：‘distributed’，‘justify’，‘center’，‘left’， ‘centerContinuous’，'right，‘general’
垂直对齐：‘bottom’，‘distributed’，‘justify’，‘center’，‘top’

当然，你仍旧可以调用for循环来实现对多行多列的操作

设置行列的宽高：
·row_dimensions[行编号].height = 行高
·column_dimensions[列编号].width = 列宽

合并单元格有下面两种方法，需要注意的是，如果要合并的格子中有数据，即便python没有报错，Excel打开的时候也会报错。
merge_cells(待合并的格子编号)
merge_cells(start_row=起始行号，start_column=起始列号，end_row=结束行号，end_column=结束列号)

拆分单元格的方法同上
unmerge_cells(待合并的格子编号)
unmerge_cells(start_row=起始行号，start_column=起始列号，end_row=结束行号，end_column=结束列号)

create_sheet(“新的sheet名”)：创建一个新的sheet表

第11行，使用title修改sheet表的名字

remove(“sheet名”)：删除某个sheet表
要删除某sheet表，需要激活这个sheet表，即：将其作为活动表（关于活动表的定义请看前面文章开头写的有）下面8~11行代码展示了原始活动表与手动更换活动表，第13行代码删掉活动表

背景知识
numpy与pandas
NumPy是 Python 语言的一个扩展程序库，支持大量的维度数组与矩阵运算，此外也针对数组运算提供大量的数学函数库；pandas 是基于NumPy 的一种工具，该工具是为解决数据分析任务而创建的，我们需要利用Pandas进行Excel的合并

1.下面的代码生成了一个5行3列的包含15个字符的嵌套列表
（注意，第4行代码：15是等于35的，如果是15对应43，或者16对应5*3都会报错）
（注意，第5行代码，虽然5行3列是15个数据，但是可以指定数据从1开头，到16结束）

2.添加表头
使用pandas库的DataFrame来添加表头。关于打印的结果，把最左侧的一列去掉之后会发现结果很和谐，这是因为最左侧的一列代表行号。此时xx变量的类型是

xlsxwriter模块一般是和xlrd模块搭配使用的，
xlsxwriter：负责写入数据，
xlrd：负责读取数据。

1.创建一个工作簿

2.创建sheet表

3.写入数据

‘拾’ python处理excel的优势有什么

① 相比Excel，Python能够处理更大的数据集;能够更容易的实现自动化分析;能够比较容易的建立复杂的机器学习模型;

② 相比spss，spss是个统计软件，只适合在科学研究领域做实验数据的分析，并不适合做偏向实际应用场景的数据的分析;而Python能够处理复杂的数据逻辑，适合这些场景;

③ 相比R语言，Python的机器学习库只有一个—sklearn，所有的机器学习方法都集中在这一个库中，而R语言，我们并不清楚它到底有多少个用来做机器学习的库，R语言中的机器学习方法是如此的分散，以至于很难掌握。而且Python的使用人数在不断上升，有一些曾经只使用R的人在转向Python，投入到一个呈现上升趋势的技术中，未来才会更加宽广。

④ 相比上述的几个工具，Python在做机器学习，网络爬虫，大数据分析时更加的得心应手。

因为Python拥有像海一样丰富的第三方库，所以Python在数据分析方面能够处理的问题非常之广，从Excel比较擅长的公式计算，数据透视分析，到MATLAB比较擅长的科学计算，再到R语言中那些零散的机器学习库所能做的事情，Python都能优雅从容的面对。而这些工具不擅长的网络爬虫，大数据分析(结合spark)，Python更是能够出色的完成。

导航:首页 > 编程语言 > excel应用python处理数据

excel应用python处理数据

与excel应用python处理数据相关的资料