导航:首页 > 编程语言 > excel应用python处理数据

excel应用python处理数据

发布时间:2022-12-22 21:45:34

‘壹’ python之excel操作

在数据处理方面,Python 一直扮演着重要的角色,对于 Excel 操作,它有着完整且成熟的第三方库,使用也较为简单。

Python 中常用 Excel 操作库如下:

向 Excel 中写入一些数据。

通过 pip install xlwt 命令安装。

执行结果:

通过 pip install XlsxWriter 命令安装。

XlsxWriter 可以很方便的生成图表。

执行结果:

我们使用 xlrd 读取之前写入的数据,使用 pip install xlrd 命令安装。

之前写入的数据还有一个平均年龄是空着的,我们先读取之前写入的数据,再计算出平均值,最后将平均值写入。这里要用到 xlutils 模块,使用 pip install xlutils 安装。

执行结果:

‘贰’ python处理excel完整版

**1.2.1 新建保存工作簿(覆盖创建)

获取当前活动工作表的:

以索引值方式获取工作表:

以工作表名获取: wb['工作表名'],注意,此表达方式为切片显示,所以没有成员提示。很少用

循环工作表:很好用,一般用sheetnames

获取所有工作表名:wb.sheetnames

获取指定工作表名

修改工作表名称

新建工作表时的默认工作表名:

workbook.remove(工作表)

A1 表示法: 工作表['A1'] ,R1C1 表示法:工作表.cell(行号,列号)

2.工作表['起始行号': '结束行号']或者工作表['起始行号: 结束行号'],此方法是按行读取的数据。

3.工作表['起始列号': '结束列号']或者工作表['起始列号: 结束列号'],
此方法是按列读取的数据。

4.获取(按行)指定工作表所有已用数据:
list(workbook.worksheets[索引值].values)

按行求和(方法 1)

按行求和(方法 )

按列统计平均值

按行获取工作表使用区域数据:worksheet.rows

按列获取工作表使用区域数据:worksheet.columns
获取工作表中最小行号:worksheet.min_row
获取工作表中最小列号:worksheet.min_column
获取工作表中最大行号:worksheet.max_row
获取工作表中最大列号:worksheet.max_column
获取单元格的行号:cell.row
获取单元格的列号:cell.column iter
方法获取指定区域:
1.按行获取指定工作表单元格区域:worksheet.iter_rows(……)
2.按列获取指定工作表单元格区域:worksheet.iter_cols(……)
可以通过 min_row、min_col、max_col、max_row 这几个参数进行单元格区域的控制

A1 表示法:工作表['A1']=值,R1C1 表示法:工作表.cell(行号,列号,值)

在最后一行写入数据:工作表.append(列表)

1.10.2 实例应用(九九乘法表)

最后加一列写优秀

‘叁’ python处理EXCEL数据

能提供一个样例文件或截个图看下具体是怎样的格式

‘肆’ Python处理Excel文件(csv, xls, xlsx)

Excel文件格式主要有csv,xlsx和xlsx,对于不同的格式,我们使用不同的包来进行处理。

其中, encoding='utf-8-sig' 是为了编码正常可以正确显示中文, spamreader 中的每一个 row 为list格式,可以循环取出每个单元格的值。

结果:

如果csv文件是数据类的,那么使用 pandas 包读写数据会更方便。

结果:

参数:

结果:

参数:

Excel文件有三层对象:工作薄、工作表和三元格,分别对应 openpyxl 包中的workbook、sheet和cell。

: openpyxl 功能全面,还支持:合并单元格、数学运算、单元格格式、迭代器 ws.iter_rows() 操作等。

: xlrd 打开为只读模式,不可修改。

结果:

结果:

‘伍’ 利用Python处理Excel数据

如果数据没有标题行,可用pandas添加默认的列名

不读取哪里数据,可用skiprows=[i],跳过文件的第i行不读取

第一次出现的保留,其余删除

最后一次出现的保留,其余删除

** 对客户聊天记录进行分组 **

** 对符合多个条件进行分组**

需要对每一行进行权重设置,列表行数少可行,过多不可行
假设有4行数据,设置采样权重

自动生成数据的数量,均值,标准差等数据

相关系数在-1到1之间,接近1为正相关,接近-1为负相关,0为不相关

参考书籍:
《利用pythonj进行数据分析》
《从Excel到Python——数据分析进阶指南》

‘陆’ python可以处理excel数据吗

python处理excel数据的方法:1、使用xlrd来处理;2、使用【xlutils+xlrd】来处理;3、使用xlwt来处理;4、使用pyExcelerator来处理;5、使用Pandas库来处理。

‘柒’ 怎样用python,读取excel中的一列数据

用python读取excel中的一列数据步骤如下:

1、首先打开dos命令窗,安装必须的两个库,命令是:pip3 installxlrd;Pip3 install xlwt。

‘捌’ python如何处理excel

您好,方法
1、在python项目中,新建python文件,并依次导入xlrd和xlwt。
2、接着调用open_workbook()方法,打开一个excel文件。
3、调用sheet_by_name()方法,读取文件的sheet页。
4、如果是后面加了个s,sheet_names表示获取excel中所有的sheet页。
5、利用sheets()方法加序号,可以获取某个sheet页对象。
6、如果想要获取excel某个sheet页中记录的总数,使用nrows。
7、在cell()中传入两个值,一个行一个列,然后value获取对应单元格的值。

‘玖’ Python处理Excel效率高十倍(下篇)通篇硬干货,再也不用加班啦

《用Python处理Excel表格》下篇来啦!

身为工作党或学生党的你,平日里肯定少不了与Excel表格打交道的机会。当你用Excel处理较多数据时,还在使用最原始的人工操作吗?现在教你如何用Python处理Excel,从此处理表格再也不加班,时间缩短数十倍!

上篇我们进行了一些事前准备,目的是用Python提取Excel表中的数据。而这一篇便是在获取数据的基础上,对Excel表格的实操处理。

第9行代码用来指定创建的excel的活动表的名字:
·不写第9行,默认创建sheet
·写了第9行,创建指定名字的sheet表

第9行代码,通过给单元格重新赋值,来修改单元格的值
第9行代码的另一种写法sheet['B1'].value = 'age'
第10行代码,保存时如果使用原来的(第7行)名字,就直接保存;如果使用了别的名字,就会另存为一个新文件

插入有效数据
使用append()方法,在原来数据的后面,按行插入数据

·insert_rows(idx=数字编号, amount=要插入的行数),插入的行数是在idx行数的下方插入
·insert_cols(idx=数字编号, amount=要插入的列数),插入的位置是在idx列数的左侧插入

·delete_rows(idx=数字编号, amount=要删除的行数)
·delete_cols(idx=数字编号, amount=要删除的列数)

move_range(“数据区域”,rows=,cols=):正整数为向下或向右、负整数为向左或向上

举个例子:

openpyxl.styles.Font(name=字体名称,size=字体大小,bold=是否加粗,italic=是否斜体,color=字体颜色)
其中,字体颜色中的color是RGB的16进制表示

再者,可以使用for循环,修改多行多列的数据,在这里介绍了获取的方法

Alignment(horizontal=水平对齐模式,vertical=垂直对齐模式,text_rotation=旋转角度,wrap_text=是否自动换行)
水平对齐:‘distributed’,‘justify’,‘center’,‘left’, ‘centerContinuous’,'right,‘general’
垂直对齐:‘bottom’,‘distributed’,‘justify’,‘center’,‘top’

当然,你仍旧可以调用for循环来实现对多行多列的操作

设置行列的宽高:
·row_dimensions[行编号].height = 行高
·column_dimensions[列编号].width = 列宽

合并单元格有下面两种方法,需要注意的是,如果要合并的格子中有数据,即便python没有报错,Excel打开的时候也会报错。
merge_cells(待合并的格子编号)
merge_cells(start_row=起始行号,start_column=起始列号,end_row=结束行号,end_column=结束列号)

拆分单元格的方法同上
unmerge_cells(待合并的格子编号)
unmerge_cells(start_row=起始行号,start_column=起始列号,end_row=结束行号,end_column=结束列号)

create_sheet(“新的sheet名”):创建一个新的sheet表

第11行,使用title修改sheet表的名字

remove(“sheet名”):删除某个sheet表
要删除某sheet表,需要激活这个sheet表,即:将其作为活动表(关于活动表的定义请看前面文章开头写的有)下面8~11行代码展示了原始活动表与手动更换活动表,第13行代码删掉活动表

背景知识
numpy与pandas
NumPy是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库;pandas 是基于NumPy 的一种工具,该工具是为解决数据分析任务而创建的,我们需要利用Pandas进行Excel的合并

1.下面的代码生成了一个5行3列的包含15个字符的嵌套列表
(注意,第4行代码:15是等于35的,如果是15对应43,或者16对应5*3都会报错)
(注意,第5行代码,虽然5行3列是15个数据,但是可以指定数据从1开头,到16结束)

2.添加表头
使用pandas库的DataFrame来添加表头。关于打印的结果,把最左侧的一列去掉之后会发现结果很和谐,这是因为最左侧的一列代表行号。此时xx变量的类型是

xlsxwriter模块一般是和xlrd模块搭配使用的,
xlsxwriter:负责写入数据,
xlrd:负责读取数据。

1.创建一个工作簿

2.创建sheet表

3.写入数据

‘拾’ python处理excel的优势有什么

① 相比Excel,Python能够处理更大的数据集;能够更容易的实现自动化分析;能够比较容易的建立复杂的机器学习模型;


② 相比spss,spss是个统计软件,只适合在科学研究领域做实验数据的分析,并不适合做偏向实际应用场景的数据的分析;而Python能够处理复杂的数据逻辑,适合这些场景;


③ 相比R语言,Python的机器学习库只有一个—sklearn,所有的机器学习方法都集中在这一个库中,而R语言,我们并不清楚它到底有多少个用来做机器学习的库,R语言中的机器学习方法是如此的分散,以至于很难掌握。而且Python的使用人数在不断上升,有一些曾经只使用R的人在转向Python,投入到一个呈现上升趋势的技术中,未来才会更加宽广。



④ 相比上述的几个工具,Python在做机器学习,网络爬虫,大数据分析时更加的得心应手。


因为Python拥有像海一样丰富的第三方库,所以Python在数据分析方面能够处理的问题非常之广,从Excel比较擅长的公式计算,数据透视分析,到MATLAB比较擅长的科学计算,再到R语言中那些零散的机器学习库所能做的事情,Python都能优雅从容的面对。而这些工具不擅长的网络爬虫,大数据分析(结合spark),Python更是能够出色的完成。

阅读全文

与excel应用python处理数据相关的资料

热点内容
dvd光盘存储汉子算法 浏览:757
苹果邮件无法连接服务器地址 浏览:963
phpffmpeg转码 浏览:671
长沙好玩的解压项目 浏览:145
专属学情分析报告是什么app 浏览:564
php工程部署 浏览:833
android全屏透明 浏览:737
阿里云服务器已开通怎么办 浏览:803
光遇为什么登录时服务器已满 浏览:302
PDF分析 浏览:485
h3c光纤全工半全工设置命令 浏览:143
公司法pdf下载 浏览:382
linuxmarkdown 浏览:350
华为手机怎么多选文件夹 浏览:683
如何取消命令方块指令 浏览:349
风翼app为什么进不去了 浏览:778
im4java压缩图片 浏览:362
数据查询网站源码 浏览:150
伊克塞尔文档怎么进行加密 浏览:892
app转账是什么 浏览:163