Ⅰ 用python找出一篇文章中词频最高的20个单词
import re
from collections import Counter
from matplotlib.pyplot import pie,show
f = 't.txt'
c = Counter(re.findall(r'(w{3,})',open(f).read().lower())).most_common(20)
pie([i[1] for i in c],labels=[i[0] for i in c])
show()
Ⅱ python中split的具体用法
words = line.split(" ")
读入一行字符Line 以空格“ ”分隔词 返回一堆单词列表list
Ⅲ 想问下,怎么用python根据提取指定关键词下面的所有列和行的数据呢
可以使用pandas库来处理和分析数据:
import pandas as pd
# 读取数据文件
df = pd.read_excel('data.xlsx')
# 设置关键词
keyword = '平面激光'
# 查找包含关键词的列
selected_columns = [col for col in df.columns if keyword in col]
# 提取指定关键词下的所有列和行的数据
selected_data = df.loc[:, selected_columns]
# 打印提取的数据
print(selected_data)
在这个示例中,首先使用`pd.read_excel()`函数读取包含数据的Excel文件(假设为'data.xlsx')。然后,通过设置关键词变量来定义需要提取的关键词。
接下来,使用列表推导式和`df.columns`属性遍历所有列名,将包含关键词的列存储在`selected_columns`列表中。
最后,使用`df.loc`方法选择所有行,并使用`selected_columns`作为列索引提取数据;将提取的数据存储在`selected_data`中。最后,使用`print`语句显示提取的数据。