❶ python 提取有关键词的句子怎么做
高频词提取:
# !/usr/bin/python3
# coding:utf-8
import jieba.analyse
jieba.load_userdict('dict.txt') # dict.txt自定义词典
content = open('kw.txt', 'rb').read()
tags = jieba.analyse.extract_tags(content, topK=10) # topK 为高频词数量
print("\n".join(tags))
❷ 有没有代码可以筛选文献中的摘要
有代码可以筛选文献中的摘要,可以用python来提取。
文本摘要可以有两种实现的方法:
1、提取方法:从文章中找出n个最能够表达文章意思的句子,这个方法非常容易实现,并且也很容易理解。这也是为什么我会在这篇文章中使用这个方法。
2、抽象方法:这个方法使用了深度学习中的一些内容,比如编解码结构,长短期记忆LSTM(LongShortTermMemory)网络。而这些其实对新手来说很复杂且不容易理解。这个方法所产生的摘要,可能压根就不在文章中,甚至有可能产生完全没有意义的句子。
❸ python如何在几个句子间挑选求大神回答
randint是生成随机整数,简单一点,你可以把句子放在列表中,然后随机生成索引,最后输出对应的句子。
❹ python 怎么提取一个大文本(3M)中所有带有“县”字的句子。
import re
#读文件你会吧,我就不写了,下面搜索含“的”的句子(一下子没找到含县的段子)
s = "我国吸烟者3.5亿,占世界烟民的35%,受二手烟危害者更是高达7.4亿,这是我们必须警惕的局面。最大的生产国和消费国,我国的烟草行业是否该受到限制?吸烟率只有14%,新加坡是否值得我们学习?"
g = re.split(r"[,。?]", s) #根据你文章中的实际情况添加分割句子的标点
for line in g:
if re.match(r".*的.*", line):
print line
##测试结果:
占世界烟民的35%
这是我们必须警惕的局面
最大的生产国和消费国
我国的烟草行业是否该受到限制
## 把你的区区3M的文件直接用python读到内存中,再按上面的方法分句子查找就OK了
## Over
❺ python中如何将文章里含有某个词的句子全部显示出来
#!/usr/bin/env python
# -*- encoding:utf-8 -*-
import re
d = dict()
def save(m):
l = m.groups()
d[l[0]] = l[2]
return l[0]+l[1]
# 需要替换的文本
s = 'this is a [error] test.and [skip] another.'
print(s)
r = re.sub(r'(\w+)(\s+)\[(\w+)\]',save,s)
# 替换结果
print(r)
# 字典
print(d)
# 清空字典
d.clear()
print(d)
运行的结果是:
this is a [error] test.and [skip] another.
this is a test.and another.
{'a':'error','and':'skip'}
{}
❻ python如何从文本中筛选出带指定汉字的句子
#coding=gbk
#下面就是代码,测试了一下没有问题
#python 2.7.5
def srch(fileName):
f = open(fileName,'r').read()
s = f.split('\n')
a0 = s[0]
for i in range(0,len(s)):
if len(s) == 1: #这一行我不知道有没有用,判断文本是否只有一行
if a0[:1] != '#':
print '0' #return 0
break
a = s[i]
if a[:1] == '#':
print '-1' #return -1
else:
print '0' #return 0
print srch('abc.txt') #abc.txt is your file
❼ python 特定 行列 文本 筛选
#openfile
fin=open("file01.txt","r")
fout=open("file02.txt","w")
#init
count_AG=0
count_AT=0
count_AC=0
#datalines
forlineinfin:
dat_in=line.split()
ifint(dat_in[5])>=3andfloat(dat_in[7])>=0.1:
fout.write(line)
#closefile
fin.close()
fout.close()
❽ 如何用python代码实现筛选
用python代码实现筛选的方法:
python中的if语句可以实现筛选的效果。例如:筛选出列表里的数字就可以用“if type(i) == int”语句来筛选
示例代码如下:
执行结果如下:
更多Python知识,请关注:Python自学网!!
❾ 怎么用python搜索文本并筛选出来
txtfile=open(r'test.txt',"r")
newtxtfile=open(r'new.txt',"w")
linelist=[]
forlineintxtfile:
linelist.append(line)
iflen(linelist)==4:
ifnotlinelist[1].startswith(r'aaa'):
newtxtfile.writelines(linelist)
linelist=[]
iflen(linelist)>1:
ifnotlinelist[1].startswith(r'aaa'):
newtxtfile.writelines(linelist)
eliflen(linelist)==1:
newtxtfile.writelines(linelist)
txtfile.close()
newtxtfile.close()
读取文件test.txt,将每四行中第二行以aaa开始的去除,写入新文件new.txt中
❿ python 筛选出中文文本中包含某一个名字的句子
#!usr/bin/envpython3
importre
name='乔峰'
text='''段誉的六卖神贱,虚竹的酒色为善佛祖皆空。乔峰的谁知心爱
朱颜消逝烟雨中。降龙无敌手,丐帮帮主乔峰。'''
results=re.findall(r'[^。]*?{}[^。]*?。'.format(name),text)
fori,rinenumerate(results,1):
print(i,r)