❶ python 提取有關鍵詞的句子怎麼做
高頻詞提取:
# !/usr/bin/python3
# coding:utf-8
import jieba.analyse
jieba.load_userdict('dict.txt') # dict.txt自定義詞典
content = open('kw.txt', 'rb').read()
tags = jieba.analyse.extract_tags(content, topK=10) # topK 為高頻詞數量
print("\n".join(tags))
❷ 有沒有代碼可以篩選文獻中的摘要
有代碼可以篩選文獻中的摘要,可以用python來提取。
文本摘要可以有兩種實現的方法:
1、提取方法:從文章中找出n個最能夠表達文章意思的句子,這個方法非常容易實現,並且也很容易理解。這也是為什麼我會在這篇文章中使用這個方法。
2、抽象方法:這個方法使用了深度學習中的一些內容,比如編解碼結構,長短期記憶LSTM(LongShortTermMemory)網路。而這些其實對新手來說很復雜且不容易理解。這個方法所產生的摘要,可能壓根就不在文章中,甚至有可能產生完全沒有意義的句子。
❸ python如何在幾個句子間挑選求大神回答
randint是生成隨機整數,簡單一點,你可以把句子放在列表中,然後隨機生成索引,最後輸出對應的句子。
❹ python 怎麼提取一個大文本(3M)中所有帶有「縣」字的句子。
import re
#讀文件你會吧,我就不寫了,下面搜索含「的」的句子(一下子沒找到含縣的段子)
s = "我國吸煙者3.5億,佔世界煙民的35%,受二手煙危害者更是高達7.4億,這是我們必須警惕的局面。最大的生產國和消費國,我國的煙草行業是否該受到限制?吸煙率只有14%,新加坡是否值得我們學習?"
g = re.split(r"[,。?]", s) #根據你文章中的實際情況添加分割句子的標點
for line in g:
if re.match(r".*的.*", line):
print line
##測試結果:
佔世界煙民的35%
這是我們必須警惕的局面
最大的生產國和消費國
我國的煙草行業是否該受到限制
## 把你的區區3M的文件直接用python讀到內存中,再按上面的方法分句子查找就OK了
## Over
❺ python中如何將文章里含有某個詞的句子全部顯示出來
#!/usr/bin/env python
# -*- encoding:utf-8 -*-
import re
d = dict()
def save(m):
l = m.groups()
d[l[0]] = l[2]
return l[0]+l[1]
# 需要替換的文本
s = 'this is a [error] test.and [skip] another.'
print(s)
r = re.sub(r'(\w+)(\s+)\[(\w+)\]',save,s)
# 替換結果
print(r)
# 字典
print(d)
# 清空字典
d.clear()
print(d)
運行的結果是:
this is a [error] test.and [skip] another.
this is a test.and another.
{'a':'error','and':'skip'}
{}
❻ python如何從文本中篩選出帶指定漢字的句子
#coding=gbk
#下面就是代碼,測試了一下沒有問題
#python 2.7.5
def srch(fileName):
f = open(fileName,'r').read()
s = f.split('\n')
a0 = s[0]
for i in range(0,len(s)):
if len(s) == 1: #這一行我不知道有沒有用,判斷文本是否只有一行
if a0[:1] != '#':
print '0' #return 0
break
a = s[i]
if a[:1] == '#':
print '-1' #return -1
else:
print '0' #return 0
print srch('abc.txt') #abc.txt is your file
❼ python 特定 行列 文本 篩選
#openfile
fin=open("file01.txt","r")
fout=open("file02.txt","w")
#init
count_AG=0
count_AT=0
count_AC=0
#datalines
forlineinfin:
dat_in=line.split()
ifint(dat_in[5])>=3andfloat(dat_in[7])>=0.1:
fout.write(line)
#closefile
fin.close()
fout.close()
❽ 如何用python代碼實現篩選
用python代碼實現篩選的方法:
python中的if語句可以實現篩選的效果。例如:篩選出列表裡的數字就可以用「if type(i) == int」語句來篩選
示例代碼如下:
執行結果如下:
更多Python知識,請關註:Python自學網!!
❾ 怎麼用python搜索文本並篩選出來
txtfile=open(r'test.txt',"r")
newtxtfile=open(r'new.txt',"w")
linelist=[]
forlineintxtfile:
linelist.append(line)
iflen(linelist)==4:
ifnotlinelist[1].startswith(r'aaa'):
newtxtfile.writelines(linelist)
linelist=[]
iflen(linelist)>1:
ifnotlinelist[1].startswith(r'aaa'):
newtxtfile.writelines(linelist)
eliflen(linelist)==1:
newtxtfile.writelines(linelist)
txtfile.close()
newtxtfile.close()
讀取文件test.txt,將每四行中第二行以aaa開始的去除,寫入新文件new.txt中
❿ python 篩選出中文文本中包含某一個名字的句子
#!usr/bin/envpython3
importre
name='喬峰'
text='''段譽的六賣神賤,虛竹的酒色為善佛祖皆空。喬峰的誰知心愛
朱顏消逝煙雨中。降龍無敵手,丐幫幫主喬峰。'''
results=re.findall(r'[^。]*?{}[^。]*?。'.format(name),text)
fori,rinenumerate(results,1):
print(i,r)