㈠ 關於python里標點符號的處理和首字母大小寫
詞法分析器首先是斷句,可以考慮用正則表達式,下面的例子可以參考
importre
s="hello,"
s="MynameisMike."
s="I'mab!"
whiles!='':
match=re.search('^[a-z|A-Z|']+',s)
ifmatch:
print('<'+s[:match.end()]+'>')
s=s[match.end():]
else:
print('<'+s[:1]+'>')
s=s[1:]
㈡ python是用英語的標點嗎
python是用英語的標點。
在Python中,默認所有正確的語法,包括標點符號都是英文。不小心用了中文標點的話,計算機會無法識別,然後報錯。在終端里,你能看到的最常見的符號報錯提示就是syntaxError:invalid syntax(語法錯誤:無效語法)。
除了使用三引號進行換行,我們也可以使用轉義字元進行換行。print('我願意留在湯婆婆的澡堂里工作兩年, 如果我違背工作內容的話, 將在這個世界變成一頭豬。')
標點符號寫法:
單引號左單引號:『。
右單引號:』name =『crifan』英文單引號(不分左右):』name='crifan'。
雙引號:左雙引號:「。
由雙引號:」url=「http://xxx」英文雙引號(不分左右):」url="http://xxx"。
括弧左括弧:(。
右括弧:)input("請輸入")英文括弧:做括弧:(。
右括弧:)input("請輸入")。
㈢ python中用正則表達式去掉文本中所有的標點符號
我的理解是 python』s的「 』 」也是字元 ,和標點符號一樣。你只要把去除的字元都加到正則表達式的括弧中就可以了。,所以:
import re
r='[』!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~]+'
line=re.sub(r,'',"python』s")
print line
㈣ "python中如何判斷字元串中是否含有標點符號"
思路一樣,但是需要修改一下代碼:
python的string對象沒有contains方法,不用使用string.contains的方法判斷是否包含子字元串,但是python有更簡單的方法來替換contains函數。
方法1:使用 in 方法實現contains的功能:
site = ''
if "jb51" in site:
print('site contains jb51')
輸出結果:site contains jb51
方法2:使用find函數實現contains的功能
s = "This be a string"
if s.find("is") == -1:
print "No 'is' here!"
else:
print "Found 'is' in the string."
㈤ python 去掉標點符號
這個明顯是錯誤的,你根本沒理解replace函數是怎麼用的。
Python str.replace(old, new[, max])
方法把字元串str中的 old(舊字元串) 替換成 new(新字元串),如果指定第三個參數max,則替換不超過 max
次。
如果非要用replace()函數來實現要這樣寫:
importstring
m=l
forcinstring.punctuation:
m=m.replace(c,")
更簡便的方法是用translate(),代碼如下:
importstring
m=l.translate(None,string.punctuation)
㈥ 為什麼python總顯示標點符號不正確
python 2.py這條命令應該是在cmd中輸入的,而不是在Python解釋器中輸入的。
㈦ python中標點符號算字元嗎
python中標點符號算字元。
字元指類字形單位或符號,包括字母、數字、運算符號、標點符號和其他符號,以及一些功能性符號。字元是電子計算機或無線電通信中字母、數字、符號的統稱,其是數據結構中最小的數據存取單位,通常由8個二進制位(一個位元組)來表示一個字元。字元是計算機中經常用到的二進制編碼形式,也是計算機中最常用到的信息形式。
字元包括字母、數字、運算符號、標點符號和其他符號,以及一些功能性符號。字元在計算機內存放,應規定相應的代表字元的二進制代碼。代碼的選用要與有關外圍設備的規格取得一致。這些外圍設備包括鍵盤控制台的輸入輸出、列印機的輸出等等。
字元作輸入時,要自動轉換為二進制代碼存於機內;輸出時,計算機內二進制代碼自動轉化為字元,兩者的轉換全是靠外圍設備實現的。字元是數據結構中最小的數據存取單位。通常由8個二進制位(一個位元組)來表示一個字元,但也有少數計算機系統採用6個二進制的字元表示形式。一個系統中字元集的大小,完全由該系統自己規定。
計算機可用字元一般為128~256個(不包括漢字時),每個字元進入計算機後,都將轉換為8位二進制數。不同的計算機系統和不同的語言,所能使用的字元范圍是不同的。
㈧ python怎麼去掉末尾標點符號
我們想在字元串的開始、結尾或中間去掉不需要的字元,比如說空格符。
解決方案
關注,轉發,私信小編「01」即可免費領取Python學習資料!
strip()方法可用來從字元串的開始和結尾處去掉字元。lstrip()和rstrip()可分別從左或從右側開始執行去除字元的操作。默認情況下這些方法去除的是空格符,但也可以指定其他的字元。例如:
討論
當我們讀取並整理數據以待稍後的處理時常常會用到這類strip()方法。例如,可以用它們來去掉空格、移除引號等。
需要注意的是,去除字元的操作並不會對位於字元串中間的任何文本起作用。例如:
如果要對裡面的空格執行某些操作,應該使用其他技巧,比如使用replace()方法或正則表達式替換。例如:
我們通常會遇到的情況是將去除字元的操作同某些迭代操作結合起來,比如說從文件中讀取文本行。如果是這樣的話,那就到了生成器表達式大顯身手的時候了。例如:
這里,表達式lines = (line.strip() for line in f)的作用是完成數據的轉換[1]。它很高效,因為這里並沒有先將數據讀取到任何形式的臨時列表中。它只是創建一個迭代器,在所有產生出的文本行上都會執行strip操作。
對於更高級的strip操作,應該轉而使用translate()方法。請參見下一節以獲得進一步的細節。
㈨ python如何刪除文本中連續的標點符號啊
defget_solo(text):
els=[x+xforxinlist('。,!')]
#如需增加標點符號,比如問號,直接將list('。,!')換成list('。,!?')即可.
fordinels:
whiledintext:
text=text.replace(d,d[0])
returntext
if__name__=='__main__':
text='開開心心,,,,上上。。。好好的!!'
print(get_solo(text))
結果:
>>>
開開心心,上上。好好的!
㈩ Python怎麼刪除文本中的所有標點符號
刪除文本中的標點示例。供參考。
#coding:UTF-8
f=open('e:/python27/biaodian.txt','r')
lines=f.readlines()
f.close()
#以下新建的文件中只保留英文字母和數字
#仍按原始的行結構存儲
chardigit=''
ff=open('e:/python27/biaodian1.txt','w')
forlineinlines:
sts=''
forchinline:
ifchinchardigit:
sts=sts+ch
print(sts)
ff.write(sts)
ff.write(' ')
ff.close()