導航:首頁 > 編程語言 > pythonsed處理文本

pythonsed處理文本

發布時間:2023-01-11 11:35:47

『壹』 python將指定文本中的字元串替換後,保存該文本文件。

txt=open("inputfile.txt","rb").readlines()
outputs=[]
for line in txt:
line=line.replace("/test","")
if line=="/X/ABC":
outputs.append(line)
outputs.append("/X/XYZ")
elif line=="/temp.txt":continue
else:outputs.append(line)
這樣就行了吧。好象沒有什麼難度。如果要求在一行內完成,可能還是挺麻煩的。

『貳』 python字元串操作集合

把字元串變數和字面值連接起來,組成新的字元串。推薦3個方法:

對字元串進行單個字元索引時,無論是從前往後索引,還是從後往前索引,索引序號一定要在范圍內,否則出錯。
對字元串進行切片截取時,採用 str[start:end] 的方式。start,end可以正,可以負。且如果start標識的位置大於等於end標識的位置,則截取字元串為空。start,end超出字元串的極限位置,那麼就用最值。start默認為0,end默認為字元串長度。

一般的基於文本和行字元串處理,使用sed,awk,grep等工具就可以了,這些命令行工具用起來更便捷,但是也沒有python的這些函數強大。比如沒法實現非貪婪模式匹配。如下:

把連續的數字提取出來,其他的字元拋棄

python處理字元串,比linux命令要復雜一些,功能也更強大一些。對於簡單的處理任務,linux命令已經足夠,python為的是一些更復雜的處理操作。如果兩者都會,豈不是更好?

『叄』 請教python里怎麼調用sed或者awk亞

os.popen()可以調用系統命令 當然也包括sed 和awk

『肆』 linux:文本處理系列-1.行截取

(自己)常用的文本文件的行處理命令

示例文件:test.vcf
1、head -n 10 test.vcf
head : 默認是提取文件的前10行,-n 參數可以設定選擇文件的前n行

2、tial -n 10 test.vcf
tail : 默認是提取文件的末尾10行, -n 參數可以設定選擇文件末尾的n行

3、sed -n '10,20p' test.vcf
sed -n : 隨意選擇需要查看的行
sed命令是一個面向行處理的編輯器,可以和正則表達式配合使用,附上較全面的sed命令使用教程。
https://man.linuxde.net/sed

4、awk 截取行的指定長度字元串
less test.gz |awk '{if(NR%2==1){print}else{print substr($1,1,75)}}' | gzip -c > test.part.gz
說明:對test.gz文件指定行截取75bp,原來是150bp

5、對n行的第三列求和,求平均值
grep -v 『#』 test.vcf |sed -n '20,35p' |awk -F '\t' '{sum+=$3;n++}END{print sum,sum/n}'
(linux 一行命令計算速度比Python快,簡單計算喜歡用linux命令)
記得隨時整理使用過的命令,沒學過linux,靠著各種帖子,隨時需要隨時補給,有點懶。

『伍』 python運維自動化取頁面數據

1、linux系統基礎,這個不用說了,是基礎中的基礎,連這個都不會就別幹了,參考書籍,可以看鳥哥linux基礎篇,至少要掌握這書60%內容,沒必須全部掌握,但基本命令總得會吧

2、網路服務,服務有很多種,每間公司都會用到不同的,但基礎的服務肯定要掌握,如FTP, DNS,SAMBA, 郵件, 這幾個大概學一下就行,LAMP和LNMP是必須要熟練,我所指的不是光光會搭建,而是要很熟悉裡面的相當配置才行,因為公司最關鍵的絕對是WEB伺服器,所以nginx和apache要熟悉,特別是nginx一定要很熟悉才行,至少有些公司還會用tomcat,這個也最好學一下。其實網路服務方面不用太擔心,一般公司的環境都已經搭建好,就算有新伺服器或讓你整改,公司會有相應的文檔讓你參照來弄,不會讓你亂來的,但至少相關的配置一定要學熟,而且肯定是編譯安裝多,那些模塊要熟悉一下他的作用,特別是php那些模塊。
這面2點只是基礎,也是必要條件,不能說是工具,下以才是真正的要掌握的工具。

3、shell腳本和另一個腳本語言,shell是運維人員必須具備的,不懂這個連入職都不行,至少也要寫出一些系統管理腳本,最簡單也得寫個監控CPU,內存比率的腳本吧,這是最最最基本了,別以為會寫那些猜數字和計算什麼數的,這些沒什麼作用,只作學習意義,寫系統腳本才是最有意義,而另一個腳本語言是可選的,一般是3P,即python, perl和php,php就不需要考慮了,除非你要做開發,我個人建議學python會比較好,難實現自動化運維,perl是文本處理很強大,反正這兩個學一個就行了。

4、sed和awk工具,必須要掌握,在掌握這兩個工具同時,還要掌握正則表達式,這個就痛苦了,正則是最難學的表達式,但結合到sed和awk中會很強大,在處理文本內容和過濾WEB內容時十分有用,不過在學shell的同時一般會經常結合用到的,所以學第3點就會順便學第4點。

5、文本處理命令,sort , tr , cut, paste, uniq, tee等,必學,也是結合第3點時一並學習的。

6、資料庫,首選mysql,別問我為什麼不學sqlserver和oracle,因為linux用得最多絕對是mysql,增刪改查必學,特別要學熟查,其它方面可能不太需要,因為運維人員使用最多還是查,哪些優化和開發語句不會讓你弄的。

7、防火牆,不學不行,防火牆也算是個難點,說難不難,說易不易,最重要弄懂規則,如果學過CCNA的朋友可能會比較好學,因為iptables也有NAT表,原理是一樣的,而FILTER表用得最多,反正不學就肯定不合格。

8、監控工具,十分十分重要,我個人建議,最好學這3個,cacti,nagios,zibbix,企業用得最多應該是nagios和 zibbix,反正都學吧,但nagios會有點難,因為會涉及到用腳本寫自動監控,那個地方很難。

『陸』 python能實現這樣一個程序嗎

1.關於登陸的事情。
可以用python實現。

相關原理和代碼,可參考:
如何用Python,C#等語言去實現抓取靜態網頁 模擬登陸網站

只是其中的驗證碼,需要特殊處理:
如果你有能力,自己去破解驗證碼。
如果和我一樣沒有,那麼就顯示圖片,然後讓用戶輸入。可參考:
【記錄】給BlogsToWordPress中的人人網添加登陸時驗證碼功能的支持

【已解決】Python中使用PIL的Image函數出錯:ValueError: not enough image data
(此處不給貼地址,請自己用google搜標題,即可找到地址)

閱讀全文

與pythonsed處理文本相關的資料

熱點內容
怎麼升級手機android 瀏覽:922
php權威編程pdf 瀏覽:994
扣扣加密技巧 瀏覽:720
蘋果如何創建伺服器錯誤 瀏覽:495
軟考初級程序員大題分值 瀏覽:473
js壓縮視頻文件 瀏覽:578
linux如何通過命令創建文件 瀏覽:989
應用加密app還能訪問應用嘛 瀏覽:433
安卓怎麼用支付寶交違章罰款 瀏覽:665
php面向對象的程序設計 瀏覽:504
數據挖掘演算法書籍推薦 瀏覽:894
投訴聯通用什麼app 瀏覽:150
web伺服器變更ip地址 瀏覽:954
java正則表達式驗證郵箱 瀏覽:361
成熟商務男裝下載什麼軟體app 瀏覽:609
加密2h代表長度是多少厘米 瀏覽:23
拍賣程序員 瀏覽:103
電腦的圖片放在哪個文件夾 瀏覽:276
unsignedintjava 瀏覽:218
編譯器下載地址 瀏覽:44