『壹』 python如何將中文替換為星號
用正則判斷是否為中文,然後替換
中文: [\u4E00-\u9FA5]+
『貳』 python3 正則表達式如何實現中文模糊匹配替換並輸出
要使用正則表達式實現中文模型李糊匹配替換並輸出,你可以使用 Python 的 re 模塊。以下是一個示例代碼,讀取一個名為 input.txt 的文件,將其中的 "竹某嬋" 或 "竹嬋某" 替換為 "竹嬋嬋",然後將結果保存到一個名為 output.txt 的新文件中:
import re
# 定義一個函數來實現替換操作
def replace_pattern(match_obj):
return "竹嬋嬋"
# 讀取文件內容
with open("input.txt", "r", encoding="utf-8") as file:
content = file.read()
# 使用正則表達式進行模糊匹配替換
pattern = r"竹(?:某|嬋)(?:嬋|某)"
replaced_content = re.sub(pattern, replace_pattern, content)
# 將替換後的內容寫入新的文件
with open("output.txt", "w", encoding="utf-8") as file:
file.write(replaced_content)
在這個例子中,正則表達式 r"竹(?:某|嬋)(?:嬋|某)" 用於匹配 "竹某嬋" 或 "竹嬋某"。(?:...) 是一個非捕獲組,它表示匹配其中的任意一個字元,但不會捕獲該組。這里的組分別包含 "某" 和 "嬋",因此可以匹配 "竹某嬋" 或 "竹嬋某"。接下來,re.sub 函數用於替換匹配到的字元串。這里我們提供了一個替換函行緩數 replace_pattern,它直接返回 "竹嬋嬋"。最後,將替換後的內容寫入一個名為 output.txt 的新文件。
…………
回復:
如果要實現匹配任意特定中文字元,可以使用 Unicode 的中文字元卜帶遲范圍。以下是修改後的示例代碼,可以將 "竹某嬋" 或 "竹嬋某" 替換為 "竹嬋嬋",其中 "某" 為任意中文字元:
import re
# 定義一個函數來實現替換操作
def replace_pattern(match_obj):
return "竹嬋嬋"
# 讀取文件內容
with open("input.txt", "r", encoding="utf-8") as file:
content = file.read()
# 使用正則表達式進行模糊匹配替換
pattern = r"竹[u4e00-u9fa5]嬋|竹嬋[u4e00-u9fa5]"
replaced_content = re.sub(pattern, replace_pattern, content)
# 將替換後的內容寫入新的文件
with open("output.txt", "w", encoding="utf-8") as file:
file.write(replaced_content)
在這個例子中,正則表達式 r"竹[u4e00-u9fa5]嬋|竹嬋[u4e00-u9fa5]" 用於匹配 "竹某嬋" 或 "竹嬋某",其中 "某" 為任意中文字元。[u4e00-u9fa5] 用於匹配任意一個中文字元。接下來,re.sub 函數用於替換匹配到的字元串。這里我們提供了一個替換函數 replace_pattern,它直接返回 "竹嬋嬋"。最後,將替換後的內容寫入一個名為 output.txt 的新文件。
『叄』 Python 的sub和replace的區別
sub出現於re庫,用法是re.sub(pattern, repl, string, count=0, flags=0)
實例,re.sub(r'e','a','def',count = 1)
>>> daf
相對於replace來說,該方法功能更強,但是運行效率更低。
replace是自帶函數,用法是str.replace(old, new[, max])
實例,'abbc'.replace('b','a',1)
>>>aabc
對比re.sub來說,replace沒有正則的效果,但是運行效率更佳。請在實際應用中根據需求來定製使用方法,不要浪費資源。
『肆』 python中文字元串替換字元
a.replace("|","\n")應該改成a=a.replace("|","\n")
因為a.replace()並沒有改變a的值,只是將從a讀取出來的內容改變了