導航:首頁 > 編程語言 > 姓名拆分為姓和名python

姓名拆分為姓和名python

發布時間:2024-05-13 18:09:04

python分析人數最多的姓氏

先收集常見姓氏列表,獲取姓名的第一個字,然後在姓氏列表中匹配,如果找到那麼姓氏就是這個字,如果沒找到就嘗試姓名前兩個字,如果還沒找到就嘗試更多字(當然中國姓氏一般就兩字,我還沒見過兩字以上的姓)或者手動辨別姓氏,然後把姓氏補充進列表。這種思路的問題在於復合姓可能會出問題,比如」司「和」司馬「,腳本識別出的姓會是」司「。#!/usr/bin/env python
# -*- coding: utf-8 -*-

# Python 版本需要為 3.5 以上

first_names = ('李', '王', '司', '司馬')

def name_parser(name, first_name_count=1):
"""
分析姓名,返回姓和名的元組

:param str name: 姓名
:param int first_name_count: 姓氏長度,默認為1
:return: 姓和名的元組,如果沒分析成功就返回空元組
:rtype: tuple
"""
if name[0:first_name_count] in first_names:
return (name[0:first_name_count], name[first_name_count:])
else:
return ()

if __name__ == '__main__':
# name.txt 需要為 UTF-8 編碼,如果為其他編碼,自行優化處理
with open('name.txt', 'r', encoding='utf-8') as f:
for i in f:
name = i.rstrip('\n')
# 最多嘗試兩字的姓
for n in range(1, 3):
s = name_parser(name, n)
if s:
print('{} 的姓氏為: {},名字為: {}.'.format(name, s[0], s[1]))
break
else:
print('未分析出 {} 的姓氏和名字,可能需要補充姓氏列表.'.format(name))

閱讀全文

與姓名拆分為姓和名python相關的資料

熱點內容
神經系統pdf 瀏覽:665
如何查看伺服器上的資料庫伺服器 瀏覽:188
壓縮機型號v代表什麼 瀏覽:50
旅遊類源碼 瀏覽:860
電腦伺服器類型怎麼設置 瀏覽:228
pdf炒股 瀏覽:784
伺服器地址缺少埠號什麼意思 瀏覽:528
下載需要解壓的小說用哪個軟體 瀏覽:532
廣東分布式伺服器雲主機 瀏覽:583
伺服器忙打不開怎麼辦 瀏覽:15
tif壓縮軟體 瀏覽:413
程序員那麼可愛陸漓上班第1天 瀏覽:952
macbookair自帶什麼app 瀏覽:701
如何關了加密的軟體 瀏覽:581
程序員p2p待遇 瀏覽:922
ipd編譯要求 瀏覽:936
壓縮解壓王怎麼用 瀏覽:34
伺服器共享文件如何備份 瀏覽:758
買安卓手機怎麼在官網買 瀏覽:126
詩詞入門PDF 瀏覽:365