㈠ python的“模块”是什么概念
通俗点说,就是把你常用的一些功能单独放置到一个文件中,方便其他文件来调用。这样的一个文件可以称为一个模块
㈡ python十大必学模块是什么
这个不能一概而论的,据说python目前高达27万+个库,看你学习的方向必学模块也有不同,简单列举:
1、网络通用方面:
urllib-网络库
requests-网络库
pycurl– 网络库
httplib2– 网络库
RoboBrowser– 浏览网页
MechanicalSoup-一个与网站自动交互Python库
socket– 底层网络接口
2、爬虫方面:
grab– 爬虫框架
scrapy– 网络爬虫框架,不支持Python3
pyspider–爬虫系统。
cola– 爬虫框架
portia– 可视化爬虫
3、HTML/XML解析方面:
lxml– 高效HTML/ XML处理库
cssselect– 解析DOM树和CSS选择器。
pyquery– 解析DOM树和jQuery选择器。
html5lib– 根据WHATWG规范生成HTML/ XML文档的DOM
feedparser– 解析RSS/ATOM feeds。
MarkupSafe– 为XML/HTML/XHTML提供了安全转义的字符串。
xhtml2pdf– 将HTML/CSS转换为PDF。
untangle– XML文件转Python对象
4、文件处理方面:
xpinyin– 将中国汉字转为拼音
tablib– 数据导出为XLS、CSV、JSON、等格式的模块
textract– 从文件中提取文本
messytables– 解析表格数据
rows– 常用数据接口
Office
python-docx– 读取,查询和修改docx文件
xlwt/xlrd– 从Excel文件读取写入数据和格式信息
Markdown
Python-Markdown– 一个用Python实现的John Gruber的Markdown。