1. python怎么打包整个项目
distutils - Python自带的基本安装工具, 适用于非常简单的应用场景使用, 不支持依赖包的安装
通过distutils来打包,生成安装包,安装python包等工作,需要编写名为setup.py python脚本文件。
setuptools - 针对 distutils 做了大量扩展, 尤其是加入了包依赖机制。不支持python3,安装完setuptools后会有easy_install
distribute - 类似于setuptools,支持python3,安装完distribute后会有easy_install。
easy_install - setuptools 和 distribute 自带的安装脚本, 也就是一旦setuptools或distribute安装完毕, easy_install 也便可用了。
pip - 目标是取代easy_install。easy_install 有很多不足: 安装事务是非原子操作, 只支持 svn, 没有提供卸载命令, 安装一系列包时需要写
脚本; pip 解决了以上问题, 已俨然成为新的事实标准, virtualenv 与它已经成为一对好搭档;
distutils2 - setuptools 和 distribute 的诞生是因为 distutils 的不济, 进而导致目前分化的状况。它将成为 Python 3.3 的标准库
packaging , 并在其它版本中以distutils2 的身份出现; 换句话说, 它和 pip 将联手结束目前混乱的状况。
virtualenv - 用来创建隔离的python环境,处理python环境的多版本和模块依赖。
常识
sudo apt-get install 安装的package存放在 /usr/lib/python2.7/dist-packages目录中
pip 或者 easy_install安装的package存放在/usr/local/lib/python2.7/dist-packages目录中
手动从源代码安装的package存放在site-packages目录中。
更多学习内容,请点击Python学习网!
2. python常用的数据分析包有哪些
ndarray.ndim
数组轴的个数,在python的世界中,轴的个数被称作秩
ndarray.shape
数组的维度。这是一个指示数组在每个维度上大小的整数元组。例如一个n排m列的矩阵,它的shape属性将是(2,3),这个元组的长度显然是秩,即维度或者ndim属性
ndarray.size
数组元素的总个数,等于shape属性中元组元素的乘积。
ndarray.dtype
一个用来描述数组中元素类型的对象,可以通过创造或指定dtype使用标准Python类型。另外NumPy提供它自己的数据类型。
ndarray.itemsize
数组中每个元素的字节大小。例如,一个元素类型为float64的数组itemsiz属性值为8(=64/8),又如,一个元素类型为complex32的数组item属性为4(=32/8).
ndarray.data
包含实际数组元素的缓冲区,通常我们不需要使用这个属性,因为我们总是通过索引来使用数组中的元素。
NumPy-快速处理数据
标准安装的Python中用列表(list)保存一组值,可以用来当作数组使用,不过由于列表的元素可以是任何对象,因此列表中所保存的是对象的指针。这样为了保存一个简单的[1,2,3],需要有3个指针和三个整数对象。对于数值运算来说这种结构显然比较浪费内存和CPU计算时间。
此外Python还提供了一个array模块,array对象和列表不同,它直接保存数值,和C语言的一维数组比较类似。但是由于它不支持多维,也没有各种运算函数,因此也不适合做数值运算。
NumPy的诞生弥补了这些不足,NumPy提供了两种基本的对象:ndarray(N-dimensional array object)和 ufunc(universal function object)。ndarray(下文统一称之为数组)是存储单一数据类型的多维数组,而ufunc则是能够对数组进行处理的函数。
3. python怎么定义addcat
Python中的Mole是比较重要的概念。常见的情况是,事先写好一个.py文 件,在另一个文件中需要import时,将事先写好的.py文件拷贝 到当前目录,或者是在sys.path中增加事先写好的.py文件所在的目录,然后import。这样的做法,对于少数文件是可行的,但如果程序数目很 多,层级很复杂,就很吃力了。
有没有办法,像Java的Package一样,将多个.py文件组织起来,以便在外部统一调用,和在内部互相调用呢?答案是有的。
主要是用到python的包的概念,python
__init__.py在包里起一个比较重要的作用
要弄明白这个问题,首先要知道,python在执行import语句时,到底进行了什么操作,按照python的文档,它执行了如下操作:
第1步,创建一个新的,空的mole对象(它可能包含多个mole);
第2步,把这个mole对象插入sys.mole中
第3步,装载mole的代码(如果需要,首先必须编译)
第4步,执行新的mole中对应的代码。
在执行第3步时,首先要找到mole程序所在的位置,其原理为:
如 果需要导入的mole的名字是m1,则解释器必须找到m1.py,它首先在当前目录查找,然后是在环境变量PYTHONPATH中查找。 PYTHONPATH可以视为系统的PATH变量一类的东西,其中包含若干个目录。如果PYTHONPATH没有设定,或者找不到m1.py,则继续搜索 与python的安装设置相关的默认路径,在Unix下,通常是/usr/local/lib/python。
事实上,搜索的顺序是:当前路径 (以及从当前目录指定的sys.path),然后是PYTHONPATH,然后是python的安装设置相关的默认路径。正因为存在这样的顺序,如果当前 路径或PYTHONPATH中存在与标准mole同样的mole,则会覆盖标准mole。也就是说,如果当前目录下存在xml.py,那么执 行import
xml时,导入的是当前目录下的mole,而不是系统标准的xml。
了解了这些,我们就可以先构建一个package,以普通mole的方式导入,就可以直接访问此package中的各个mole了。
Python中的package定义很简单,其层次结构与程序所在目录的层次结构相同,这一点与Java类似,唯一不同的地方在于,python中的package必须包含一个__init__.py的文件。
例如,我们可以这样组织一个package:
package1/
__init__.py
subPack1/
__init__.py
mole_11.py
mole_12.py
mole_13.py
subPack2/
__init__.py
mole_21.py
mole_22.py
……
__init__.py可以为空,只要它存在,就表明此目录应被作为一个package处理。当然,__init__.py中也可以设置相应的内容,下文详细介绍。
好了,现在我们在mole_11.py中定义一个函数:
def funA():
print "funcA in mole_11"
return
在顶层目录(也就是package1所在的目录,当然也参考上面的介绍,将package1放在解释器能够搜索到的地方)运行python:
>>>from package1.subPack1.mole_11 import funcA
>>>funcA()
funcA in mole_11
这样,我们就按照package的层次关系,正确调用了mole_11中的函数。
细心的用户会发现,有时在import语句中会出现通配符*,导入某个mole中的所有元素,这是怎么实现的呢?
答案就在__init__.py中。我们在subPack1的__init__.py文件中写
__all__ = ['mole_13', 'mole_12']
然后进入python
>>>from package1.subPack1 import *
>>>mole_11.funcA()
Traceback (most recent call last):
File "", line 1, in
ImportError: No mole named mole_11
也就是说,以*导入时,package内的mole是受__init__.py限制的。
好了,最后来看看,如何在package内部互相调用。
如果希望调用同一个package中的mole,则直接import即可。也就是说,在mole_12.py中,可以直接使用
import mole_11
如果不在同一个package中,例如我们希望在mole_21.py中调用mole_11.py中的FuncA,则应该这样:
from mole_11包名.mole_11 import
funcA
包机制
# a.py
def add_func(a,b):
return a+b
# b.py
from a import add_func # Also can be : import a
print ("Import add_func from mole a")
print ("Result of 1 plus 2 is: ")
print (add_func(1,2)) # If using "import a" , then here should be "a.add_func"
mole可以定义在包里面.Python定义包的方式稍微有点古怪,假设我们有一个parent文件夹,该文件夹有一个child子文件夹.child中有一个mole
a.py . 如何让Python知道这个文件层次结构?很简单,每个目录都放一个名为_init_.py 的文件.该文件内容可以为空.这个层次结构如下所示:
parent
--__init_.py
--child
-- __init_.py
--a.py
b.py
那么Python如何找到我们定义的mole?在标准包sys中,path属性记录了Python的包路径.你可以将之打印出来:
import sys
print(sys.path)
通常我们可以将mole的包路径放到环境变量PYTHONPATH中,该环境变量会自动添加到sys.path属性.另一种方便的方法是编程中直接指定我们的mole路径到sys.path 中:
import sys
import os
sys.path.append(os.getcwd()+'\\parent\\child')
print(sys.path)
from a import add_func
print (sys.path)
print ("Import add_func from mole a")
print ("Result of 1 plus 2 is: ")
print (add_func(1,2))
知识点:
如何定义模块和包
如何将模块路径添加到系统路径,以便python找到它们
如何得到当前路径
4. python数据挖掘工具包有什么优缺点
【导读】python数据挖掘工具包就是scikit-learn,scikit-learn是一个基于NumPy, SciPy,
Matplotlib的开源机器学习工具包,主要涵盖分类,回归和聚类算法,例如SVM,
逻辑回归,朴素贝叶斯,随机森林,k-means等算法,代码和文档都非常不错,在许多Python项目中都有应用。
优点:
1、文档齐全:官方文档齐全,更新及时。
2、接口易用:针对所有算法提供了一致的接口调用规则,不管是KNN、K-Means还是PCA.
3、算法全面:涵盖主流机器学习任务的算法,包括回归算法、分类算法、聚类分析、数据降维处理等。
缺点:
缺点是scikit-learn不支持分布式计算,不适合用来处理超大型数据。
Pandas是一个强大的时间序列数据处理工具包,Pandas是基于Numpy构建的,比Numpy的使用更简单。最初开发的目的是为了分析财经数据,现在已经广泛应用在Python数据分析领域中。Pandas,最基础的数据结构是Series,用它来表达一行数据,可以理解为一维的数组。另一个关键的数据结构为DataFrame,它表示的是二维数组
Pandas是基于NumPy和Matplotlib开发的,主要用于数据分析和数据可视化,它的数据结构DataFrame和R语言里的data.frame很像,特别是对于时间序列数据有自己的一套分析机制。有一本书《Python
for Data Analysis》,作者是Pandas的主力开发,依次介绍了iPython, NumPy,
Pandas里的相关功能,数据可视化,数据清洗和加工,时间数据处理等,案例包括金融股票数据挖掘等,相当不错。
Mlpy是基于NumPy/SciPy的Python机器学习模块,它是Cython的扩展应用。
关于python数据挖掘工具包的优缺点,就给大家介绍到这里了,scikit-learn提供了一致的调用接口。它基于Numpy和scipy等Python数值计算库,提供了高效的算法实现,所以想要学习python,以上的内容得学会。
5. python如何粘包有没有专门的函数之类的
粘包与拆包是由于TCP协议是字节流协议,没有记录边界所导致的。所以如何确定一个完整的业务包就由应用层来处理了。(这就是分包机制,本质上就是要在应用层维护消息与消息的边界。)
分包机制一般有两个通用的解决方法;
1:特殊字符控制,例如FTP协议。2:在包头首都添加数据包的长度,例如HTTP协议。
所以说:粘包这种情况应用程序根本干涉不了,只能采用分包技术在应用层解决该问题。
6. python的回收机制是什么
Python中的垃圾回收机制总体上有三种,
引用计数
Python语言默认采用的垃圾收集机制是‘引用计数法 Reference Counting’,该算法最早George E. Collins在1960的时候首次提出,50年后的今天,该算法依然被很多编程语言使用,‘引用计数法’的原理是:每个对象维护一个ob_ref字段,用来记录该对象当前被引用的次数,每当新的引用指向该对象时,它的引用计数ob_ref加1,每当该对象的引用失效时计数ob_ref减1,一旦对象的引用计数为0,该对象立即被回收,对象占用的内存空间将被释放。它的缺点是需要额外的空间维护引用计数,这个问题是其次的,不过最主要的问题是它不能解决对象的“循环引用”,因此,也有很多语言比如Java并没有采用该算法做来垃圾的收集机制。
在上图中,我们把小黑圈视为全局变量,也就是把它作为root object,从小黑圈出发,对象1可直达,那么它将被标记,对象2、3可间接到达也会被标记,而4和5不可达,那么1、2、3就是活动对象,4和5是非活动对象会被GC回收。
标记清除算法作为Python的辅助垃圾收集技术主要处理的是一些容器对象,比如list、dict、tuple,instance等,因为对于字符串、数值对象是不可能造成循环引用问题。Python使用一个双向链表将这些容器对象组织起来。不过,这种简单粗暴的标记清除算法也有明显的缺点:清除非活动的对象前它必须顺序扫描整个堆内存,哪怕只剩下小部分活动对象也要扫描所有对象。
分代回收
分代回收是一种以空间换时间的操作方式,Python将内存根据对象的存活时间划分为不同的集合,每个集合称为一个代,Python将内存分为了3“代”,分别为年轻代(第0代)、中年代(第1代)、老年代(第2代),他们对应的是3个链表,它们的垃圾收集频率与对象的存活时间的增大而减小。新创建的对象都会分配在年轻代,年轻代链表的总数达到上限时,Python垃圾收集机制就会被触发,把那些可以被回收的对象回收掉,而那些不会回收的对象就会被移到中年代去,依此类推,老年代中的对象是存活时间最久的对象,甚至是存活于整个系统的生命周期内。同时,分代回收是建立在标记清除技术基础之上。分代回收同样作为Python的辅助垃圾收集技术处理那些容器对象。
Python垃圾回收机制--完美讲解! 东皇Amrzs
Python中的垃圾回收机制
7. python构成一个程序最基本的三部分
python程序可以分解为模块、语句、表达式和对象四部分
1,模块包含语句
2,语句包含表达式
3,表达式建立并处理对象
8. 求下面python代码的差别。
题主你好,
你不明白上面代码的原因,是因为你没弄明白python包导入的相关机制.
a.先说一下包, 包其实就是一个文件夹,我们假设这个文件夹叫A;
b.还有一个子包的概念, 结合上一句话,假如说包A下有个子包B,说白了就是A文件夹下有个子文件夹B;
c.再说一下包的特殊之处,就是每个包根目录下都有一个__init__.py文件, 关键来了, 这个__init__.py就是你在导入包的时候被执行的文件.
------------------------
先看一下selenium包的结构:
一环套一环吧.
写在最后: 其实问题关键点就一个: 直接导入包, 相当于执行包下的__init__.py文件, 而你第2种方法不能使用selenium.webdriver的原因是selenium文件夹下的__init__.py文件中没有相应的导入操作
希望可以帮到题主, 欢迎追问
9. Python是什么
Python由荷兰数学和计算机科学研究学会的Guido van Rossum 于1990
年代初设计,作为一门叫做ABC语言的替代品。Python提供了高效的高级数据结构,还能简单有效地面向对象编程。Python语法和动态类型,以及解释型语言的本质,使它成为多数平台上写脚本和快速开发应用的编程语言,随着版本的不断更新和语言新功能的添加,逐渐被用于独立的、大型项目的开发。
Python解释器易于扩展,可以使用C或C++(或者其他可以通过C调用的语言)扩展新的功能和数据类型。Python
也可用于可定制化软件中的扩展程序语言。Python丰富的标准库,提供了适用于各个主要系统平台的源码或机器码。
10. Python中有autoload机制吗
即使放入包中,也需要在文件开头import这个包时,才会起作用。
有点怪。
说个实际的问题,大家可能就有体会了。
python2.6中改变默认除法运行需要“from __future__ import division”,
假设我目的很明确,我所有的代码都希望以上面的方式进行除法运算,那么,现在我得每个文件头加这一行代码,
要是能有某种方式在一处位置就能解决这个目的,会方便很多。