‘壹’ 同样的python代码通过python文件运行正常,但是直接在解释器里面逐行写的时候报语法错误,这是为什么呢
对于Python而言,存储好的脚本文件(Script file)和在Console中的交互式(interactive)命令,执行方式不同。对于脚本文件,解释器将其当作整个代码块执行,而对于交互性命令行中的每一条命令,解释器将其当作单独的代码块执行。而Python在执行同一个代码块的初始化对象的命令时,会检查是否其值是否已经存在,如果存在,会将其重用(这句话不够严谨,后面会详谈)。所以在你给出的例子中,文件执行时(同一个代码块)会把a、b两个变量指向同一个对象;而在命令行执行时,a、b赋值语句分别被当作两个代码块执行,所以会得到两个不同的对象,因而is判断返回False。
# 如果你能理解上面一段,就不用看下面的废话了。
下面是详细的回答:
说真的,这简直是我最近在知乎遇到过的最好的问题!
这个问题远超我想象中的复杂。我本来以为我能用两分钟搞定这种每日一水的问题,结果我花了一个小时搜来搜去,读来读去,还跑去群里跟人讨论了一阵,都没能找到答案。
大概两个小时以后,我找到了相对正确的答案,把自己已经弄懂的部分强答一番,并邀请一些大神,希望能看到更为准确的回答。
这个问题的博大精深在于,能从中扯出许多小问题来,虽然这些东西很细枝末节,很trick,在日常编程中不怎么用的到,更不怎么需要额外关注,但是理解这些问题,对于我们理解Python的对象机制乃至内存处理机制有很大的帮助。
我从头开始说,大概会分以下几个部分来谈,每个部分其实都能展开很广,这次就把与问题相关的知识简单一提:
(虽然我觉得按照我寻找答案的过程讲,可能对认知更有帮助,但是理清头绪的话可能更好理解,之后会找时间为这个问题写篇文章好好记录一下)
Python中的数据类型——可变与不可变
Python中is比较与==比较的区别
Python中对小整数的缓存机制
Python程序的结构——代码块
Python的内存管理——新建对象时的操作
声明:以下所讲机制,与Python不同版本的具体实现有关(implement specific)可能不同。
Python中的数据类型
Python中的数据类型,这可能是大家入门Python的第一节课。很简单嘛,大家最常用的,int(包括long)、float、string、list、tuple、dict,加上bool和NoneType。
但是这里要重点说的,其实是可变类型和不可变类型。
不可变(immutable):Number(包括int、float),String,Tuple
可变(mutable):Dict,List,User-defined class
首先我们要记住一句话,一切皆对象。Python中把任何一种Type都当作对象来处理。其中有一些类型是不可变的,比如:
这个还是好理解的,在初始化赋值一个字符串后,我们没有办法直接修改它的值。但是数字呢?数字这种变来变去的又怎么理解。
可以看出,a的值虽然从10变成了11,但是a这个变量指向内存中的位置发生了变化,也就是说我们并没有对a指向的内存进行操作,而是对a进行了重新赋值。
再简单举一个可变的例子。
体会了可变与不可变的外在表现后,简单理解一下为什么不可变。
Python官方文档这样解释字符串不可变:
There are several advantages.
One is performance: knowing that a string is immutable means we can allocate space for it at creation time, and the storage requirements are fixed and unchanging. This is also one of the reasons for the distinction between tuples and lists.
Another advantage is that strings in Python are considered as “elemental” as numbers. No amount of activity will change the value 8 to anything else, and in Python, no amount of activity will change the string “eight” to anything else.
个人感觉,有性能上的考虑(比如对一些固定不变的元素给予固定的存储位置,整数这样操作比较方便,字符串的话涉及一些比较也会减少后续操作的时间),也有一些安全上的考虑(比如列表中的值会改变,元组不会)。这个我也不太精通,就不展开谈了。
Python中is比较与==比较的区别
前面已经提过一次,Python中一切皆对象。对象包含三个要素,id、type、value。
而Python中用于比较“相等”这一概念的操作符,is和==。
当两个变量指向了同一个对象时,is会返回True(即is比较的是两个变量的id);
当两个变量的值相同时,==会返回True(即==比较的是两个变量的value)。
示例(命令行交互模式下):
第一个和第三个示例是好理解的。
但是第二个就不那么好理解了,尤其是配合下面这个(假定我们已经知道命令行中的语句执行是单独执行两次不会相互影响,后面会具体解释):
为什么a、b分别赋值1000时is比较返回False,可以分别赋值100就会返回True?
Python中对小整数的缓存机制
Python官方文档中这么说:
The current implementation keeps an array of integer objects for all integers between -5 and 256, when you create an int in that range you actually just get back a reference to the existing object. So it should be possible to change the value of 1. I suspect the behaviour of Python in this case is undefined. :-)简单来说就是,Python自动将-5~256的整数进行了缓存,当你将这些整数赋值给变量时,并不会重新创建对象,而是使用已经创建好的缓存对象。
Python程序的结构——代码块&Python的内存管理——新建对象时的操作
终于要来到题主问题的部分了。
先来看最让我们困惑的,也就是题主给出的示例吧(接下来用float演示,int是同样的情况):
交互命令行下:
同样的还有:
(说好的小整数才有缓存呢(摔)!这跟你讲的不一样啊教练!)
这就很尴尬了对吧。
其实从结果论出发,我们很容易猜到结论,就像题主自己也猜了个差不多——缓存机制不同。毕竟is比较的就是对象的id,也就是对象在内存中的位置,也就是是不是同一个对象。
既然脚本文件的执行结果是True,那么,他俩就是同一个对象;既然命令行执行的结果是False,那么他俩就不是同一个对象。(这他喵的不是废话吗!)
所以我开始了漫长的找原理的过程……然而网上这方面提及的实在太少。尤其是大家的大部分讨论都是int的小整数缓存机制;就算讨论到了float,也不实际解决我们的问题。
其实我都快要放弃了,漫无目的地翻stackoverflow推荐的相关问题时终于找到了一个类似的情况,但是人家并不是比较的脚本文件和命令行执行,而是比较的函数体和赋值语句:
同样的代码,拆开就是False,放函数里就是True!是不是很像我们遇到的情况了。
根据提示我们从官方文档找到了这样的说法:
A Python program is constructed from code blocks. A block is a piece of Python program text that is executed as a unit. The following are blocks: a mole, a function body, and a class definition. Each command typed interactively is a block. A script file (a file given as standard input to the interpreter or specified as a command line argument to the interpreter) is a code block. A script command (a command specified on the interpreter command line with the ‘-c‘ option) is a code block. The string argument passed to the built-in functions eval() and exec() is a code block.
A code block is executed in an execution frame. A frame contains some administrative information (used for debugging) and determines where and how execution continues after the code block’s execution has completed.
没错!跟我们猜的一样!这就是原理的出处了!
代码块作为一个执行单元,一个模块、一个函数体、一个类定义、一个脚本文件,都是一个代码块。
在交互式命令行中,每行代码单独视作一个代码块。
至此问题解决……了吗?视作一个代码块,就意味着要把相同value的赋值指向相同的对象吗?
在此重复一下'is' operator behaves unexpectedly with non-cached integers中提到的实验,并简单翻译结论。
通过compile()函数和dis模块的code_info()函数来检测我们执行的命令的信息。
示例:
可以看出,分别赋值a,b得到的value相等,id是不一样的。
把10.0 10.0 10.1分别赋值给a,b,c,可以看出结果中其实只保存了一个10.0,也就是a,b共用了这个数值。
也就是说,当命令行执行时,是以single的模式来compile代码(2. Built-in Functions)。它会在u_consts字典中记录对象常量。
The mode argument specifies what kind of code must be compiled; it can be 'exec' if source consists of a sequence of statements, 'eval' if it consists of a single expression, or 'single' if it consists of a single interactive statement (in the latter case, expression statements that evaluate to something other than None will be printed).而在同一代码块执行时,当增加新的常量,会先在字典中查询记录,所以相同赋值的变量会指向同一个对象而不是新建对象。
至此…问题大概是解决了。
‘贰’ python如何运行
Python是一门高级编程语言,广泛应用于数据科学、机器学习、人工智能等领域。Python的运行需要安装Python解释器,可以在各个操作系统上运行。要运行Python代码,可以使用命令行界面或者集配备成开发环境(IDE)。
使用命令行界面运行Python代码需要打开终端,并输入信森Python解释器的命令。在Windows系统上,可以在命令提示符下输入"python",在Mac和Linux系统上,可以在终端下输入"python3"。这将打开Python解释器,可以在其中输入Python代码并执行。
使用集成开发环境运行Python代码可以提供更方便的编程环境和更强大的功能。流行培坦毁的Python集成开发环境包括PyCharm、Spyder、Jupyter Notebook等。在这些环境中,可以使用图形界面来编写和运行Python代码,同时还具有代码自动补全、调试、版本控制等功能。
无论使用哪种方法运行Python代码,都需要熟悉Python语言的语法和基本概念。Python是一门易于学习的语言,具有简洁明了的语法和丰富的标准库。在Python中,可以使用各种数据类型、控制结构和函数等基本构造块来编写代码。同时,Python还提供了大量的第三方库和工具,可以方便地进行数据分析、机器学习、图像处理等任务。
总之,Python是一门功能强大的编程语言,可以应用于各种领域。无论是初学者还是专业开发人员,都可以使用Python来实现自己的编程目标。
‘叁’ python代码运行需要编译吗
有人在讨论 Python 代码是编译执行还是解释执行?这个问题还可以换一种说法: Python 是编译型语言还是解释型语言?回答这个问题
前,我们先弄清楚什么是编译型语言,什么是解释型语言。
所谓编译执行就是源代码经过编译器编译处理,生成目标机器码,就是机器能直接运行的二进制代码,下次运行时无需重新编译。不过它
是针对特定CPU体系的,这些目标代码只能在特定平台执行,如果这个程序需要在另外一种 CPU 上面运行,这个代码就必须重新编译。
它不具备可移植性,但是执行速度快,C、C++这类语言属于编译型语言。
而解释型语言是在代码运行期间逐行翻译成目标机器码,下次执行时,还是需要逐行解释,我们可以简单认为 Java、Python 都是解释型
语言。
编译型相当于厨师直接做好一桌子菜,顾客来了直接开吃,而解释型就像吃火锅,厨师把菜洗好,顾客需要自己动手边煮边吃,效率上来
说解释型语言自然比不过编译型语言,当然也不是绝对了,像 JIT 的效率就很高
以上是对编译型语言和解释型语言的一个简单粗暴的区分,但是 Python(这里主要是指CPython)并不是严格的解释型语言,因为
Python 代码在运行前,会先编译(翻译)成中间代码,每个 .py 文件将被换转成 .pyc 文件,.pyc 就是一种字节码文件,它是与平台无
关的中间代码,不管你放在 Windows 还是 Linux 平台都可以执行,运行时将由虚拟机逐行把字节码翻译成目标代码。
我们安装Python 时候,会有一个 Python.exe 文件,它就是 Python 解释器,你写的每一行 Python 代码都是由它负责执行,解释器由
一个编译器和一个虚拟机构成,编译器负责将源代码转换成字节码文件,而虚拟机负责执行字节码,所以,解释型语言其实也有编译过
程,只不过这个编译过程并不是直接生成目标代码,而是中间代码(字节码),然后再通过虚拟机来逐行解释执行字节码。
总结
Python代码首先会编程一个字节码文件,再由虚拟机逐行解释,把每一行字节码代码翻译成目标指令给CPU执行。
推荐学习《Python教程》。
‘肆’ Python敲代码时怎么换行,每次一按Enter键就直接执行程序了,可是代码还没有写完啊。。。
1、Windows使用win+R键进入命令行模式。
‘伍’ 同样的python代码通过执行py文件运行正常,但是直接在编译器里面逐行写的时候报语法错误,这是为什么呢
格式问题,执行语句前面需要空四格
‘陆’ 怎么运行python代码
直接点击文件图标运行程序。
在系统交互式命令行中运行【代码】:进入方式【win+R快捷键】-【输入cmd确认】-【输入python回车】,运行Python程序。
Python开发者有意让违反察哗拍了缩进规则的程序不能通过编译,以此来强制程序员养成良好的编程习惯。并且Python语言利用缩进表示语句块的开始和退出(Off-side规则),而非使用花括号或者某种关键字。增加缩进表示语句块的开始,而减少缩进则表示语句块的退出。缩进成为了语法的一部分。
Python采用动态类型系统。在编芦中译的时候,Python不会败羡检查对象是否拥有被调用的方法或者属性,而是直至运行时,才做出检查。所以操作对象时可能会抛出异常。不过,虽然Python采用动态类型系统,它同时也是强类型的。Python禁止没有明确定义的操作,比如数字加字符串。
‘柒’ python如何运行
python程序的运行方式有两种:1、交互式,在滑庆命令行窗口输入命令,进入python解释器交互式客户端,在窗口输入任意python代码,客户端窗口都会立即返回运行结果,当关闭客户端窗口后,代码不会保存。
这种交互式方式一般用来进行测试,不是正式的运行方式。
2、脚本式。
按照惯例学习每一门编程语言的第一个程序都是打印含让困'helloworld!',python也不例外。
任意文本编辑工具都可以进行python代码的编写,在桌面新建一个文本文档,写入print('helloworld')代码,然后保存。
现在这个文档就是一个python的源代码文件,通常称为python脚本文件,通常我们会将python脚本文件的后缀改为.py,python代码需要通过python解释器解释成机器码后交由谈念计算机执行,在命令行输入命令:python脚本文件路径,就可以运行对应的脚本代码。
‘捌’ 怎么用python实现两个文件逐行计算两个区间的并集
有时候,为来了需求,需要统计两个 list 之间的交集,并集,差集。查询了一些资料,现在源总结在下面:
1. 获取两个list 的zd交集
#方法一:
a=[2,3,4,5]
b=[2,5,8]
tmp = [val for val in a if val in b]
print tmp
#[2, 5]
#方法二
print list(set(a).intersection(set(b)))
2. 获取两个list 的并集
print list(set(a).union(set(b)))
3. 获取两个 list 的差集
print list(set(b).difference(set(a))) # b中有而a中没有的