A. 求助,怎么利用python爬取贴吧帖子楼中楼的
楼中楼里面没办法看原贴,不过我可以教你一个办法,你可以在楼中楼里回复一下,再从你的回复贴里面找原贴就行了。
B. 进来吧,给自己10分钟,这篇文章带你直接学会python
Python的语言特性
Python是一门具有强类型(即变量类型是强制要求的)、动态性、隐式类型(不需要做变量声明)、大小写敏感(var和VAR代表了不同的变量)以及面向对象(一切皆为对象)等特点的编程语言。
获取帮助
你可以很容易的通过Python解释器获取帮助。如果你想知道一个对象(object)是如何工作的,那么你所需要做的就是调用help(<object>)!另外还有一些有用的方法,dir()会显示该对象的所有方法,还有<object>.__doc__会显示其文档:
语法
Python中没有强制的语句终止字符,且代码块是通过缩进来指示的。缩进表示一个代码块的开始,逆缩进则表示一个代码块的结束。声明以冒号(:)字符结束,并且开启一个缩进级别。单行注释以井号字符(#)开头,多行注释则以多行字符串的形式出现。赋值(事实上是将对象绑定到名字)通过等号(“=”)实现,双等号(“==”)用于相等判断,”+=”和”-=”用于增加/减少运算(由符号右边的值确定增加/减少的值)。这适用于许多数据类型,包括字符串。你也可以在一行上使用多个变量。例如:
数据类型
Python具有列表(list)、元组(tuple)和字典(dictionaries)三种基本的数据结构,而集合(sets)则包含在集合库中(但从Python2.5版本开始正式成为Python内建类型)。列表的特点跟一维数组类似(当然你也可以创建类似多维数组的“列表的列表”),字典则是具有关联关系的数组(通常也叫做哈希表),而元组则是不可变的一维数组(Python中“数组”可以包含任何类型的元素,这样你就可以使用混合元素,例如整数、字符串或是嵌套包含列表、字典或元组)。数组中第一个元素索引值(下标)为0,使用负数索引值能够从后向前访问数组元素,-1表示最后一个元素。数组元素还能指向函数。来看下面的用法:
字符串
Python中的字符串使用单引号(‘)或是双引号(“)来进行标示,并且你还能够在通过某一种标示的字符串中使用另外一种标示符(例如 “He said ‘hello’.”)。而多行字符串可以通过三个连续的单引号(”’)或是双引号(“””)来进行标示。Python可以通过u”This is a unicode string”这样的语法使用Unicode字符串。如果想通过变量来填充字符串,那么可以使用取模运算符(%)和一个元组。使用方式是在目标字符串中从左至右使用%s来指代变量的位置,或者使用字典来代替,示例如下:
流程控制
Python中可以使用if、for和while来实现流程控制。Python中并没有select,取而代之使用if来实现。使用for来枚举列表中的元素。如果希望生成一个由数字组成的列表,则可以使用range(<number>)函数。
函数
函数通过“def”关键字进行声明。可选参数以集合的方式出现在函数声明中并紧跟着必选参数,可选参数可以在函数声明中被赋予一个默认值。已命名的参数需要赋值。函数可以返回一个元组(使用元组拆包可以有效返回多个值)。Lambda函数是由一个单独的语句组成的特殊函数,参数通过引用进行传递,但对于不可变类型(例如元组,整数,字符串等)则不能够被改变。这是因为只传递了该变量的内存地址,并且只有丢弃了旧的对象后,变量才能绑定一个对象,所以不可变类型是被替换而不是改变(译者注:虽然Python传递的参数形式本质上是引用传递,但是会产生值传递的效果)。
类
Python支持有限的多继承形式。私有变量和方法可以通过添加至少两个前导下划线和最多尾随一个下划线的形式进行声明(如“__spam”,这只是惯例,而不是Python的强制要求)。当然,我们也可以给类的实例取任意名称。
导入
外部库可以使用 import [libname] 关键字来导入。同时,你还可以用 from [libname] import [funcname] 来导入所需要的函数。例如:
C. python语言很难学的吧
python就是以他简单易学出名的。几乎是现在最简单,却可塑性最高的语言了。一般有其它编程语言基础的,自学,三小时左右就能学会。
D. python开发类似豆瓣,微博,贴吧网站的思想和技巧
汗……语言跟网站之间的鸿沟是很远很远的……
看看 Django 和 web.py 吧。肯定还是有很多地方要自己配置修改的。不过从简单的做起嘛。
不是三言两语能讲清楚的。报个培训班可能会快一些。
E. 【python写的百度贴吧下载图片】怎么下载其他的图片
看你代码的意思就是匹配到第一个内容之后,完成下载,结束程序,所以只要加个循环就好了,具体的循环条件自己再看一下就好了
F. python抓取贴吧数据的脚本问题
代码过长的话可以把源码文件上传到网络网盘然后在这里贴共享链接。或者代码发到贴吧也是可以的。
G. 用Python怎么可以抓取到贴吧帖子的id和相应内
看错误跟文件大小并无关系。估计是一些很简单的错误,建议 1,贴出原始代码中的open语句看看。 2,备份现有的 ”测试.txt“,重建一个空的”测试.txt“放在相同的目录下,再次测试。
H. 各个都学python,python要得了那么多人吧啊!
要不了那么多人,不是所有人都有机会做纯Python的工作。但是学Python可以是一项很有用多技能,尤其是在科学计算领域,
Python能极大提高处理信息的效率,在处理小问题的时候,尤其明显。
I. python可以抓取百度贴吧某人参与的所有贴子吗
可以啊,看你则么使用正则运算了
另外要设置IP池,别被网络屏蔽了、
J. 如何用python统计一个贴吧的发帖人个数以及评论的个数啊
用urllib读取网页的html代码,找到你个数字在文件中的位置就可以了