python统计_python 统计个数怎么统计

A. python 统计列表里面有多少个元素

Python 统计列表里面有多少个元素步骤如下：

1、打开python语言命令窗口，定义一个列表变量Z并打印对应的列表值。

B. python 如何统计元素出现的个数，以及每一次出现的位置

代码如下：
l = ['a', 'b', 'c', 'd']
cou = len(l); #取list元素个数
print 'list元素个数: %s' % cou #打印元素个数
for i in l:
print '第一个元素: %s, 元素位置: %s' % (i, l.index(i)) #打印元素位置望采纳，如有问题请追问，谢谢！

C. python 统计个数怎么统计

#-*-coding:cp936-*-
fruitfile=open(r"fruit.txt")
fruitdict={}
forlineinfruitfile.readlines():
fruit=line.split()[1]
iffruitdict.has_key(fruit):
fruitdict[fruit]+=1
else:
fruitdict[fruit]=1
fruitlist=[]
forkey,valueinfruitdict.items():
fruitlist.append((key,value))
fruitlist.sort(lambdaa,b:b[1],reverse=True)
iflen(fruitlist)>=3:
print"出现次数前三的水果:"
printfruitlist[0][0],fruitlist[0][1]
printfruitlist[1][0],fruitlist[1][1]
printfruitlist[2][0],fruitlist[2][1]
print"

所有水果出现次数:"
forkey,valueinfruitlist:
printkey,value

其中fruit.txt为文件名

D. 用Python怎么统计一个列表的元素种类和各个种类的个数

统计一个列表中每一个元素的个数在Python里有两种实现方式，

第一种是新建一个dict，键是列表中的元素，值是统计的个数，然后遍历list。

items=["cc","cc","ct","ct","ac"]

count={}
foriteminitems:
count[item]=count.get(item,0)+1
print(count)
#{'ac':1,'ct':2,'cc':2}

之中用到了一个小技巧，当dict中不还没有统计过一个元素时，直接索引count[item]会报错，而使用get方法count.get(item, 0)能够设置索引不存在的键时返回0。

第二种是使用Python内置的函数。统计元素的个数是一种非常常见的操作，Python的collection包里已经有一个Counter的类，大致实现了上面的功能。

fromcollectionsimportCounter

items=["cc","cc","ct","ct","ac"]
count=Counter(items)
print(count)
#Counter({'ct':2,'cc':2,'ac':1})

E. 如何统计python list中元素的个数及其位置

l=[1,2,3,4,1]#目标数列
targetnum=1#元素
number=l.count(targetnum)
print('个数:'+str(number))
i=number
index=[]
whilei>0:
forxinrange(len(l)):
ifl[x]==targetnum:
index.append(x+1)
i=i-1
print('位置（第几个）：'+str(index))

F. 用python实现信息的统计

你还是自己编吧，没人会编整个程序的

G. python如何统计字符串

判断特定词出现很容易，统计出现次数也很容易。但是处于多个特定词之后的每一个非特定词归哪个特定词？还有，后出现的关键词不需要作为先出现的关键词的子项吧？

我觉得用hash表比较方便表示。另外，关键词放到一个列表里。['cnn.com','amazon.com',...]
然后构建一个hash表Map 【键就是关键词，值是一个hash表，每项是词：计数的形式】
{ {'cnn.com': { 'a.com':1 },... },'amazon.com':{ 'bb.com':1,...},... }
这个表是处理过程中逐步建立起来的

然后每次遇到一次词X，比较是否在关键词列表中，如果是并且hash表中没有，加到hash表中，Map[X]={},否则不添加；
如果不是关键词，那么在Map表中每个项记上一笔【当然，如果不在一个关键词的值hash表中噢，新增一项，否则增加计数】。
最后，遍历关键词hash表，并对值按照逆序输出。就是你要求的格式。

H. python如何统计列表的长度

参考代码：

list1 = ['physics', 'chemistry', 1997, 2000];
list2 = [1, 2, 3, 4, 5 ];
list3 = ["a", "b", "c"];
len(list1)
len(list2)
len(list3)

Python支持列表切割(list slices)，可以取得完整列表的一部分。支持切割操作的类型有str, bytes, list, tuple等。它的语法是...[left:right]或者...[left:right:stride]。假定nums变量的值是[1, 3, 5, 7,]，那么下面几个语句为真：

nums[2:5] == [5, 7] 从下标为2的元素切割到下标为5的元素，但不包含下标为5的元素。

nums[1:] == [3, 5, 7] 切割到最后一个元素。

nums[:-3] == [1, 3, 5, 7] 从最开始的元素一直切割到倒数第3个元素。

nums[:] == [1, 3, 5, 7] 返回所有元素。改变新的列表不会影响到nums。

nums[1:5:2] == [3, 7] 从下标为1的元素切割到下标为5的元素但不包含下标为5的元素，且步长为2。

(8)python统计扩展阅读：

Python 是一门有条理的和强大的面向对象的程序设计语言，类似于Perl, Ruby, Scheme, Java。

Python在设计上坚持了清晰划一的风格，这使得Python成为一门易读、易维护，并且被大量用户所欢迎的、用途广泛的语言。

设计者开发时总的指导思想是，对于一个特定的问题，只要有一种最好的方法来解决就好了。这在由Tim Peters写的Python格言（称为The Zen of Python）里面表述为：There should be one-- and preferably only one --obvious way to do it. 这正好和Perl语言（另一种功能类似的高级动态语言）的中心思想TMTOWTDI（There's More Than One Way To Do It）完全相反。

Python的作者有意的设计限制性很强的语法，使得不好的编程习惯（例如if语句的下一行不向右缩进）都不能通过编译。其中很重要的一项就是Python的缩进规则。

I. 如何高效地使用Python统计数据的频率

之前用 Python 写过一个脚本，用来处理上千万用户的一些数据，其中有一个需求是统计用户的某一数据的去重数量。为了加快程序的速度，我启用了多进程。但不幸的是，程序跑了近一个星期，还没处理完。这时，我感觉到了不对，于是开始查看程序的性能瓶颈。
对于统计去重数，我是将用户的数据放到一个列表中，然后用 len(set(data)) 去统计去重数量。刚开始我以为这的数据量并不大，每个用户的数据不会过百，我并没有注意到有的用户会有上万条的数据，因此消耗了大量的时间（其实我的脚本消耗时间最大的地方是因为从远程 redis 中取大量数据时发生长时间的阻塞，甚至连接超时，最后我采用的方式分而治之，每次取少量的数据，这样大大的提高了性能）。
为了做优化，我开始寻求高效的方法。我发现，有大量的人认为采用字典效率会更高，即：
data_unique = {}.fromkeys(data).keys() len(data_unique)

于是，我做了下测试：
In [1]: import random In [2]: data = [random.randint(0, 1000) for _ in xrange(1000000)] In [3]: %timeit len(set(data)) 10 loops, best of 3: 39.7 ms per loop In [4]: %timeit len({}.fromkeys(data).keys()) 10 loops, best of 3: 43.5 ms per loop

由此可见，采用字典和采用集合的性能是差不多的，甚至可能还要慢些。
在 Python 中其实有很多高效的库，例如用 numpy、pandas 来处理数据，其性能接近于 C 语言。那么，我们就用 numpy 和 pandas 来解决这个问题，这里我还比较了获取去重数据的性能，代码如下：
import collections import random as py_random import timeit import numpy.random as np_random import pandas as pd DATA_SIZE = 10000000 def py_cal_len(): data = [py_random.randint(0, 1000) for _ in xrange(DATA_SIZE)] len(set(data)) def pd_cal_len(): data = np_random.randint(1000, size=DATA_SIZE) data = pd.Series(data) data_unique = data.value_counts() data_unique.size def py_count(): data = [py_random.randint(0, 1000) for _ in xrange(DATA_SIZE)] collections.Counter(data) def pd_count(): data = np_random.randint(1000, size=DATA_SIZE) data = pd.Series(data) data.value_counts() # Script starts from here if __name__ == "__main__": t1 = timeit.Timer("py_cal_len()", setup="from __main__ import py_cal_len") t2 = timeit.Timer("pd_cal_len()", setup="from __main__ import pd_cal_len") t3 = timeit.Timer("py_count()", setup="from __main__ import py_count") t4 = timeit.Timer("pd_count()", setup="from __main__ import pd_count") print t1.timeit(number=1) print t2.timeit(number=1) print t3.timeit(number=1) print t4.timeit(number=1)

运行结果：
12.438587904 0.435907125473 14.6431810856 0.258564949036

利用 pandas 统计数据的去重数和去重数据，其性能是 Python 原生函数的 10 倍以上。

J. 如何使用python 统计网站访问量并生成报表

统计网站访问量
统计出每个IP的访问量有多少？（从日志文件中查找）

#!/usr/bin/env python
#!coding=utf-8
list = []
f = file('/tmp/1.log')
str1 = f.readlines()
f.close()
for i in str1:
ip = i.split()[0] //split()通过指定分隔符对字符串进行切片，默认为所有的空字符；split分隔后是一个列表，[0]表示取其第一个元素；
list.append(ip)//追加
list_num = set(list)
for j in list_num:
num = list.count(j)
print '%s : %s' %(j,num)

生成报表
#_*_coding:utf-8_*_

import MySQLdb
import xlwt
from datetime import datetime

def get_data(sql):

# 创建数据库连接.
conn = MySQLdb.connect(host='127.0.0.1',user='root'\
,passwd='123456',db='test',port=3306,charset='utf8')
# 创建游标
cur = conn.cursor()
# 执行查询，
cur.execute(sql)
# 由于查询语句仅会返回受影响的记录条数并不会返回数据库中实际的值，所以此处需要fetchall()来获取所有内容。
result = cur.fetchall()
#关闭游标
cur.close()
#关闭数据库连接
conn.close
# 返给结果给函数调用者。
return result

def write_data_to_excel(name,sql):

# 将sql作为参数传递调用get_data并将结果赋值给result,(result为一个嵌套元组)
result = get_data(sql)
# 实例化一个Workbook()对象(即excel文件)
wbk = xlwt.Workbook()
# 新建一个名为Sheet1的excel sheet。此处的cell_overwrite_ok =True是为了能对同一个单元格重复操作。
sheet = wbk.add_sheet('Sheet1',cell_overwrite_ok=True)
# 获取当前日期，得到一个datetime对象如：(2016, 8, 9, 23, 12, 23, 424000)
today = datetime.today()
# 将获取到的datetime对象仅取日期如：2016-8-9
today_date = datetime.date(today)
# 遍历result中的没个元素。
for i in xrange(len(result)):
#对result的每个子元素作遍历，
for j in xrange(len(result[i])):
#将每一行的每个元素按行号i,列号j,写入到excel中。
sheet.write(i,j,result[i][j])
# 以传递的name+当前日期作为excel名称保存。
wbk.save(name+str(today_date)+'.xls')

# 如果该文件不是被import,则执行下面代码。
if __name__ == '__main__':
#定义一个字典，key为对应的数据类型也用作excel命名，value为查询语句
db_dict = {'test':'select * from student'}
# 遍历字典每个元素的key和value。
for k,v in db_dict.items():
# 用字典的每个key和value调用write_data_to_excel函数。
write_data_to_excel(k,v)

导航:首页 > 编程语言 > python统计

python统计

与python统计相关的资料