导航:首页 > 编程语言 > pythonnumpy随机数

pythonnumpy随机数

发布时间:2023-03-01 07:44:02

① 【python 】性能优化系列:随机数

最近在做的项目重点部分与大量生成随机数有关,维度高达[1700000,10000],需要生成 10 x 30 次左右,这里遇到内存和速度的双重瓶颈,特地研究了一下如何优化随机数。

优化时间测试所需的分析工具在另一篇博客《性能优化系列一:分析工具》中提到。

原生的python中也有随机模块生成 random.randint 和 random.random 等,但是速度非常慢,numpy 速度可以大幅提升。一般都采用numpy生成随机数。

比较常用的就是以上几种。在需要生成大量随机数的情况下,或生成伪随机数的情况下,python 3.7 常用 RandomState 。

直接生成大规模非稀疏矩阵如下,经常遇到 MemoryError 的错误,大概是同时生成多个float64精度的大规模随机矩阵服务器内存不够,而random state 似乎也没提供调整类型的attr,

这时最好使用即使生成即使销毁,仅保留种子作为索引,同样,多个CPU之间共享大规模矩阵涉及到共享内存或数据传输同步较慢的问题,最好也共享seed而不是直接共享矩阵。

ps. 这里注意一般我们设置time.time()为种子时,对于并发性程序是无效的,不要在并发程序中同时定义,建议生成一个seed list 列表再从中取。

这里可以对大规模矩阵进行分片以进行后续的np 乘法,再切片赋值,以时间换内存。这种情况的麻烦在于如果设定随机数种子会导致每个分片的随机数相同。可以利用一个最初seed(爷爷种子)randint生成 一组切片组数的seed(父亲种子),再每次从中取不同的随机数。

在上述切片方法尝试之后,可以解决内存问题。但是时间非常慢,特别是采取s = 1时在standard normal 上调用170万次的时间长达3000s,line search一下搜索了大约100000为切片值仍然太慢。在文档中发现了 BitGenerator 和 Generator ,大约可以提速到原来的 1/3。

除了Numpy和基本模块之外,AES CTR 加密算法生成随机数也很快,但是并不能有比较方便的方式控制每次生成的一样。参见以下reference。

tensorflow 和 pytorch 也都有大规模生成随机tensor的方式。性能待考。

1. 超快生成随机数的方式CSDN博客
2. tensorflow 生成随机tensor

阅读全文

与pythonnumpy随机数相关的资料

热点内容
window命令行svn 浏览:615
8051单片机包含多大的ram 浏览:811
man文件linux 浏览:282
javaweb实现页面跳转 浏览:125
命令如什么 浏览:315
centos如何使用ftp服务器 浏览:981
直立车陀螺仪算法 浏览:69
coreldrawpdf下载 浏览:895
虚拟主机云服务器软件服务 浏览:370
苹果的怎么拉安卓的打游戏 浏览:412
游戏程序员负责角色 浏览:313
于丹pdf 浏览:717
反编译ref 浏览:550
鸿蒙智能文件夹怎么弄 浏览:547
grunt压缩html 浏览:791
macpdfword转换器 浏览:908
压缩面膜是什么材质 浏览:355
抖音发布作品怎么建文件夹 浏览:17
安卓如何更改谷歌地区 浏览:276
airpods为什么安卓连上声音很大 浏览:514