由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - python pandas reading large csv file
相关主题
问个python读取大文件的问题从心底讨厌scala
怎样用Python选一部分数据出来从java读取python输出的pytables
快要被Python的兼容性弄疯了python pandas DataFrame的index为什么是日期而不是integer in
求python大牛指路python这中垃圾语言流行还是因为半路出家的人太多
Re: 有谁觉得做bioinformatics 的数据分析 python比R好的? (转载)python在2009年差点死掉,后来为什么起死回生了?
python要搞type hint了无比悲惨的一天
Anaconda装起来会跟已有的python dist有什么冲突吗?anaconda是python的超级集合?
易写性,易维护和执行效率综合来看数据库小白请教:如果数据库文件很大,MySQL和Python Pandas分
相关话题的讨论汇总
话题: pandas话题: csv话题: reading话题: file话题: python
进入Programming版参与讨论
1 (共1页)
c*******y
发帖数: 1630
1
like 5G, 100M rows.
how to read such file in pandas, read_csv is too slow.
does not look like lazy reading.
Thanks
w*x
发帖数: 518
2
我也很好奇……
话说pd.read_csv已经算快的了,用np.loadtxt会更可怕……
要是结构比较consistent可以用C自己写一个?
w*x
发帖数: 518
3
对了,OP不知道试过np.memmap没?
http://docs.scipy.org/doc/numpy/reference/generated/numpy.memma
c*******y
发帖数: 1630
4
没试过,这个就算可以,估计跟pandas怎么结合用,还要琢磨一阵子。

【在 w*x 的大作中提到】
: 对了,OP不知道试过np.memmap没?
: http://docs.scipy.org/doc/numpy/reference/generated/numpy.memma

1 (共1页)
进入Programming版参与讨论
相关主题
数据库小白请教:如果数据库文件很大,MySQL和Python Pandas分Re: 有谁觉得做bioinformatics 的数据分析 python比R好的? (转载)
Python pandas 是坑不?python要搞type hint了
用python分析big data,用哪个library好?Anaconda装起来会跟已有的python dist有什么冲突吗?
Pandas问题不少啊...易写性,易维护和执行效率综合来看
问个python读取大文件的问题从心底讨厌scala
怎样用Python选一部分数据出来从java读取python输出的pytables
快要被Python的兼容性弄疯了python pandas DataFrame的index为什么是日期而不是integer in
求python大牛指路python这中垃圾语言流行还是因为半路出家的人太多
相关话题的讨论汇总
话题: pandas话题: csv话题: reading话题: file话题: python