由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - data.table is amazing
相关主题
那位大侠帮我debug 一下这个R and sqlite code公司里的data analysis一般用啥数据库软件?
能不能让R 读一个 150G 的 table?有人处理过.db文档么?
会R的麻烦进一下:R中怎么用SQL? 按道理不应该这么慢的。。。rpy2 is quite interesting
新人跪求指点HDF5 is really fast!
谁想要time series book( link )想多学点sql的知识,有没有什么书或者网站可以推荐的?
R help.折腾一天,解决不了。大家推荐下学习python,hadoop的网上资源
有没有SAS/R双修的大牛如何在personal pc, mac 上装mysql
database和SQL是不是很重要?Can R perform scheduled batch job run?
相关话题的讨论汇总
话题: amazing话题: sqldf话题: very话题: 100x话题: rsqlite
进入Statistics版参与讨论
1 (共1页)
s*********e
发帖数: 1051
D**u
发帖数: 288
2
Very impressive!
How long does this step take?
dt <- data.table(df)
D**u
发帖数: 288
3
I think Sqldf (working with SQLite) still have the edge in big data over
data.table.
s*********e
发帖数: 1051
4
Sqldf is slow, period

【在 D**u 的大作中提到】
: I think Sqldf (working with SQLite) still have the edge in big data over
: data.table.

D**u
发帖数: 288
5
Ok, I am going to try hdf5 + data.table combination, compare to rsqlite+
sqldf. That will be the optimal way I can think of now.
s*********e
发帖数: 1051
6
data.table is 100X faster than sqldf() for row extraction from a data.frame.
http://statcompute.wordpress.com/2013/01/01/efficiecy-of-extrac
w******4
发帖数: 488
7
Very useful. Thanks!
1 (共1页)
进入Statistics版参与讨论
相关主题
Can R perform scheduled batch job run?谁想要time series book( link )
numpy installation error: Python was built with Visual Studio 2003;R help.折腾一天,解决不了。
问一下, data mining是具体做什么工作?有没有SAS/R双修的大牛
求助!该如何准备这个电话面试?database和SQL是不是很重要?
那位大侠帮我debug 一下这个R and sqlite code公司里的data analysis一般用啥数据库软件?
能不能让R 读一个 150G 的 table?有人处理过.db文档么?
会R的麻烦进一下:R中怎么用SQL? 按道理不应该这么慢的。。。rpy2 is quite interesting
新人跪求指点HDF5 is really fast!
相关话题的讨论汇总
话题: amazing话题: sqldf话题: very话题: 100x话题: rsqlite