由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 来讲讲SAS的优点吧
相关主题
问题回复: Python为啥只有两个小时的课?最近统计工作好找吗
六月份上Python/R/Hive 课的同学请与我联系 也谈为什麽要学习Python
想做SAS programmer,求教各位前辈如何找intern机会二月及三月上Python/R/Hadoop/Tableau课的同学请与我联系
做培训的有一点感受给今年毕业的同学们出一个主意
SAS的前景可怕吗?也谈为什麽要学习Python(对Python没兴趣的请跳过:-)
在集成的cloudera hadoop中计算词频(wordcount)merge单个文件800GB的文件
大家推荐下学习python,hadoop的网上资源保险的modeler好不好?
~StatsGuy: 再次感谢选课的同学们!跪求Seattle附近统计职位内推
相关话题的讨论汇总
话题: sas话题: python话题: 操作话题: 数据话题: hadoop
进入Statistics版参与讨论
1 (共1页)
w********m
发帖数: 1137
1
作为酒精考验的sas certified programmer,我就抛砖引玉来讲讲SAS的优点吧
先从单机角度来看数据处理软件。SAS,Bash,Python,perl是行操作的,R,SQL,
Python/pandas,SAS/iml,matlab这些都是列操作的。行操作的是hard disk-bound,
虽然慢,但很暴力,多大的硬盘处理多大的数据, 列操作的都是memory-bound的,多
大的内存处理多大的数据。现在的数据都比较大,行操作软件能干的数据就比列操作的
多一个数量级吧。
SAS的语法跟python比较像,加一句for each_line in data: 写到SAS的data set里面
就很像python的语法了。所以本版的SAS大牛同时都是Python大牛,呵呵。Hadoop上面
,hive和pig是给不会scripting的人设计的,花架子比较大。真正能做data
exploration和cleaning只有靠python,streaming进到HDFS里面一行一行的干苦活。会
SAS的搞hadoop也会快一点。所以SAS有这一点优势。
w********m
发帖数: 1137
2
行操作和列操作的人思维都不一样
就像星际的人族和神族。
h***i
发帖数: 3844
3
y, recordIO vs columnIO

【在 w********m 的大作中提到】
: 行操作和列操作的人思维都不一样
: 就像星际的人族和神族。

1 (共1页)
进入Statistics版参与讨论
相关主题
跪求Seattle附近统计职位内推SAS的前景可怕吗?
求内推湾区analyst职位在集成的cloudera hadoop中计算词频(wordcount)
R 有点令人失望大家推荐下学习python,hadoop的网上资源
最近又被深深震撼了一次!!~StatsGuy: 再次感谢选课的同学们!
问题回复: Python为啥只有两个小时的课?最近统计工作好找吗
六月份上Python/R/Hive 课的同学请与我联系 也谈为什麽要学习Python
想做SAS programmer,求教各位前辈如何找intern机会二月及三月上Python/R/Hadoop/Tableau课的同学请与我联系
做培训的有一点感受给今年毕业的同学们出一个主意
相关话题的讨论汇总
话题: sas话题: python话题: 操作话题: 数据话题: hadoop