由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - SAS的前景可怕吗?
相关主题
来讲讲SAS的优点吧Re: 请问SAS如何学起?
R 有点令人失望[合集] Can we calculate log likelihood ratio using SAS???
关于SAS,SPSS,R,PythonSAS9里面用ODS画survival (K-M plot) 的问题
银行十年内是不会用python和R的。。。How to format the SAS output?
诚心求教,这样条件合适找什么样的工作?求助:SAS data set输出
怎么由 SAS programmer 转成 data scientist (转载)SAS急问:怎样在PROC REPORT 的TITLE 部分加粗字体(BOLD)?不用ODS怎样做?
请问湾区有什么biostatistican或SAS编程的职位吗?ods rtf startpage=never does not work anymore in SAS9.2?
再谈湾区工作,Python R及SASSAS使用到什么水平才算是高手?
相关话题的讨论汇总
话题: sas话题: python话题: java话题: hadoop话题: data
1 (共1页)
j********t
发帖数: 201
1
SAS的前景可怕吗?
One student got a job from pharmaceutical industry and asked me to be her
referral. At the end of our conversation, she asked if her SAS programmer
position is stable and if she needs to learn Python ASAP.
Her quote is: some people at MITBBS had created the feeling that SAS is
going to die.
I know the posts about R/Python. But I did not know they are so influential
to the new gradates. Therefore, I feel it is necessary to post my 3 cents
from my point of view.
Here are a few points I want to make:
1) Number of positions. I don't have exact data. But let me tell you what
I can see from personal contacts: many big pharmaceutical companies hire
hundreds of statisticians / SAS programers. Not just that. Chase has one
office in PA/NJ border and has over 200 SAS programmers.
In the past 2 weeks, I gave 4 referrals to four people who found jobs, 1
with Ph.D, other 3 with masters: all in pharma.
In the past month, I know 2 got on sites, one with Ph.D, one with master,
all in pharma.
You might think they only explored pharmaceutical companies; no, they sent
resumes to all industries.
Now, how many Python positions with $250k? I know a friend got a job from
Google. He was new graduate with Ph.D, but only $120k, not even half of the
$250….
2) The languages.
SAS was developed from very traditional paradigm. It is not as beautiful as
Python or Java in terms of internal language coherence or logical beauty.
It is not even OOP, not to say to catch up with the functional trend as
Python does. However, SAS has incorporated almost all good parts from other
languages: Perl's regular expressions, XML schema, or HTML's thinking in
its ODS (templates and tagsets), SQL in its powerful PROC SQL, Java objects,
or even groovy's … You might think SAS is a tool box that collects
everything that is powerful. 15 years ago, you got a job by knowing RETAIN
statement well, 10 years ago, SAS excellency was measured by PROC SQL; now…
if you do not know anything about Java or Python or F and you want to claim
you are SAS expert…
Suggestions: learn Python, Java, or F or … in order to learn SAS well; but
before you do that, get a job, feed your family first.
3) The trend.
There are three stages of lifelong searching: people in the third world are
struggling for foods; people in some parts of the world are showing off with
their cars or houses; in the US, people are paying more and more for
additional few months of life --- that is the sources of energy that
drives the pharmaceutical industry. It is true that some parts of Sanofi
have moved from New Jersey to Boston and shed off many jobs in Bridgewater
area, but remember: their statistics/SAS programming department is still in
the old building. Also JNJ is there, Novartis is there … and so many other
big pharma who are hiring …Look at Boston area also, CA, NC …googling SAS
programmer see for yourself.
I love Python myself; I appreciate Java's challenges in its certification;
and I don't like the fact SAS can let people who don't know SAS get a
certificate so
easily (the true story: one non stat major who had never used SAS got a base
certificate after one evening memorizing the answers).
Yet, when our paychecks are at stake; when the probability of getting a
decent job is at stake, some times we have to tolerate the imperfect part of
what life can bring us.
I don't deny the importance of big data industry.
Yet, it is not mature. They might have positions open for very high talent
people, but not in a scale that is compatible to pharmaceutical industry.
For many master level stat graduates, the target should be the companies who
have more positions in this the stat area, not the companies who pay very
high but only to a very few high talent genius.
14 years ago, there was an IT company called JDSU whose stock went to over $
100 within a short period of time while many decent pharmaceutical
companies stocks just stood there… I bought the stocks of JDSU with all my
saving
of one year, but only to watch the money shrink to 50, 20, 10, 2, 1, …
..
Where is JDSU now? Don't ask me, I don't even remember the name of the
internet
stocks trading company ….
l******t
发帖数: 96
2
Google new phd绝对不止120k
base都不止
更别说bonus,rsu

influential
cents

【在 j********t 的大作中提到】
: SAS的前景可怕吗?
: One student got a job from pharmaceutical industry and asked me to be her
: referral. At the end of our conversation, she asked if her SAS programmer
: position is stable and if she needs to learn Python ASAP.
: Her quote is: some people at MITBBS had created the feeling that SAS is
: going to die.
: I know the posts about R/Python. But I did not know they are so influential
: to the new gradates. Therefore, I feel it is necessary to post my 3 cents
: from my point of view.
: Here are a few points I want to make:

l****9
发帖数: 115
3
Chase offers new grad PhD 75K--85K plus little bonus
Google offers new grad PhD 127K plus very good bonus and RSU
C1 offers new grad PhD 90--100K plus some bonus
Amazon offers new grad PhD 100K plus good on-paper bonus and RSU (you have
to stay 4 years to fully vest the benefit), but Amazon does hire analysts
using SAS.
I think the point here is about potential. If you are a top Python analyst,
you can land a job of 250K without much effort, if you are a top SAS analyst
, you can land a 150K job without much effort.

influential
cents

【在 j********t 的大作中提到】
: SAS的前景可怕吗?
: One student got a job from pharmaceutical industry and asked me to be her
: referral. At the end of our conversation, she asked if her SAS programmer
: position is stable and if she needs to learn Python ASAP.
: Her quote is: some people at MITBBS had created the feeling that SAS is
: going to die.
: I know the posts about R/Python. But I did not know they are so influential
: to the new gradates. Therefore, I feel it is necessary to post my 3 cents
: from my point of view.
: Here are a few points I want to make:

c****t
发帖数: 19049
4
您要说SAS有职位那没问题,别的还是别扯了。COBOL现在还有职位呢,就好比还有很多
人去听古典音乐会。SAS那套思维方式是挺独特的。先学好了SAS也不用去学别的了嘿嘿

influential
cents

【在 j********t 的大作中提到】
: SAS的前景可怕吗?
: One student got a job from pharmaceutical industry and asked me to be her
: referral. At the end of our conversation, she asked if her SAS programmer
: position is stable and if she needs to learn Python ASAP.
: Her quote is: some people at MITBBS had created the feeling that SAS is
: going to die.
: I know the posts about R/Python. But I did not know they are so influential
: to the new gradates. Therefore, I feel it is necessary to post my 3 cents
: from my point of view.
: Here are a few points I want to make:

h***i
发帖数: 3844
5
sas这种是做分析用的,做分析的pay的是比较低的,
IT给的钱多是因为把做分析的当半个engineer用。
engineer的工资在IT是pay的不错,
sas programmer的结果可能是大量的low pay labors plus少数pay的不错的。
当然哪个行业都是如此,
不过sas的programmer因为职业划分
是纯分析,所以pay的相对更low一点。
不过工作的机会是很多,
可以类比会计,工作机会也很多

influential
cents

【在 j********t 的大作中提到】
: SAS的前景可怕吗?
: One student got a job from pharmaceutical industry and asked me to be her
: referral. At the end of our conversation, she asked if her SAS programmer
: position is stable and if she needs to learn Python ASAP.
: Her quote is: some people at MITBBS had created the feeling that SAS is
: going to die.
: I know the posts about R/Python. But I did not know they are so influential
: to the new gradates. Therefore, I feel it is necessary to post my 3 cents
: from my point of view.
: Here are a few points I want to make:

j********t
发帖数: 201
6

the threshold is much higher than 会计
In the pharma settings, there are 3 types of SAS users:
1) Statisticians (Ph.D or Master) - mainly for analysis purposes.
2) Clinical SAS programmers (mainly Masters of Statistics) - for generating
tables, listings, and figures, as well as deriving datasets for making these
TLFs.
3) Database SAS programmers - mainly for handling data cleaning and SDTM
mapping - companies want masters of statistics, but the Bachelors with SAS
skills can do the job.
It's hard to get the first job since most companies want experienced people
. Once you get in, it's stable. Initial pay might not be very high, but
very decent.

【在 h***i 的大作中提到】
: sas这种是做分析用的,做分析的pay的是比较低的,
: IT给的钱多是因为把做分析的当半个engineer用。
: engineer的工资在IT是pay的不错,
: sas programmer的结果可能是大量的low pay labors plus少数pay的不错的。
: 当然哪个行业都是如此,
: 不过sas的programmer因为职业划分
: 是纯分析,所以pay的相对更low一点。
: 不过工作的机会是很多,
: 可以类比会计,工作机会也很多
:

p********a
发帖数: 5352
7
要往高层次带人。。。。!
语言这东西就是个工具,两三个月就能基本熟练,大半年就能基本精通。学习能力强是
最重要的。
z********8
发帖数: 172
8
I am learning SAS.....
j********t
发帖数: 201
9
agree: 要往高层次带人。。。。!but how?
a few things are rooted in the early education, not just graduate school
time:
1) Active participation.
2) Team work spirit.
3) Tolerance of different opinions.
...
Just name a few.

【在 p********a 的大作中提到】
: 要往高层次带人。。。。!
: 语言这东西就是个工具,两三个月就能基本熟练,大半年就能基本精通。学习能力强是
: 最重要的。

s******0
发帖数: 1269
10
其实争来争去有啥意义?
SAS归根到底就是个软件,处理数据和做分析用的,R还有python哪个不可以?不外乎
sas有人给你出来担保正确,其他的是open source,你自己的结果自己负责而已。对于
regulatory agency,sas是必须的,因为错了可以找sas。其他的呢?
如果你的结果只用来做自己的business,whatever you like.但是如果你要submitted
to FDA,你没有别的选择。
还有说一点fresh phd也好ms也好没个4,5年的traning没有当过SSP的经验其实在
market上还是很low的,pharma拿高薪的就那么几个,大多数都是60k上下,这样的工资
怎么去和人家IT比。现在药厂大多不景气,裁员啥的比比皆是,sponsor身份更是麻烦
。即使有了h1,绿卡也是遥遥无期
从你training的角度为了赚钱无可厚非,但是最好客观一点,多考虑下大环境
相关主题
怎么由 SAS programmer 转成 data scientist (转载)Re: 请问SAS如何学起?
请问湾区有什么biostatistican或SAS编程的职位吗?[合集] Can we calculate log likelihood ratio using SAS???
再谈湾区工作,Python R及SASSAS9里面用ODS画survival (K-M plot) 的问题
s******0
发帖数: 1269
11
还有就是说一点,pharm的经验是不transfer的,关键看你的career path是什么。
pharm混好了其实很不容易,更像一个leader,拿几十万的毕竟少数。不过啥也不懂得
director最近也见了不少。LOL
y****2
发帖数: 14
12
我对药厂挺感兴趣的,也了解了一点,你说的60K是针对entry level吗?我有同学毕业
直接去药厂起薪有70-80K的,绿卡申请的时间和流程和其他行业也差不多。。。我想
senior水平薪水应该更加高吧?不过我也想多了解一点,你也是做这一行的吗?难道是
location不同所以薪水差别这么大??
当然在IT行业起薪肯定是更高的,不过对于统计master真心好难找里面的工作,特别是
在加州,tech气氛浓厚,中小型IT公司CS的同学就能完全胜任处理和分析data的工作,
大公司像google面试好拿,但是非常不容易通过。。。难道在其他地方会好一点吗?

submitted

【在 s******0 的大作中提到】
: 其实争来争去有啥意义?
: SAS归根到底就是个软件,处理数据和做分析用的,R还有python哪个不可以?不外乎
: sas有人给你出来担保正确,其他的是open source,你自己的结果自己负责而已。对于
: regulatory agency,sas是必须的,因为错了可以找sas。其他的呢?
: 如果你的结果只用来做自己的business,whatever you like.但是如果你要submitted
: to FDA,你没有别的选择。
: 还有说一点fresh phd也好ms也好没个4,5年的traning没有当过SSP的经验其实在
: market上还是很low的,pharma拿高薪的就那么几个,大多数都是60k上下,这样的工资
: 怎么去和人家IT比。现在药厂大多不景气,裁员啥的比比皆是,sponsor身份更是麻烦
: 。即使有了h1,绿卡也是遥遥无期

s*******m
发帖数: 658
13
可能他是说大部分去CRO 吧,6万正常,弯曲也就这价。
IT 公司,学CS 的不屑干 data analyst, 都是 统计,business, 经济之类的杂牌军。

【在 y****2 的大作中提到】
: 我对药厂挺感兴趣的,也了解了一点,你说的60K是针对entry level吗?我有同学毕业
: 直接去药厂起薪有70-80K的,绿卡申请的时间和流程和其他行业也差不多。。。我想
: senior水平薪水应该更加高吧?不过我也想多了解一点,你也是做这一行的吗?难道是
: location不同所以薪水差别这么大??
: 当然在IT行业起薪肯定是更高的,不过对于统计master真心好难找里面的工作,特别是
: 在加州,tech气氛浓厚,中小型IT公司CS的同学就能完全胜任处理和分析data的工作,
: 大公司像google面试好拿,但是非常不容易通过。。。难道在其他地方会好一点吗?
:
: submitted

l******n
发帖数: 9344
14
会SAS在未来的10年,或许20年都不会为生存而担忧。但是你的生存空间会越来越小。
一方面是CRO的那些东西,目的性太强,基本上都是在regulation下面发展出来的,换
到另一个行业/环境,基本行不通,所以发展的局限性很大;另一方面SAS的门槛越来越
低,进入行业的人越来越多,于是供过于求,工资/发展都是下坡路,就和会计一样了。
R/Python的优点是开源,这是软件行业的大的趋势。而且SE都能和他们打交道,使用的
范围比SAS大太多了。
人无远虑必有近忧,很多事情都要看长远一点,不要到了眼前才发现问题。

influential
cents

【在 j********t 的大作中提到】
: SAS的前景可怕吗?
: One student got a job from pharmaceutical industry and asked me to be her
: referral. At the end of our conversation, she asked if her SAS programmer
: position is stable and if she needs to learn Python ASAP.
: Her quote is: some people at MITBBS had created the feeling that SAS is
: going to die.
: I know the posts about R/Python. But I did not know they are so influential
: to the new gradates. Therefore, I feel it is necessary to post my 3 cents
: from my point of view.
: Here are a few points I want to make:

s******0
发帖数: 1269
15
看你的朋友是哪个level了,我认识的人有phd直接毕业进pharm工资100k+的,但是凭人
家背景随便去哪找个faculty都不成问题。
你想进pharm,fine,这是你的追求。我只想以我的亲身经历告诉你一个现实。如果你
名校phd毕业有connection,进pharm找个decent job不难。因为很多人在毕业之前n个
intern,随便给HM Sr Director打电话,这些你比的了吗?
但是如果你只有MS,没有connection,而且没经验,找sas programmer的职位根本没戏
。除非你简历造假,兴许有几个面试。pharm的programmer没有5年经验你确实很难进。
你其实自己想想也可以明白,人家动不动几十个million的project让个没经验啥都不懂
的人去做,换你做老板你放心吗?能进些小的cro已经不错了,但是pay确实很低,而且
都是重复工作,我不知道这个john说的decent pay是多少,但是大多数我知道的就是
60k~70k,你怎么跟人家学CS的比。人家job opening的数量是你sas programmer的多少
倍,在看人家的pay。我认识的一个朋友5年经验去twtr,薪水100k+,没benefit,3w股
股票,你自己比比就知道了。我现在后悔当初转了统计,肠子都悔青了
还有说起绿卡的事情,如果你运气好能进biib这样公司,没问题。人家几个billion拿
来打水漂都是可以的。但是如果公司状况不好,一裁员你的绿卡就要拖。我上班2个月
见到30%的裁员,昨天还一起吃饭打牌呢,明天就卷铺盖滚蛋。

【在 y****2 的大作中提到】
: 我对药厂挺感兴趣的,也了解了一点,你说的60K是针对entry level吗?我有同学毕业
: 直接去药厂起薪有70-80K的,绿卡申请的时间和流程和其他行业也差不多。。。我想
: senior水平薪水应该更加高吧?不过我也想多了解一点,你也是做这一行的吗?难道是
: location不同所以薪水差别这么大??
: 当然在IT行业起薪肯定是更高的,不过对于统计master真心好难找里面的工作,特别是
: 在加州,tech气氛浓厚,中小型IT公司CS的同学就能完全胜任处理和分析data的工作,
: 大公司像google面试好拿,但是非常不容易通过。。。难道在其他地方会好一点吗?
:
: submitted

s******0
发帖数: 1269
16
以前上mixed model的时候自己编成做过比较,sas和r的结果误差小于万分之一。考虑
到sas和r还有python的成本,对于startup来说,人家为什么要用你个老掉牙的sas?
其实说来说去什么都是一个钱的问题,但是我觉得更多的是你要反过来想想怎么可以提
高自己,自己的兴趣在哪,把自己眼前的事情做好。
就像那个john说的,他推荐的人刚拿到offer就想着去学python,人家雇你为什么?你
有没有先把自己的工作做好。360行行行出状元。这样的人我觉得一辈子都当不了状元
。如果我是雇人的,看了这个你以后会雇john推荐的人吗?

了。

【在 l******n 的大作中提到】
: 会SAS在未来的10年,或许20年都不会为生存而担忧。但是你的生存空间会越来越小。
: 一方面是CRO的那些东西,目的性太强,基本上都是在regulation下面发展出来的,换
: 到另一个行业/环境,基本行不通,所以发展的局限性很大;另一方面SAS的门槛越来越
: 低,进入行业的人越来越多,于是供过于求,工资/发展都是下坡路,就和会计一样了。
: R/Python的优点是开源,这是软件行业的大的趋势。而且SE都能和他们打交道,使用的
: 范围比SAS大太多了。
: 人无远虑必有近忧,很多事情都要看长远一点,不要到了眼前才发现问题。
:
: influential
: cents

a***r
发帖数: 2677
17
这帖子挺好。
s*******m
发帖数: 658
18
John 可能知道的是进去早的例子,随便拿15万什么的。 学统计早的不进药厂现在也很
多15万,以前机会多,跳槽方便。
现在进去的,我真怀疑5年能拿十万,很多8,9万在药厂。
统计是走下坡路的。

【在 s******0 的大作中提到】
: 看你的朋友是哪个level了,我认识的人有phd直接毕业进pharm工资100k+的,但是凭人
: 家背景随便去哪找个faculty都不成问题。
: 你想进pharm,fine,这是你的追求。我只想以我的亲身经历告诉你一个现实。如果你
: 名校phd毕业有connection,进pharm找个decent job不难。因为很多人在毕业之前n个
: intern,随便给HM Sr Director打电话,这些你比的了吗?
: 但是如果你只有MS,没有connection,而且没经验,找sas programmer的职位根本没戏
: 。除非你简历造假,兴许有几个面试。pharm的programmer没有5年经验你确实很难进。
: 你其实自己想想也可以明白,人家动不动几十个million的project让个没经验啥都不懂
: 的人去做,换你做老板你放心吗?能进些小的cro已经不错了,但是pay确实很低,而且
: 都是重复工作,我不知道这个john说的decent pay是多少,但是大多数我知道的就是

c*******o
发帖数: 8869
19
对open source也不能盲从, 下面这片paper对SAS/R的mixed model做了系统的比较,
结论是r的准确性比sas差很多
http://onlinelibrary.wiley.com/doi/10.1002/sim.4265/abstract
而且现在 doug bates也已经撂挑子不干了, 他的mixed model谁来维护呢? 如果一个
大公司的重要infrastructure严重依赖这些免费package, 潜在的威胁和成本如何考虑
呢?
openn SSL的教训也就是这几天的事情。

【在 s******0 的大作中提到】
: 以前上mixed model的时候自己编成做过比较,sas和r的结果误差小于万分之一。考虑
: 到sas和r还有python的成本,对于startup来说,人家为什么要用你个老掉牙的sas?
: 其实说来说去什么都是一个钱的问题,但是我觉得更多的是你要反过来想想怎么可以提
: 高自己,自己的兴趣在哪,把自己眼前的事情做好。
: 就像那个john说的,他推荐的人刚拿到offer就想着去学python,人家雇你为什么?你
: 有没有先把自己的工作做好。360行行行出状元。这样的人我觉得一辈子都当不了状元
: 。如果我是雇人的,看了这个你以后会雇john推荐的人吗?
:
: 了。

y****2
发帖数: 14
20
谢谢,原来如此。不知道对不对,我觉得IT行业说到处理分析data,都是在用machine
learning,算法之类的,在CS这个本来就是一个大的track,很多同学学的扎实,而且
可以直接用java/C++快速实现,现在Hadoop又这么流行,发展越来越成熟,形成一个系
统了,对于本来就是java developer的同学,学习hadoop可以很快变得很牛逼。反过来
,IT行业我觉得竞争很激烈,人之前的实力差距差别好大。。。这类工作title应该不
是data analyst。确实像你所说,我没见到过CS的人去做data analyst的这种title的。
而药厂这种传统行业,不搞算法,主要是做experiment,用的统计方法我觉得很不一样
,我比较喜欢experiment,像如何design呀,怎么结论之类的,觉得挺有意思的,所以
想去药厂。另一方面,竞争的难度我觉得,CS入门好像比药厂简单,但是深入下去,CS
里面做big data的话智商要求灰常高,可能撑下去也会做的不错,但是有时候智商真的
是硬伤。。>_<,另一方面,虽然药厂的统计知识涉及有很难的地方,但是感觉不一样
,感觉是努力可以达到的。

【在 s*******m 的大作中提到】
: 可能他是说大部分去CRO 吧,6万正常,弯曲也就这价。
: IT 公司,学CS 的不屑干 data analyst, 都是 统计,business, 经济之类的杂牌军。

相关主题
How to format the SAS output?ods rtf startpage=never does not work anymore in SAS9.2?
求助:SAS data set输出SAS使用到什么水平才算是高手?
SAS急问:怎样在PROC REPORT 的TITLE 部分加粗字体(BOLD)?不用ODS怎样做?请教SAS ODS to Excel
s******0
发帖数: 1269
21
pharm Sr. level Biostatistician的base是在100k上下,其他的看公司,programmer
要远低于这个价,除了boston的几个pharm会pay的差不多,不过他们的programmer当半
个biostatistician来用。
5年经验干的好的不止这个价,但是double要好久。。。。。
l******t
发帖数: 96
22
不屑倒不至于
就算让他们去做也做不来,各有所长

【在 s*******m 的大作中提到】
: 可能他是说大部分去CRO 吧,6万正常,弯曲也就这价。
: IT 公司,学CS 的不屑干 data analyst, 都是 统计,business, 经济之类的杂牌军。

s******0
发帖数: 1269
23
请你注意我说的是我自己用R coding去对比sas的结果,2个偏差很小。当时我没有逐一
check。
而且在上面我已经说过,你自己做business用哪个都可以,看你喜欢和budget,但是如
果涉及regulatory,必须sas。这也是药厂为什么一堆统计用r,关键programming还是
sas的原因。如果你只会用一两个package作事情而没有自己的想法永远只是给别人打工
的,赚份工资,这里不行换个地方而已。
open source的缺点就是你自己take risk,不然sas为什么收你那么贵的license fee



【在 c*******o 的大作中提到】
: 对open source也不能盲从, 下面这片paper对SAS/R的mixed model做了系统的比较,
: 结论是r的准确性比sas差很多
: http://onlinelibrary.wiley.com/doi/10.1002/sim.4265/abstract
: 而且现在 doug bates也已经撂挑子不干了, 他的mixed model谁来维护呢? 如果一个
: 大公司的重要infrastructure严重依赖这些免费package, 潜在的威胁和成本如何考虑
: 呢?
: openn SSL的教训也就是这几天的事情。

s******0
发帖数: 1269
24
其实所有人所作的无非是looking for opportunity to make money而已。药厂如此,
it也一样。
IT不过依赖大数据去做prodiction来寻找潜在的机会,在大数据的前提下会减少你出错
的概率而已。不过说真的,我对IT也属于一知半解,鉴于年龄我不会去趟这摊浑水了,
这是年轻人干的活,有体力有精力。
以前不是有句话,如果你45岁,IT求职基本看你年龄就pass你了,但是统计正好相反,
越老越吃香。而且30年河东30年河西,10年之后什么样的谁知道。所以别人的话参考,
路是自己的,怎么走,好不好,只有自己知道。

machine
的。
CS

【在 y****2 的大作中提到】
: 谢谢,原来如此。不知道对不对,我觉得IT行业说到处理分析data,都是在用machine
: learning,算法之类的,在CS这个本来就是一个大的track,很多同学学的扎实,而且
: 可以直接用java/C++快速实现,现在Hadoop又这么流行,发展越来越成熟,形成一个系
: 统了,对于本来就是java developer的同学,学习hadoop可以很快变得很牛逼。反过来
: ,IT行业我觉得竞争很激烈,人之前的实力差距差别好大。。。这类工作title应该不
: 是data analyst。确实像你所说,我没见到过CS的人去做data analyst的这种title的。
: 而药厂这种传统行业,不搞算法,主要是做experiment,用的统计方法我觉得很不一样
: ,我比较喜欢experiment,像如何design呀,怎么结论之类的,觉得挺有意思的,所以
: 想去药厂。另一方面,竞争的难度我觉得,CS入门好像比药厂简单,但是深入下去,CS
: 里面做big data的话智商要求灰常高,可能撑下去也会做的不错,但是有时候智商真的

s*******m
发帖数: 658
25
不用担心。你说的这种工作,你就是想去,人家也不会要你的。
IT 工作有很多level, 能要你的,都是你over qualify 的。

machine
的。
CS

【在 y****2 的大作中提到】
: 谢谢,原来如此。不知道对不对,我觉得IT行业说到处理分析data,都是在用machine
: learning,算法之类的,在CS这个本来就是一个大的track,很多同学学的扎实,而且
: 可以直接用java/C++快速实现,现在Hadoop又这么流行,发展越来越成熟,形成一个系
: 统了,对于本来就是java developer的同学,学习hadoop可以很快变得很牛逼。反过来
: ,IT行业我觉得竞争很激烈,人之前的实力差距差别好大。。。这类工作title应该不
: 是data analyst。确实像你所说,我没见到过CS的人去做data analyst的这种title的。
: 而药厂这种传统行业,不搞算法,主要是做experiment,用的统计方法我觉得很不一样
: ,我比较喜欢experiment,像如何design呀,怎么结论之类的,觉得挺有意思的,所以
: 想去药厂。另一方面,竞争的难度我觉得,CS入门好像比药厂简单,但是深入下去,CS
: 里面做big data的话智商要求灰常高,可能撑下去也会做的不错,但是有时候智商真的

w******d
发帖数: 393
26
I wonder how big is your data? SAS works much better on big data sets than R.

【在 s******0 的大作中提到】
: 请你注意我说的是我自己用R coding去对比sas的结果,2个偏差很小。当时我没有逐一
: check。
: 而且在上面我已经说过,你自己做business用哪个都可以,看你喜欢和budget,但是如
: 果涉及regulatory,必须sas。这也是药厂为什么一堆统计用r,关键programming还是
: sas的原因。如果你只会用一两个package作事情而没有自己的想法永远只是给别人打工
: 的,赚份工资,这里不行换个地方而已。
: open source的缺点就是你自己take risk,不然sas为什么收你那么贵的license fee
:
: ,

t*********n
发帖数: 296
27
哇 难道搞cs的人这么牛??
我听朋友说计量五年入门十年上路 申经济Ph.D那是很难的 学生质量都有保证。 难道
cs的人都拿来就弄, 都牛到认为太简单不屑于去弄了??平均来说cs phd统计方面的知
识都远高于stats Ph.D 统计方面的知识以至于统计方面数据分析在cs的人看来都很低
级不屑于去弄??
根据这位大牛,看来cs是秒杀一切的节奏呀!!

【在 s*******m 的大作中提到】
: 可能他是说大部分去CRO 吧,6万正常,弯曲也就这价。
: IT 公司,学CS 的不屑干 data analyst, 都是 统计,business, 经济之类的杂牌军。

l******n
发帖数: 9344
28
45还要靠SAS生存也够loser了

【在 s******0 的大作中提到】
: 其实所有人所作的无非是looking for opportunity to make money而已。药厂如此,
: it也一样。
: IT不过依赖大数据去做prodiction来寻找潜在的机会,在大数据的前提下会减少你出错
: 的概率而已。不过说真的,我对IT也属于一知半解,鉴于年龄我不会去趟这摊浑水了,
: 这是年轻人干的活,有体力有精力。
: 以前不是有句话,如果你45岁,IT求职基本看你年龄就pass你了,但是统计正好相反,
: 越老越吃香。而且30年河东30年河西,10年之后什么样的谁知道。所以别人的话参考,
: 路是自己的,怎么走,好不好,只有自己知道。
:
: machine

s*******m
发帖数: 658
29
同学,不屑是指对工资不屑。
好的就算你经济 phd 天才一个,这专业就是个冷门。搞尖端科技捞不到钱的多了,物
理化学生物,还不是捡 cs 社区小本挑剩下的?
统计知识就是个屁, money talk.

【在 t*********n 的大作中提到】
: 哇 难道搞cs的人这么牛??
: 我听朋友说计量五年入门十年上路 申经济Ph.D那是很难的 学生质量都有保证。 难道
: cs的人都拿来就弄, 都牛到认为太简单不屑于去弄了??平均来说cs phd统计方面的知
: 识都远高于stats Ph.D 统计方面的知识以至于统计方面数据分析在cs的人看来都很低
: 级不屑于去弄??
: 根据这位大牛,看来cs是秒杀一切的节奏呀!!

h***i
发帖数: 3844
30
其实统计真的是越老越吃香么? 真的有人见到了很多老的吃香的做统计的么?
这句话是拍拍脑袋想出来的还是有什么data 能support?

【在 l******n 的大作中提到】
: 45还要靠SAS生存也够loser了
相关主题
[新手求救]怎样输出logistic regression的结果?R 有点令人失望
[提问]如何用SAS在同一个ExcelBook里create several spreadsheets?关于SAS,SPSS,R,Python
来讲讲SAS的优点吧银行十年内是不会用python和R的。。。
l******n
发帖数: 9344
31
以前主流是mainframe,现在有几个人用?越老越吃香的职业是医生,政客,绝不会是
tech

【在 h***i 的大作中提到】
: 其实统计真的是越老越吃香么? 真的有人见到了很多老的吃香的做统计的么?
: 这句话是拍拍脑袋想出来的还是有什么data 能support?

l******t
发帖数: 96
32
说实话,真弄尖端科技的人。随便练几个月编程,找一个码工足够了
反正我不认为money talk,当年码工和analyst我最后还是选了analyst

【在 s*******m 的大作中提到】
: 同学,不屑是指对工资不屑。
: 好的就算你经济 phd 天才一个,这专业就是个冷门。搞尖端科技捞不到钱的多了,物
: 理化学生物,还不是捡 cs 社区小本挑剩下的?
: 统计知识就是个屁, money talk.

o****o
发帖数: 8077
33
这个帖子混淆了好几个概念
1. SAS的前景与SAS程序员的前景
2. 能找工作与能找好工作
3. 公司的稳定与作为职业白领自身工作的稳定性
先占个坑,改天有时间了逐一论述。
不过首先表个态,就是老中多搞些这种培训,介绍工作很重要。我们不占坑,别的人就
占了。不同的工资和工作类型针对不同的就业人群,只有最符合自己生活需要的工作,
没有最好的工作。

influential
cents

【在 j********t 的大作中提到】
: SAS的前景可怕吗?
: One student got a job from pharmaceutical industry and asked me to be her
: referral. At the end of our conversation, she asked if her SAS programmer
: position is stable and if she needs to learn Python ASAP.
: Her quote is: some people at MITBBS had created the feeling that SAS is
: going to die.
: I know the posts about R/Python. But I did not know they are so influential
: to the new gradates. Therefore, I feel it is necessary to post my 3 cents
: from my point of view.
: Here are a few points I want to make:

p*******i
发帖数: 1181
34
我可以很负责任的说,在处理Big Data上,SAS比R强了好几条街,处理同样大小(三十
几G)的data,我们组R的machine几乎每天down一次,SAS machine从来没出过问题,而
且SAS machine都是五六年的旧服务器了,内存小的多。
A********a
发帖数: 133
35
I really doubt SAS programmers (not in management positions) can earn more
than 150K a year in NY and NJ.
Commercial side of big banks, e.g., JPMorgan, Citi, Wells Fargo, et cl,
compensate less than their investment bank side. Nowadays, even VPs in IT
division (including real IT and quant developers) of sell-side are rarely
paid above 250K. needless to say, commercial side. IT people have a better
chance at big IT firms like GOOGLE or a startup.
y****2
发帖数: 14
36
说的很对!
期待你后面的论述。

【在 o****o 的大作中提到】
: 这个帖子混淆了好几个概念
: 1. SAS的前景与SAS程序员的前景
: 2. 能找工作与能找好工作
: 3. 公司的稳定与作为职业白领自身工作的稳定性
: 先占个坑,改天有时间了逐一论述。
: 不过首先表个态,就是老中多搞些这种培训,介绍工作很重要。我们不占坑,别的人就
: 占了。不同的工资和工作类型针对不同的就业人群,只有最符合自己生活需要的工作,
: 没有最好的工作。
:
: influential

n*****3
发帖数: 1584
37
I think at least the follow two are highly correlated;
for most ppl, they are the same.
f*******3
发帖数: 206
38
SAS处理数据的方式和R处理数据的方式本来就不同,多大的data set在SAS里面过一遍
只要保证硬盘够大就可以,因为SAS一条条处理,每次load进memory的数据量并不大,
但相应的也不会有random access。R要把全部数据都读进内存,考虑到内存和硬盘的
cost。是买SAS+便宜的大硬盘呢,还是用免费的R+相对贵的内存就带来一个经济问题。
我所知到的google宁可从cloud上买内存,也不用SAS。
这位仁兄说的big data,也就(几十G)的规模,在当下实在算不上是大数据了。现在
不处理类似clickstream这种TB级别的数据,都不好意思说自己处理大数据. 大IT公司
用的Hadoop,Map-reduce + Distributed system,基本都是基于java,python之类的编
程语言,这里已经没有SAS什么事情了。我感觉随着这些技术的成熟和普遍,cloud的费
用越来越低,起码在IT业,随着老一辈员工的淡出,(我在某IT公司,除了老板还用
SAS,其他人都在用Python+R,或者在学Python),SAS会越来越没有市场。
个人感觉新的stat/machine learning algorithm都是用R写成的package,java加个
wrapper就能在production中调用,还可以用hadoop迅速scale up到海量数据的支持,
不知到SAS对新技术跟进速度怎么样。SAS最大的问题就是没有强大的open source
community支持。每次有个SAS问题,在网上google非常痛苦。

【在 p*******i 的大作中提到】
: 我可以很负责任的说,在处理Big Data上,SAS比R强了好几条街,处理同样大小(三十
: 几G)的data,我们组R的machine几乎每天down一次,SAS machine从来没出过问题,而
: 且SAS machine都是五六年的旧服务器了,内存小的多。

s******0
发帖数: 1269
39
方便的话展开说说python怎么用于Hadoop上可以吗?

【在 f*******3 的大作中提到】
: SAS处理数据的方式和R处理数据的方式本来就不同,多大的data set在SAS里面过一遍
: 只要保证硬盘够大就可以,因为SAS一条条处理,每次load进memory的数据量并不大,
: 但相应的也不会有random access。R要把全部数据都读进内存,考虑到内存和硬盘的
: cost。是买SAS+便宜的大硬盘呢,还是用免费的R+相对贵的内存就带来一个经济问题。
: 我所知到的google宁可从cloud上买内存,也不用SAS。
: 这位仁兄说的big data,也就(几十G)的规模,在当下实在算不上是大数据了。现在
: 不处理类似clickstream这种TB级别的数据,都不好意思说自己处理大数据. 大IT公司
: 用的Hadoop,Map-reduce + Distributed system,基本都是基于java,python之类的编
: 程语言,这里已经没有SAS什么事情了。我感觉随着这些技术的成熟和普遍,cloud的费
: 用越来越低,起码在IT业,随着老一辈员工的淡出,(我在某IT公司,除了老板还用

w******d
发帖数: 393
40
Who told you SAS doesn't support hadoop? and has memory limit? and cannot
run in distributed system?
What version of SAS you are using? 9.1 or earlier?

【在 f*******3 的大作中提到】
: SAS处理数据的方式和R处理数据的方式本来就不同,多大的data set在SAS里面过一遍
: 只要保证硬盘够大就可以,因为SAS一条条处理,每次load进memory的数据量并不大,
: 但相应的也不会有random access。R要把全部数据都读进内存,考虑到内存和硬盘的
: cost。是买SAS+便宜的大硬盘呢,还是用免费的R+相对贵的内存就带来一个经济问题。
: 我所知到的google宁可从cloud上买内存,也不用SAS。
: 这位仁兄说的big data,也就(几十G)的规模,在当下实在算不上是大数据了。现在
: 不处理类似clickstream这种TB级别的数据,都不好意思说自己处理大数据. 大IT公司
: 用的Hadoop,Map-reduce + Distributed system,基本都是基于java,python之类的编
: 程语言,这里已经没有SAS什么事情了。我感觉随着这些技术的成熟和普遍,cloud的费
: 用越来越低,起码在IT业,随着老一辈员工的淡出,(我在某IT公司,除了老板还用

相关主题
银行十年内是不会用python和R的。。。请问湾区有什么biostatistican或SAS编程的职位吗?
诚心求教,这样条件合适找什么样的工作?再谈湾区工作,Python R及SAS
怎么由 SAS programmer 转成 data scientist (转载)Re: 请问SAS如何学起?
f*******3
发帖数: 206
41
I am using 9.1. Just googled a bit, seems like SAS is trying to integrate
Hadoop. " A new interactive programming environment (coming July 2014) will
multiple users concurrently manage data, transform variables, perform
exploratory analysis, build and compare models, and score – with virtually
no limits on the size of the data stored in Hadoop."
So just wondering if there is any SAS release out there that support Hadoop
already? Are there extra cost in order to use this new functionality.
I am not here to argue, and I am probably ignorant, but I would love to
learn that if you could share what you know.

【在 w******d 的大作中提到】
: Who told you SAS doesn't support hadoop? and has memory limit? and cannot
: run in distributed system?
: What version of SAS you are using? 9.1 or earlier?

h***i
发帖数: 3844
42
居然有公司的数据大到这个level了,
而且有这么紧迫的data manipulate 的需求,
还需要跑去花大价钱搞SAS来玩hadoop
而不自己搞一套。

【在 w******d 的大作中提到】
: Who told you SAS doesn't support hadoop? and has memory limit? and cannot
: run in distributed system?
: What version of SAS you are using? 9.1 or earlier?

i****e
发帖数: 451
43
Cannot believe so many people are into SAS still. I'd rather die than use
SAS. It is such a horrible language.
p*******i
发帖数: 1181
44
这位仁兄第一段说的很对,硬盘和内存哪个可扩展空间大是毋庸置疑的。正巧我也在某
IT公司工作,clickstream data我们组也在处理,上T规模的data R是连参与讨论的资
格都没有的,所以我才列举的几十G的data给R一点机会。我们组还有Hive2+hadoop2+
SAS9.4的cluster+data处理的pipeline,似乎这里面也没有R什么事情了。当然从我们
公司来说,Python和Java显然是SDE的主流,作为Data Scientist学点Python和Java也
是必须的,我只是强调SAS比R在这方面强了不是一点半点。话说我们Director还刚给我
们全组安排了全天offsite的SAS training呢……

【在 f*******3 的大作中提到】
: SAS处理数据的方式和R处理数据的方式本来就不同,多大的data set在SAS里面过一遍
: 只要保证硬盘够大就可以,因为SAS一条条处理,每次load进memory的数据量并不大,
: 但相应的也不会有random access。R要把全部数据都读进内存,考虑到内存和硬盘的
: cost。是买SAS+便宜的大硬盘呢,还是用免费的R+相对贵的内存就带来一个经济问题。
: 我所知到的google宁可从cloud上买内存,也不用SAS。
: 这位仁兄说的big data,也就(几十G)的规模,在当下实在算不上是大数据了。现在
: 不处理类似clickstream这种TB级别的数据,都不好意思说自己处理大数据. 大IT公司
: 用的Hadoop,Map-reduce + Distributed system,基本都是基于java,python之类的编
: 程语言,这里已经没有SAS什么事情了。我感觉随着这些技术的成熟和普遍,cloud的费
: 用越来越低,起码在IT业,随着老一辈员工的淡出,(我在某IT公司,除了老板还用

f*******3
发帖数: 206
45
这么幸福,你们公司的福利真好。我刚入职时间不长,很多也是听说的。SAS对数据的
处理方式虽然有时候不太方便,但是这种linear的operation count和Hadoop对data的
处理是相符合的,所以我觉得SAS要和Hadoop整合是很方便的。个人感觉除了IT现在有
TB级别的data,bank和pharm的data数量级还是到不了,所以SAS也不着急跟Hadoop整合

无论如何有一点很确定,统计人员要在IT公司不做2等公民,python必须好,java最好
除了core java,其他例如三大framework也要知道,不至于什么事情都要求着sde干活。

【在 p*******i 的大作中提到】
: 这位仁兄第一段说的很对,硬盘和内存哪个可扩展空间大是毋庸置疑的。正巧我也在某
: IT公司工作,clickstream data我们组也在处理,上T规模的data R是连参与讨论的资
: 格都没有的,所以我才列举的几十G的data给R一点机会。我们组还有Hive2+hadoop2+
: SAS9.4的cluster+data处理的pipeline,似乎这里面也没有R什么事情了。当然从我们
: 公司来说,Python和Java显然是SDE的主流,作为Data Scientist学点Python和Java也
: 是必须的,我只是强调SAS比R在这方面强了不是一点半点。话说我们Director还刚给我
: 们全组安排了全天offsite的SAS training呢……

f*******3
发帖数: 206
46
流口水,这位仁兄方便展开讲讲你提到的Hive2+hadoop2+SAS9.4是怎么架构的,是统计
师做的还是engineer做的,处理什么问题,这种处理方式效率如何,是production
level的code还是只为分析用的?

【在 p*******i 的大作中提到】
: 这位仁兄第一段说的很对,硬盘和内存哪个可扩展空间大是毋庸置疑的。正巧我也在某
: IT公司工作,clickstream data我们组也在处理,上T规模的data R是连参与讨论的资
: 格都没有的,所以我才列举的几十G的data给R一点机会。我们组还有Hive2+hadoop2+
: SAS9.4的cluster+data处理的pipeline,似乎这里面也没有R什么事情了。当然从我们
: 公司来说,Python和Java显然是SDE的主流,作为Data Scientist学点Python和Java也
: 是必须的,我只是强调SAS比R在这方面强了不是一点半点。话说我们Director还刚给我
: 们全组安排了全天offsite的SAS training呢……

p*******i
发帖数: 1181
47
这个是Engineer组做的,主要目的是real time data analytic platform, 对server端
的大量raw data(跟我们组相关的大概是100多个T,其他组还有不少data在上面),用
Hive2调用hadoop2来访问,然后输出的data通过SAS提供的Hive接口直接导入SAS,基本
上就是说从百来个T里面筛选出几十个G的数据做summary可以全程在SAS里完成,速度基
本上能控制在一小时之内。当然这个速度完全是通过Hive的分块和hadoop的map reduce
实现的,SAS只是提供了调用接口。具体coding显然不是一两个data scientist能完成
的了,所以要是没有足够的support engineer team,统计师在IT公司还是相当尴尬的
……

【在 f*******3 的大作中提到】
: 流口水,这位仁兄方便展开讲讲你提到的Hive2+hadoop2+SAS9.4是怎么架构的,是统计
: 师做的还是engineer做的,处理什么问题,这种处理方式效率如何,是production
: level的code还是只为分析用的?

l******n
发帖数: 9344
48
你拿上T的data 来train model了?也就看看什么中位数,平均值,最大值之类的。R不
是只有原声R,还有其他的,比如Revolution R,很多R的缺点都改进了

【在 p*******i 的大作中提到】
: 这位仁兄第一段说的很对,硬盘和内存哪个可扩展空间大是毋庸置疑的。正巧我也在某
: IT公司工作,clickstream data我们组也在处理,上T规模的data R是连参与讨论的资
: 格都没有的,所以我才列举的几十G的data给R一点机会。我们组还有Hive2+hadoop2+
: SAS9.4的cluster+data处理的pipeline,似乎这里面也没有R什么事情了。当然从我们
: 公司来说,Python和Java显然是SDE的主流,作为Data Scientist学点Python和Java也
: 是必须的,我只是强调SAS比R在这方面强了不是一点半点。话说我们Director还刚给我
: 们全组安排了全天offsite的SAS training呢……

l******n
发帖数: 9344
49
SAS只是提供了调用接口
~~~~~~~~~~~~~~~~~~~~~
我怎么觉得换成R,Python,Mahout都不会有什么问题

reduce

【在 p*******i 的大作中提到】
: 这个是Engineer组做的,主要目的是real time data analytic platform, 对server端
: 的大量raw data(跟我们组相关的大概是100多个T,其他组还有不少data在上面),用
: Hive2调用hadoop2来访问,然后输出的data通过SAS提供的Hive接口直接导入SAS,基本
: 上就是说从百来个T里面筛选出几十个G的数据做summary可以全程在SAS里完成,速度基
: 本上能控制在一小时之内。当然这个速度完全是通过Hive的分块和hadoop的map reduce
: 实现的,SAS只是提供了调用接口。具体coding显然不是一两个data scientist能完成
: 的了,所以要是没有足够的support engineer team,统计师在IT公司还是相当尴尬的
: ……

j********t
发帖数: 201
50

reduce
very informative discussions between you guys.
Thank you!

【在 p*******i 的大作中提到】
: 这个是Engineer组做的,主要目的是real time data analytic platform, 对server端
: 的大量raw data(跟我们组相关的大概是100多个T,其他组还有不少data在上面),用
: Hive2调用hadoop2来访问,然后输出的data通过SAS提供的Hive接口直接导入SAS,基本
: 上就是说从百来个T里面筛选出几十个G的数据做summary可以全程在SAS里完成,速度基
: 本上能控制在一小时之内。当然这个速度完全是通过Hive的分块和hadoop的map reduce
: 实现的,SAS只是提供了调用接口。具体coding显然不是一两个data scientist能完成
: 的了,所以要是没有足够的support engineer team,统计师在IT公司还是相当尴尬的
: ……

相关主题
[合集] Can we calculate log likelihood ratio using SAS???求助:SAS data set输出
SAS9里面用ODS画survival (K-M plot) 的问题SAS急问:怎样在PROC REPORT 的TITLE 部分加粗字体(BOLD)?不用ODS怎样做?
How to format the SAS output?ods rtf startpage=never does not work anymore in SAS9.2?
p*******i
发帖数: 1181
51
当然要拿来train model……不然我们的活SDE就全cover了……确实有商业版本的R做的
不错,之前组会上我们Director有讨论过买某个商业版本的R,不过问了问价格比SAS便
宜不了多少,就没实施了。

【在 l******n 的大作中提到】
: 你拿上T的data 来train model了?也就看看什么中位数,平均值,最大值之类的。R不
: 是只有原声R,还有其他的,比如Revolution R,很多R的缺点都改进了

p*******i
发帖数: 1181
52
Python我确定是可以的,R我不觉得能处理,内存瓶颈太严重了,就算勉强能run,动不
动就把服务器拖挂掉了,最近一个月3次服务器的重启2次是因为R的问题(还有一次是
因为Perl)。

【在 l******n 的大作中提到】
: SAS只是提供了调用接口
: ~~~~~~~~~~~~~~~~~~~~~
: 我怎么觉得换成R,Python,Mahout都不会有什么问题
:
: reduce

f*******3
发帖数: 206
53
Since you are talking about Perl, I guess we might be in the same company:)

【在 p*******i 的大作中提到】
: Python我确定是可以的,R我不觉得能处理,内存瓶颈太严重了,就算勉强能run,动不
: 动就把服务器拖挂掉了,最近一个月3次服务器的重启2次是因为R的问题(还有一次是
: 因为Perl)。

l******n
发帖数: 9344
54
换个R engine试试,原生R的内存问题时很大,数据量一上来就不行
虽说价格不比SAS便宜多少,但是可扩展性比SAS强太多了

【在 p*******i 的大作中提到】
: Python我确定是可以的,R我不觉得能处理,内存瓶颈太严重了,就算勉强能run,动不
: 动就把服务器拖挂掉了,最近一个月3次服务器的重启2次是因为R的问题(还有一次是
: 因为Perl)。

g**********l
发帖数: 214
55
for the one who uses sas with hadoop, does your company really have sas co-
located with hadoop? or just streaming data in and out via odbc?
the latter is useless. the former - are you guys paying for the big bucks?
sas connection to hadoop is not as simple and easy as some may think. it
costs an arm and an leg, hardware AND software. i was reading from here:
http://thomaswdinsmore.com/2013/10/21/sas-and-hadoop/
we are sas shop. we did POC with sas to hadoop access and gave up on it. too
clucky, too many bugs, and too expensive for too little benefit over hive/
pig/python/r combination.
j********t
发帖数: 201
56
无休止的讨论SAS,R, Python 谁好谁差,好像就要出行的一家一味的争论是开宝马,
丰田,本田,尼桑,还是福特150,却没有人问问我们要到那里去,干什么去,又是为
什么。。。
For new graduates, the key is : which industry you want to go?
please voice your opinion by doing the following survey:
http://bancova.com/?q=node/207
l*********s
发帖数: 5409
57
But do you really need to train the model using the whole population? The
very spirit of statistics is random sampling to infer the population.

【在 p*******i 的大作中提到】
: 当然要拿来train model……不然我们的活SDE就全cover了……确实有商业版本的R做的
: 不错,之前组会上我们Director有讨论过买某个商业版本的R,不过问了问价格比SAS便
: 宜不了多少,就没实施了。

c***z
发帖数: 6348
58
兄弟也是搞clickstream的,看到各位老爷的讨论非常激动,是否可以请各位老爷移步
这里,讨论交流各自的raodmap,workflow之类的
http://www.mitbbs.com/article_t0/DataSciences/4577.html
1 (共1页)
相关主题
SAS使用到什么水平才算是高手?诚心求教,这样条件合适找什么样的工作?
请教SAS ODS to Excel怎么由 SAS programmer 转成 data scientist (转载)
[新手求救]怎样输出logistic regression的结果?请问湾区有什么biostatistican或SAS编程的职位吗?
[提问]如何用SAS在同一个ExcelBook里create several spreadsheets?再谈湾区工作,Python R及SAS
来讲讲SAS的优点吧Re: 请问SAS如何学起?
R 有点令人失望[合集] Can we calculate log likelihood ratio using SAS???
关于SAS,SPSS,R,PythonSAS9里面用ODS画survival (K-M plot) 的问题
银行十年内是不会用python和R的。。。How to format the SAS output?
相关话题的讨论汇总
话题: sas话题: python话题: java话题: hadoop话题: data