由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - --- software engineer vs data scientist 职业比较
相关主题
Amazon, eBay, Goog, Facebook 选哪个?data scienctist和马工差的多吗?
做NLP或者ML的出路,码工?Scientist?Tech Consulting?Machine learning Ph.D 能找啥工作?
Data Scientist job opening in SoCalFB家的Data Scientist和Data Engineer有啥区别么?
Data Scientist or Software Engineer positions in NYC/Chicago/Dallas有没有人讲一下FB的data scientist和research scientist的区别?
有了解LinkedIn的data scientist的吗?刷POJ不如刷ML吧?
data scientist vs. software engineer求助:data scientist(偏统计建模)找IT公司的职位需要刷leetcode到什么程度?
SDE 和 Data Scientist 哪个好Alexa的Sr SDE 与 AWS的Senior Data Scientist 哪一个更好呢?
data scientist 和 software developer 选哪个New York City的那些Data Scientist待遇如何?
相关话题的讨论汇总
话题: data话题: scientist话题: people话题: engineer话题: sde
进入JobHunting版参与讨论
1 (共1页)
g*l
发帖数: 385
1
CS PHD (machine learning/data mining 方向的)是走纯粹软工,还是数据科学家的职
业道路好?
现在好象做数据分析, 大数据处理的很红火啊, 好象还缺人, 工资也高.感觉数据处理
经验更重要, 而码工好象老了就不吃香了, 经验不是非常重要因为老有新东西要学...
有前辈指点一下吗?
e******o
发帖数: 757
2
为啥,我投了都没人理

.

【在 g*l 的大作中提到】
: CS PHD (machine learning/data mining 方向的)是走纯粹软工,还是数据科学家的职
: 业道路好?
: 现在好象做数据分析, 大数据处理的很红火啊, 好象还缺人, 工资也高.感觉数据处理
: 经验更重要, 而码工好象老了就不吃香了, 经验不是非常重要因为老有新东西要学...
: 有前辈指点一下吗?

g*l
发帖数: 385
3
你啥背景? 我在弯曲老有猎头找.

【在 e******o 的大作中提到】
: 为啥,我投了都没人理
:
: .

W*********y
发帖数: 481
4
同求指点,现在一年级phd,想往data scientist上发展,求指导应该学点啥

.

【在 g*l 的大作中提到】
: CS PHD (machine learning/data mining 方向的)是走纯粹软工,还是数据科学家的职
: 业道路好?
: 现在好象做数据分析, 大数据处理的很红火啊, 好象还缺人, 工资也高.感觉数据处理
: 经验更重要, 而码工好象老了就不吃香了, 经验不是非常重要因为老有新东西要学...
: 有前辈指点一下吗?

r*******m
发帖数: 457
5
赞ID啊!
不知道怎么样算纯粹软工啊,感觉软工也有组啊,找相关的组不就完了~
W******g
发帖数: 887
6
我们这些码工有偏见,所以说得你们也就一听
我觉得是码工要好一些。因为model通常都是码工作的。做数据分析的通常就是做一些
处理数据的非创造性劳动。

.

【在 g*l 的大作中提到】
: CS PHD (machine learning/data mining 方向的)是走纯粹软工,还是数据科学家的职
: 业道路好?
: 现在好象做数据分析, 大数据处理的很红火啊, 好象还缺人, 工资也高.感觉数据处理
: 经验更重要, 而码工好象老了就不吃香了, 经验不是非常重要因为老有新东西要学...
: 有前辈指点一下吗?

W******g
发帖数: 887
7
1年级phD需要想这个问题吗?先把研究做好?

的职
处理
..

【在 W*********y 的大作中提到】
: 同求指点,现在一年级phd,想往data scientist上发展,求指导应该学点啥
:
: .

W*********y
发帖数: 481
8
选择做啥研究方向,对以后的发展也挺重要的吧
我现在的实验室是computer vision为主,但是我是一直想往learning方面偏,也一直
想找统计和learning方向的老师,postdoc合作。

【在 W******g 的大作中提到】
: 1年级phD需要想这个问题吗?先把研究做好?
:
: 的职
: 处理
: ..

t****a
发帖数: 1212
9
model通常都是码工作的?做数据分析的通常就是做一些处理数据的非创造性劳动?
我想,或者是你的描述有错,或者是贵公司真的不懂什么叫data scientist,也没招到
合适的data scientist。

【在 W******g 的大作中提到】
: 我们这些码工有偏见,所以说得你们也就一听
: 我觉得是码工要好一些。因为model通常都是码工作的。做数据分析的通常就是做一些
: 处理数据的非创造性劳动。
:
: .

g*l
发帖数: 385
10
我是找了个和机器学习相关的码工, 但发现绝大部分时间是做 infrastructure
pipeline, 仅仅其中的模型是用了简单的 linear regression. 这种就象纯码工-- 没
有用到什么 PHD level 数据挖掘和分析的东西.
我了解的 data scientist 是不写产品 code, 但需要分析数据,找 pattern 的能力要
强. 不知道这种 data scientist 的 career path 是不是属于越老越吃香, 对比
software engineer而言, 老了不容易被裁的.

【在 r*******m 的大作中提到】
: 赞ID啊!
: 不知道怎么样算纯粹软工啊,感觉软工也有组啊,找相关的组不就完了~

相关主题
data scientist vs. software engineerdata scienctist和马工差的多吗?
SDE 和 Data Scientist 哪个好Machine learning Ph.D 能找啥工作?
data scientist 和 software developer 选哪个FB家的Data Scientist和Data Engineer有啥区别么?
进入JobHunting版参与讨论
g*l
发帖数: 385
11
大侠推荐一下好 data scientst 公司吧. 我厌倦了做coder, 想找个能真正用上data
mining 专长的地方.

【在 t****a 的大作中提到】
: model通常都是码工作的?做数据分析的通常就是做一些处理数据的非创造性劳动?
: 我想,或者是你的描述有错,或者是贵公司真的不懂什么叫data scientist,也没招到
: 合适的data scientist。

K*********n
发帖数: 2852
12
帮顶

【在 g*l 的大作中提到】
: 大侠推荐一下好 data scientst 公司吧. 我厌倦了做coder, 想找个能真正用上data
: mining 专长的地方.

W*********y
发帖数: 481
13
顶id

【在 K*********n 的大作中提到】
: 帮顶
t********e
发帖数: 1169
14
data scientist一般是非科班人去做的吧,pay也低点。至少基本上所有大公司都这样
的。 
it公司能赚钱的服务都是码工创造的,data scientist还只在忽悠阶段。
所有ai/ml/dm有实际应用的地方,不论是搜索, 还是推荐系统, 都是靠码工做出来的。

【在 t****a 的大作中提到】
: model通常都是码工作的?做数据分析的通常就是做一些处理数据的非创造性劳动?
: 我想,或者是你的描述有错,或者是贵公司真的不懂什么叫data scientist,也没招到
: 合适的data scientist。

R********n
发帖数: 519
15
G的data scientist或者类似应该是pay的低过SDE,T,L和F应该更需要data scientist
些,会不会情况不一样?

的。

【在 t********e 的大作中提到】
: data scientist一般是非科班人去做的吧,pay也低点。至少基本上所有大公司都这样
: 的。 
: it公司能赚钱的服务都是码工创造的,data scientist还只在忽悠阶段。
: 所有ai/ml/dm有实际应用的地方,不论是搜索, 还是推荐系统, 都是靠码工做出来的。

s******i
发帖数: 668
16
How about A? 下周去A家onsite data scientist 这个职位,好处是电面时对coding没
多大要求,不知道onsite什么情况。
t********e
发帖数: 1169
17
跟title没有关系,主要是看skill set吧
大多数data scientist, 只会用R处理点矢量化的数据, regular expression写不出来
, 甚至连个json parser都写不出,那到哪里都没有用, 最多建点玩具模型娱乐娱乐。
不论是flgta, 他们是有海量数据, 但怎么用dbms/nosql方式store/search/retrieve
, 这些东西还在摸索阶段,而且他们的大多数数据都是文本信息或者图片, 没有nlp或
者vision的人来, 也没办法提起有用的信息转化成矢量什么的。
所以, 不论是建大数据的infrastructure, 还是做nlp/vision, 都得靠码工(title为
software engineer或者research scientist)来做,也就是为什么phd码工值钱的原因吧

scientist

【在 R********n 的大作中提到】
: G的data scientist或者类似应该是pay的低过SDE,T,L和F应该更需要data scientist
: 些,会不会情况不一样?
:
: 的。

t********e
发帖数: 1169
18
能做infrastructure才是王道, 懂得怎么建 (不是简单的用 )MapReduce/
Piccolo/Pregel/Spanner/
graphlab到哪都能做到principal
machine learning数学的东西很简单的, 最多些线性代数泛函分析的东西, 不需要学
复杂的东西。
公司里面不可能用任何n^2的算法。
需要分析数据,找pattern, 那去学nlp, 学vision, 不能有效结合domain knowledge,
光想从原始数据提取任何有效pattern的做法都是搞笑的,

【在 g*l 的大作中提到】
: 我是找了个和机器学习相关的码工, 但发现绝大部分时间是做 infrastructure
: pipeline, 仅仅其中的模型是用了简单的 linear regression. 这种就象纯码工-- 没
: 有用到什么 PHD level 数据挖掘和分析的东西.
: 我了解的 data scientist 是不写产品 code, 但需要分析数据,找 pattern 的能力要
: 强. 不知道这种 data scientist 的 career path 是不是属于越老越吃香, 对比
: software engineer而言, 老了不容易被裁的.

K*********n
发帖数: 2852
19
这个说得很有道理,很多牛人是machine learning和系统实现两手一起抓,两手都要硬
。另外machine learning除了研究院做理论的,否则必须结合nlp, vision, biotech这
些东西,才真的值钱。



【在 t********e 的大作中提到】
: 能做infrastructure才是王道, 懂得怎么建 (不是简单的用 )MapReduce/
: Piccolo/Pregel/Spanner/
: graphlab到哪都能做到principal
: machine learning数学的东西很简单的, 最多些线性代数泛函分析的东西, 不需要学
: 复杂的东西。
: 公司里面不可能用任何n^2的算法。
: 需要分析数据,找pattern, 那去学nlp, 学vision, 不能有效结合domain knowledge,
: 光想从原始数据提取任何有效pattern的做法都是搞笑的,

t****a
发帖数: 1212
20
嗯,我对data scientist的理解和你不太一样。我心目中合格的data scientist要能独
当一面,不需要SDE support,能够迅速把问题理解并数学建模(一般SDE做不了这个)
,需要是个Linux和各种open source language / tools的高手,有处理各种类型数据
的经验和能力(至少要比一般的SDE强个数倍,最好有Information retrival和NLP背景
)以及快速建立系统原型(擅长各种快速开发工具,效率比一般SDE快个数倍),能够
用统计方法评估各种ML算法的优劣(一般非PhD SDE很少能干这个)的能力。这样他才
能指引方向,说哪种ML方法合适这个问题,系统原型怎么构建。
想当个好data scientist不容易。Engineer能力不足的data scientist需要修炼。这条
路很长,不过好处是知识成体系,有积累,项目经验很有价值,不太容易被淘汰。相比
之下,SDE特别是Client-side的SDE知识更新太快,我很担心那条路以后容易和后辈竞
争。比如,谁知道将来的browser是什么样,手机用什么操作系统?
我是外行,可能这些判断都不太准确,欢迎批评指正。

乐。
retrieve
因吧

【在 t********e 的大作中提到】
: 跟title没有关系,主要是看skill set吧
: 大多数data scientist, 只会用R处理点矢量化的数据, regular expression写不出来
: , 甚至连个json parser都写不出,那到哪里都没有用, 最多建点玩具模型娱乐娱乐。
: 不论是flgta, 他们是有海量数据, 但怎么用dbms/nosql方式store/search/retrieve
: , 这些东西还在摸索阶段,而且他们的大多数数据都是文本信息或者图片, 没有nlp或
: 者vision的人来, 也没办法提起有用的信息转化成矢量什么的。
: 所以, 不论是建大数据的infrastructure, 还是做nlp/vision, 都得靠码工(title为
: software engineer或者research scientist)来做,也就是为什么phd码工值钱的原因吧
:
: scientist

相关主题
有没有人讲一下FB的data scientist和research scientist的区别?Alexa的Sr SDE 与 AWS的Senior Data Scientist 哪一个更好呢?
刷POJ不如刷ML吧?New York City的那些Data Scientist待遇如何?
求助:data scientist(偏统计建模)找IT公司的职位需要刷leetcode到什么程度?请教大家关于data scientist
进入JobHunting版参与讨论
K*********n
发帖数: 2852
21
你们理解是一样的,就是data scientist需要engineer能力也很强,他说的是现实中很
多data scientist这方面不行,不是说data scientist就应该是那样的。

【在 t****a 的大作中提到】
: 嗯,我对data scientist的理解和你不太一样。我心目中合格的data scientist要能独
: 当一面,不需要SDE support,能够迅速把问题理解并数学建模(一般SDE做不了这个)
: ,需要是个Linux和各种open source language / tools的高手,有处理各种类型数据
: 的经验和能力(至少要比一般的SDE强个数倍,最好有Information retrival和NLP背景
: )以及快速建立系统原型(擅长各种快速开发工具,效率比一般SDE快个数倍),能够
: 用统计方法评估各种ML算法的优劣(一般非PhD SDE很少能干这个)的能力。这样他才
: 能指引方向,说哪种ML方法合适这个问题,系统原型怎么构建。
: 想当个好data scientist不容易。Engineer能力不足的data scientist需要修炼。这条
: 路很长,不过好处是知识成体系,有积累,项目经验很有价值,不太容易被淘汰。相比
: 之下,SDE特别是Client-side的SDE知识更新太快,我很担心那条路以后容易和后辈竞

c****m
发帖数: 179
22
我倒是觉得一些公司的data scientist脱胎于data analyst,做的都是些数据库的简单
工作,相当无聊。。。
我觉得楼上说的对,其实research和engineering兼修了,也无所谓title是什么了。
d****n
发帖数: 1637
23
//look this, it might help
***********How To Hire A Data Scientist***********
http://blog.bright.com/2012/11/13/how-to-hire-a-data-scientist/
The most challenging positions to recruit for are often the newest hot
profession. It must have been fun to find a silicon semiconductor
specialist in 1954 — who wanted to study sand before the transistor was
invented? An HTML expert in 1996? SGML experts all had cushy government
jobs or worked for publishers. In the last two years, a new creature known
as the “data scientist” has emerged as one of the must have hires for many
firms. Here at Bright we have assembled an outstanding Data Science group
that built our Bright Score, provides interesting data to the media and
general public via Bright Labs, and causes endless grief for the engineering
team that needs to scale our ideas to our users.
Let’s take a look at our science team on paper. The team is an eclectic
mix, consisting of one former nuclear physicist, one neuroscientist, one
geophysicist, one astrophysicist, and a mechanical engineer. At a glance,
you may think we are trying to invent Warp Drive, and on top of that, not
ONE of them had Data Scientist as their last job title. However, each and
every one of them have had years of extensive training from some of the
brightest minds in the world, have conducted a countless number of hours
researching, experimenting, analyzing, and documenting solutions to real
world problems, and have had their work critiqued by their peers and
published in academic publications. As the old adage goes, “sometimes
things are not always what they appear to be,” a statement very true when
it comes to finding Data Scientists.
How does one go about hunting these camouflaged “purple squirrel”
scientists?
To begin, what is a Data Scientist? It depends who you ask. Common (
incorrect) definitions are:
A Hadoop expert. To those hiring managers that are certain they need a
Hadoop expert I submit @DevOps_Borat
A Machine Learning expert. Every construction project does not need a
hammer.
Kagglers
I define a Data Scientist as someone who knows just enough programming,
system administration, and statistics to transform a large, possibly
heterogeneous set of unstructured data into actionable intelligence or an
actual product. The Data Scientist must also have sufficient visualization
and communication skills to be able to convince someone that they did it
correctly.
We’ve found that one of the least effective methods for finding a Data
Scientist is to log into LinkedIn and search for “Data Scientist.” There
aren’t that many, as Data Science is an emergent field. There are little
to no Data Scientists with 5 years experience, because the job simply did
not exist (at least not in its current form).
Where, then, does one find the elusive Data Scientist? As famed bank robber
Willie Sutton once said, he robbed banks “because that’s where the money
is.” If you want to find a Data Scientist, find yourself a disgruntled
postdoc toiling away on brilliant scientific research, but failing to land a
professorship because … all the professor jobs are taken! (For those of
you not familiar with academia, after earning your Ph.D., you typically work
for 2-6 years as a postdoctoral research fellow. You are a semi-autonomous
, but typically work under a professor that was fortunate enough to get
their Ph.D. in the good old days when there were actually professorships to
be had.)
Private companies that are detached from the world of academia sometimes
give candidates, such as these postdocs, a hard time – having the
perception that they must not be hard workers and won’t be able to keep up
in fast-paced environments, because they haven’t had a “real” job. The
opposite is true, in many cases, people in academia often have to work twice
as hard. The grant funding they receive is insufficient to pay for tools
that many take for granted (“You don’t need that $1000 software license!
Write that code yourself!”). Yes, like any other profession, there are a
few slackers in academia. There are some questions you can ask to identify
and eliminate them early enough in your selection process:
“Tell me about some peer reviewed papers that you published as first author
?” I want people that can finish long, complicated tasks. Nothing takes
longer, or is more complicated than publishing a peer reviewed paper. To
give you an idea of what that entails, imagine all of the backstabbing
people competing with you at work and in your profession, put them behind a
wall of anonymity where they critique and criticize every little detail of
the project you have been slaving over — that is a peer reviewer.
“Tell me about some code you’ve written that other people use?” Academics
tend to be “good enough” programmers. I don’t need it to be elegant,
but I do need it to work. The best test of whether code is “good enough”
is whether at least two other people use it.
“Explain to me the statistical analysis you used in your thesis”
Statistics are like music. Some people play notes, some people make music.
People that really understand statistical concepts at a fundamental level
usually make the best Data Scientists. Anyone can run an Analysis of
Variance in Excel, but is that really the best approach? Ultimately, the
worst thing your Data Scientist can do is get fooled by the data.
LinkedIn can still be helpful, and is particularly useful for finding a Data
Scientist you respect. Once you identify one, find their connections that
are still toiling away in academia, look up their emails on the university
web site (yes, they make it that easy for you), and send them an email.
What is true in sports is also true in hiring — it is better to find a
superstar in the draft than it is to find them as a free agent. They are
cheaper, and you get them during their most productive years.
David Hardtke, Ph.D., Chief Scientist
Josh Barger, PHR, Director of People Operations
w**z
发帖数: 8232
24
good post. Data scientist indeed is very new.

known
many
group

【在 d****n 的大作中提到】
: //look this, it might help
: ***********How To Hire A Data Scientist***********
: http://blog.bright.com/2012/11/13/how-to-hire-a-data-scientist/
: The most challenging positions to recruit for are often the newest hot
: profession. It must have been fun to find a silicon semiconductor
: specialist in 1954 — who wanted to study sand before the transistor was
: invented? An HTML expert in 1996? SGML experts all had cushy government
: jobs or worked for publishers. In the last two years, a new creature known
: as the “data scientist” has emerged as one of the must have hires for many
: firms. Here at Bright we have assembled an outstanding Data Science group

t********e
发帖数: 1169
25
看,我说的没错吧
Here at Bright we have assembled an outstanding Data Science group blah blah
blah
The team is an eclectic mix, consisting of one
former nuclear physicist,
one neuroscientist,
one geophysicist,
one astrophysicist, and
a mechanical engineer.
没一个computer scientist

known
many
group

【在 d****n 的大作中提到】
: //look this, it might help
: ***********How To Hire A Data Scientist***********
: http://blog.bright.com/2012/11/13/how-to-hire-a-data-scientist/
: The most challenging positions to recruit for are often the newest hot
: profession. It must have been fun to find a silicon semiconductor
: specialist in 1954 — who wanted to study sand before the transistor was
: invented? An HTML expert in 1996? SGML experts all had cushy government
: jobs or worked for publishers. In the last two years, a new creature known
: as the “data scientist” has emerged as one of the must have hires for many
: firms. Here at Bright we have assembled an outstanding Data Science group

t****a
发帖数: 1212
26
呵呵,我觉得data scientist是用computer为媒介去研究某个领域的问题的,就这点而
言,自然科学家比计算机科学家更有经验。

blah

【在 t********e 的大作中提到】
: 看,我说的没错吧
: Here at Bright we have assembled an outstanding Data Science group blah blah
: blah
: The team is an eclectic mix, consisting of one
: former nuclear physicist,
: one neuroscientist,
: one geophysicist,
: one astrophysicist, and
: a mechanical engineer.
: 没一个computer scientist

t********e
发帖数: 1169
27
bright.com就是个猎头公司,那个所谓的data science team就是给公司/job打分,每
个cs的,至少也要有个学统计的啊。 他家做的东西跟自然科学毛关系。。。
我觉得楼主就是闲的蛋疼来bso,f家需要捣鼓的东西多得去了, 光靠那个cassandra还
是不够

【在 t****a 的大作中提到】
: 呵呵,我觉得data scientist是用computer为媒介去研究某个领域的问题的,就这点而
: 言,自然科学家比计算机科学家更有经验。
:
: blah

t****a
发帖数: 1212
28
牛B的engineer做出牛的tool比如cassandra之类,data scientist做不出这个.. 他们
是应用这些tool的人。

【在 t********e 的大作中提到】
: bright.com就是个猎头公司,那个所谓的data science team就是给公司/job打分,每
: 个cs的,至少也要有个学统计的啊。 他家做的东西跟自然科学毛关系。。。
: 我觉得楼主就是闲的蛋疼来bso,f家需要捣鼓的东西多得去了, 光靠那个cassandra还
: 是不够

n*****3
发帖数: 1584
29
so most of us can be so 牛B to create casssandra ?
personally I think data scientist is good for
non-tech career path in the future;
SDE is good for coding big 牛 or big 牛 to be.

【在 t****a 的大作中提到】
: 牛B的engineer做出牛的tool比如cassandra之类,data scientist做不出这个.. 他们
: 是应用这些tool的人。

t****a
发帖数: 1212
30
data scientist技术不行的话根本就玩不转数据.. 不可能有专门的team来support他们
的。所以还是个tech career。

【在 n*****3 的大作中提到】
: so most of us can be so 牛B to create casssandra ?
: personally I think data scientist is good for
: non-tech career path in the future;
: SDE is good for coding big 牛 or big 牛 to be.

相关主题
北京Position: Technical Lead, Parallel Data Mining做NLP或者ML的出路,码工?Scientist?Tech Consulting?
data scientist positionData Scientist job opening in SoCal
Amazon, eBay, Goog, Facebook 选哪个?Data Scientist or Software Engineer positions in NYC/Chicago/Dallas
进入JobHunting版参与讨论
X*****e
发帖数: 64
31
楼上说法很靠谱,有前途的搞法是编程和数据分析建模两手都要硬。现实情况是,流氓
(纯码工)多,会武功(数据建模分析)的也不少,但是会武功的流氓少。
n*****3
发帖数: 1584
32
agree, for now
seems 会武功的流氓 is the way to go. -) 两手都要硬!

【在 X*****e 的大作中提到】
: 楼上说法很靠谱,有前途的搞法是编程和数据分析建模两手都要硬。现实情况是,流氓
: (纯码工)多,会武功(数据建模分析)的也不少,但是会武功的流氓少。

t****a
发帖数: 1212
33
既然楼上各位觉得会流氓的武功比较流氓,那么各位觉得应该会什么流氓呢?窃以为会
流氓的武功和一般的流氓的流氓路数是不太一样的。

【在 n*****3 的大作中提到】
: agree, for now
: seems 会武功的流氓 is the way to go. -) 两手都要硬!

n*****3
发帖数: 1584
34
build up non-triial learning system

【在 t****a 的大作中提到】
: 既然楼上各位觉得会流氓的武功比较流氓,那么各位觉得应该会什么流氓呢?窃以为会
: 流氓的武功和一般的流氓的流氓路数是不太一样的。

t***j
发帖数: 2620
35
有经验是扯淡,大家都是新手上路,所以都在乱搞而已。

[发表自未名空间手机版 - m.mitbbs.com]

【在 t****a 的大作中提到】
: 呵呵,我觉得data scientist是用computer为媒介去研究某个领域的问题的,就这点而
: 言,自然科学家比计算机科学家更有经验。
:
: blah

l*******s
发帖数: 1258
36
嗯 说的不错。
真正的scientist 需要理论和工程都NB
一方面会用数学模型分析数据;另一方面能写出工业级的robust代码
给你一堆unstructured data,能够自己写代码找pattern,转化成structured data,
然后建模分析,data mining。
差不多一个人能顶一个完整的team,包括engineer和scientist。
但是这样的狠角色,相信没个学术界加工业界5、6年的时间,是练不出来的。

【在 t****a 的大作中提到】
: 嗯,我对data scientist的理解和你不太一样。我心目中合格的data scientist要能独
: 当一面,不需要SDE support,能够迅速把问题理解并数学建模(一般SDE做不了这个)
: ,需要是个Linux和各种open source language / tools的高手,有处理各种类型数据
: 的经验和能力(至少要比一般的SDE强个数倍,最好有Information retrival和NLP背景
: )以及快速建立系统原型(擅长各种快速开发工具,效率比一般SDE快个数倍),能够
: 用统计方法评估各种ML算法的优劣(一般非PhD SDE很少能干这个)的能力。这样他才
: 能指引方向,说哪种ML方法合适这个问题,系统原型怎么构建。
: 想当个好data scientist不容易。Engineer能力不足的data scientist需要修炼。这条
: 路很长,不过好处是知识成体系,有积累,项目经验很有价值,不太容易被淘汰。相比
: 之下,SDE特别是Client-side的SDE知识更新太快,我很担心那条路以后容易和后辈竞

L*****k
发帖数: 327
37
说得很好~~处理数据+建模+算法/优化+高质量代码,这条链下来就真是很牛了
unstructured data到structured data很需要工作经验,如果是相关的PhD(ML/DM/NLP
/CV),这方面应该会理解积累一些domain经验,可能工作后上手快一些,但还是需要
时间

【在 l*******s 的大作中提到】
: 嗯 说的不错。
: 真正的scientist 需要理论和工程都NB
: 一方面会用数学模型分析数据;另一方面能写出工业级的robust代码
: 给你一堆unstructured data,能够自己写代码找pattern,转化成structured data,
: 然后建模分析,data mining。
: 差不多一个人能顶一个完整的team,包括engineer和scientist。
: 但是这样的狠角色,相信没个学术界加工业界5、6年的时间,是练不出来的。

g****n
发帖数: 194
38
software engineer 入门容易。 data mining 要求颇高,不过你的专业正好适合。
data mining 机会:
http://jobguiding.com/it-jobs/data-mining.html

.

【在 g*l 的大作中提到】
: CS PHD (machine learning/data mining 方向的)是走纯粹软工,还是数据科学家的职
: 业道路好?
: 现在好象做数据分析, 大数据处理的很红火啊, 好象还缺人, 工资也高.感觉数据处理
: 经验更重要, 而码工好象老了就不吃香了, 经验不是非常重要因为老有新东西要学...
: 有前辈指点一下吗?

l*******s
发帖数: 1258
39
这个必须得phd吗?我的意思是如果水平具备的话 公司会不会在意那个degree
干了一年马工后 其实有时候我严肃的考虑回去读个phd

NLP

【在 L*****k 的大作中提到】
: 说得很好~~处理数据+建模+算法/优化+高质量代码,这条链下来就真是很牛了
: unstructured data到structured data很需要工作经验,如果是相关的PhD(ML/DM/NLP
: /CV),这方面应该会理解积累一些domain经验,可能工作后上手快一些,但还是需要
: 时间

1 (共1页)
进入JobHunting版参与讨论
相关主题
New York City的那些Data Scientist待遇如何?有了解LinkedIn的data scientist的吗?
请教大家关于data scientistdata scientist vs. software engineer
北京Position: Technical Lead, Parallel Data MiningSDE 和 Data Scientist 哪个好
data scientist positiondata scientist 和 software developer 选哪个
Amazon, eBay, Goog, Facebook 选哪个?data scienctist和马工差的多吗?
做NLP或者ML的出路,码工?Scientist?Tech Consulting?Machine learning Ph.D 能找啥工作?
Data Scientist job opening in SoCalFB家的Data Scientist和Data Engineer有啥区别么?
Data Scientist or Software Engineer positions in NYC/Chicago/Dallas有没有人讲一下FB的data scientist和research scientist的区别?
相关话题的讨论汇总
话题: data话题: scientist话题: people话题: engineer话题: sde