由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 问一下调参侠的职业发展
进入Programming版参与讨论
1 (共1页)
m******n
发帖数: 453
1
某大厂ML组scientist,主要做fraud detection
但又不是真的research team,平常工作主要是做feature,train model,deploy
model
然后汇报这个AUC/ROC提高了多少
但尴尬的是,真的涉及到production pipeline的东西,并不懂
因为我们只是user用API,有专门的SDE和engineering team负责技术上的东西
平常甚至连production code都不用写,jupyter notebook可以处理大部分工作了
peer presure很大,大家都是PhD,都挖空脑袋claim如果用了这个CNN那个GAN这个BERT
神马的,会带来AUC多大的提高…… 自己又是半路出家的(虽然,绝大部分人也是抄书
,真的有能力自己提出algorithm恐怕也会有更好出处)
这么下去是不是只能往PM转了?
c*******v
发帖数: 2599
2
只会写jupyter python的DS phd fresh。我叫他们业余时间写个算法预测spy之软件。
自己找
个数据源做好后端。然后放android手机上。手机app之icon按一下出来UP或者DOWN二字
之一。然后用另一个程序算准确率。不靠近50%则找出错误。
不管再小的软件,哪怕是个notepad。先能自己写出来能用的release,
然后你会有别的想法。自己应能找到职业发展的答案。
没有代码能自理这个基础,考虑什么也没用。PM必然也做不好。
good luck。

BERT

【在 m******n 的大作中提到】
: 某大厂ML组scientist,主要做fraud detection
: 但又不是真的research team,平常工作主要是做feature,train model,deploy
: model
: 然后汇报这个AUC/ROC提高了多少
: 但尴尬的是,真的涉及到production pipeline的东西,并不懂
: 因为我们只是user用API,有专门的SDE和engineering team负责技术上的东西
: 平常甚至连production code都不用写,jupyter notebook可以处理大部分工作了
: peer presure很大,大家都是PhD,都挖空脑袋claim如果用了这个CNN那个GAN这个BERT
: 神马的,会带来AUC多大的提高…… 自己又是半路出家的(虽然,绝大部分人也是抄书
: ,真的有能力自己提出algorithm恐怕也会有更好出处)

l*******m
发帖数: 1096
3
recommendation和fraud detection两个应用会长久,招人还是挺看重经验的。如果自
己创新不够,就学习中国公司的做法。多开些会,networking, 看看别人怎么做的。

BERT

【在 m******n 的大作中提到】
: 某大厂ML组scientist,主要做fraud detection
: 但又不是真的research team,平常工作主要是做feature,train model,deploy
: model
: 然后汇报这个AUC/ROC提高了多少
: 但尴尬的是,真的涉及到production pipeline的东西,并不懂
: 因为我们只是user用API,有专门的SDE和engineering team负责技术上的东西
: 平常甚至连production code都不用写,jupyter notebook可以处理大部分工作了
: peer presure很大,大家都是PhD,都挖空脑袋claim如果用了这个CNN那个GAN这个BERT
: 神马的,会带来AUC多大的提高…… 自己又是半路出家的(虽然,绝大部分人也是抄书
: ,真的有能力自己提出algorithm恐怕也会有更好出处)

f*******t
发帖数: 7549
4
这已经是最好的职位了,去哪个公司都吃香喝辣
c*******v
发帖数: 2599
5
现在是jupyter notebook,过去是matlab...R,etc。
搞算法调参数的phd,确有不少代码不能自理,打字一个个按的。
如果不想办法,不然别说老印了,本版的helpme之流都会骑在头上。
越是phd越是被欺负。吃香喝辣的日子很难持续。
楼主能描述清楚软件人员与DS人员之掌控范围之不同,
必然已经发生过了不少龌龊。然后学会了。----这是学校学不到的。

【在 f*******t 的大作中提到】
: 这已经是最好的职位了,去哪个公司都吃香喝辣
c*******v
发帖数: 2599
6
这个竞争很剧烈吧?很难想象一队队phd,用jupyter notebook提高AUC的场景。

【在 l*******m 的大作中提到】
: recommendation和fraud detection两个应用会长久,招人还是挺看重经验的。如果自
: 己创新不够,就学习中国公司的做法。多开些会,networking, 看看别人怎么做的。
:
: BERT

r****t
发帖数: 10904
7
新东西都从用jupyter notebook/lab的phd那里来啊,说实话挺好用的。
整production code比较无趣,整production code的也很想玩下jypyter notebook上面
的fancy 玩意的。

【在 c*******v 的大作中提到】
: 只会写jupyter python的DS phd fresh。我叫他们业余时间写个算法预测spy之软件。
: 自己找
: 个数据源做好后端。然后放android手机上。手机app之icon按一下出来UP或者DOWN二字
: 之一。然后用另一个程序算准确率。不靠近50%则找出错误。
: 不管再小的软件,哪怕是个notepad。先能自己写出来能用的release,
: 然后你会有别的想法。自己应能找到职业发展的答案。
: 没有代码能自理这个基础,考虑什么也没用。PM必然也做不好。
: good luck。
:
: BERT

l*******m
发帖数: 1096
8
google ads组优化CTR快20年了,每季度都有improvement. 以几何级数增长,现在是不
是要比100%还多了?哈哈,还是不怎么高。你们想过为什么吗?所以有的搞。只是一方
面。
另一方面,我给年轻ML managers的建议是,一定不要KPI就是增加准确率,半年一年就
没什么意思,而且压力大,组里的气氛毒性变大。一定要不断寻找新的ML问题。所以主
要是managers的问题。

【在 c*******v 的大作中提到】
: 这个竞争很剧烈吧?很难想象一队队phd,用jupyter notebook提高AUC的场景。
f*******t
发帖数: 7549
9
guvest啥话题都来胡扯一通,明显没见过大公司是怎么做ml的。从modeling到
productionize到ml infra,整个tech stack里搞jupyter是最爽的那类,因为想点idea
就能生产impact,比起prod和infra烂活少多了。
楼主的问题在于peer pressure,觉得争credit拼不过其它吃苦耐劳的phd们,升级难。
我猜大概率在f。去文化好点的大厂或者竞争没那么激烈的方向可以缓解;或者带着业
界顶尖的modeling知识,去小公司拉团队走m-track也不错。

【在 r****t 的大作中提到】
: 新东西都从用jupyter notebook/lab的phd那里来啊,说实话挺好用的。
: 整production code比较无趣,整production code的也很想玩下jypyter notebook上面
: 的fancy 玩意的。

C*****l
发帖数: 1
10
there is always a choice。你们这里工资也高是吧。如果你只care研究的品味,可以
换个真正像FAIR这样的部门。

BERT

【在 m******n 的大作中提到】
: 某大厂ML组scientist,主要做fraud detection
: 但又不是真的research team,平常工作主要是做feature,train model,deploy
: model
: 然后汇报这个AUC/ROC提高了多少
: 但尴尬的是,真的涉及到production pipeline的东西,并不懂
: 因为我们只是user用API,有专门的SDE和engineering team负责技术上的东西
: 平常甚至连production code都不用写,jupyter notebook可以处理大部分工作了
: peer presure很大,大家都是PhD,都挖空脑袋claim如果用了这个CNN那个GAN这个BERT
: 神马的,会带来AUC多大的提高…… 自己又是半路出家的(虽然,绝大部分人也是抄书
: ,真的有能力自己提出algorithm恐怕也会有更好出处)

f*******t
发帖数: 7549
11
g brain,fair这些不是想进就能进。不过楼主已经有一些ml background,有一点去打
杂的机会

【在 C*****l 的大作中提到】
: there is always a choice。你们这里工资也高是吧。如果你只care研究的品味,可以
: 换个真正像FAIR这样的部门。
:
: BERT

g****t
发帖数: 31659
12
我上星期刚与三番一家大公司VP, fellow开会。可能要合作ML项目。各家有所不同。你
認為我一無所知那就錯了。還沒ds這學科的時候我就在最大的公司做了十年算法。
我現管的也有ds phd。
你熟悉jupyter notebook么?如果我没记错,我是本版最早折腾这玩意的人之一。那要
回到2015年了。找我当年literature programming 的笔记就知道问题出在哪了。技术
上也有原因,不可避免會反映出來。那時候哪有什麼大廠人用jupyter notebook。
你也可找個product line我看看其方向,我免費算一
卦。過兩年看結果。是不是胡扯,咱算個準確率。


: guvest啥话题都来胡扯一通,明显没见过大公司是怎么做ml的。从
modeling到

: productionize到ml infra,整个tech stack里搞jupyter是最爽的那类,
因为想
点idea

: 就能生产impact,比起prod和infra烂活少多了。

: 楼主的问题在于peer pressure,觉得争credit拼不过其它吃苦耐劳的phd
们,升
级难。

: 我猜大概率在f。去文化好点的大厂或者竞争没那么激烈的方向可以缓解
;或者
带着业

: 界顶尖的modeling知识,去小公司拉团队走m-track也不错。



【在 f*******t 的大作中提到】
: g brain,fair这些不是想进就能进。不过楼主已经有一些ml background,有一点去打
: 杂的机会

g****t
发帖数: 31659
13
可查下我之前的舊帖。折腾了好几年jupyter notebook。
旧帖也许仍有參
考價值。tool的問題,技術上的東西會帶到管理。
说实话要真想有主流AI/ML領域之新的idea,我觉得那還是得Cpp。工具會限制人的思維
。我做
工業項目,則要用C。
诸位不妨帮我挑挑错。看我当时的帖是否过时了,需要更新知识。
另外例如你是软件背景的人。接到了很好用的notebook。那notebook之作者多半对软件
也是很了解的。不然你作为用户,不会被pleased。这跟能设计好api的人,要有软件积
累类似。楼主缺的可能就是这方面的功夫。盯着AUC长远来看不是个办法。


: 新东西都从用jupyter notebook/lab的phd那里来啊,说实话挺好用的。

: 整production code比较无趣,整production code的也很想玩下jypyter
notebook上面

: 的fancy 玩意的。



【在 r****t 的大作中提到】
: 新东西都从用jupyter notebook/lab的phd那里来啊,说实话挺好用的。
: 整production code比较无趣,整production code的也很想玩下jypyter notebook上面
: 的fancy 玩意的。

g****t
发帖数: 31659
14
不同用户数量级之下,比较同一个指标,这个統計可能會有misleading吧?
看上去是同一个问题,数据规模不同。那可能就是本质不同的问题了。
这几十年。用戶飛速增長。广告客户飞速增长。
goog能保持住20
年前的点击率已经相当厉害了。这方面地球上可能没其他公司能做到更好。


: google ads组优化CTR快20年了,每季度都有improvement. 以几何级数增
长,现
在是不

: 是要比100%还多了?哈哈,还是不怎么高。你们想过为什么吗?所以有的
搞。只
是一方

: 面。

: 另一方面,我给年轻ML managers的建议是,一定不要KPI就是增加准确率
,半年
一年就

: 没什么意思,而且压力大,组里的气氛毒性变大。一定要不断寻找新的ML
问题。
所以主

: 要是managers的问题。



【在 l*******m 的大作中提到】
: google ads组优化CTR快20年了,每季度都有improvement. 以几何级数增长,现在是不
: 是要比100%还多了?哈哈,还是不怎么高。你们想过为什么吗?所以有的搞。只是一方
: 面。
: 另一方面,我给年轻ML managers的建议是,一定不要KPI就是增加准确率,半年一年就
: 没什么意思,而且压力大,组里的气氛毒性变大。一定要不断寻找新的ML问题。所以主
: 要是managers的问题。

t*******e
发帖数: 1633
15
显然是做搜索推荐的,就是这个情况

果自

【在 c*******v 的大作中提到】
: 这个竞争很剧烈吧?很难想象一队队phd,用jupyter notebook提高AUC的场景。
n******t
发帖数: 4406
16
如果你想比開會能力,你和他明顯還有差距,否則你不會還在羨慕什麼跑Jupyter
notebook的。
你屬於那種做云的時候是做收費的,做ML的時候是寫UI的,什麼大廠都呆過,hot的
area都做過,但是都是打雜的那種。問題是,廠很大,area hot和你有什麼關係嗎?

idea

【在 f*******t 的大作中提到】
: guvest啥话题都来胡扯一通,明显没见过大公司是怎么做ml的。从modeling到
: productionize到ml infra,整个tech stack里搞jupyter是最爽的那类,因为想点idea
: 就能生产impact,比起prod和infra烂活少多了。
: 楼主的问题在于peer pressure,觉得争credit拼不过其它吃苦耐劳的phd们,升级难。
: 我猜大概率在f。去文化好点的大厂或者竞争没那么激烈的方向可以缓解;或者带着业
: 界顶尖的modeling知识,去小公司拉团队走m-track也不错。

g****t
发帖数: 31659
17
只从技术来考虑。我是2015年开始折腾notebook的。几年后去了软件公司,反而新的发
展没有时间follow。听听新的观点也不错。
旧雨新知,都有好处。


: 如果你想比開會能力,你和他明顯還有差距,否則你不會還在羨慕什麼跑
Jupyter

: notebook的。

: 你屬於那種做云的時候是做收費的,做ML的時候是寫UI的,什麼大廠都呆過,
hot的

: area都做過,但是都是打雜的那種。問題是,廠很大,area hot和你有什麼關係
嗎?

: idea



【在 n******t 的大作中提到】
: 如果你想比開會能力,你和他明顯還有差距,否則你不會還在羨慕什麼跑Jupyter
: notebook的。
: 你屬於那種做云的時候是做收費的,做ML的時候是寫UI的,什麼大廠都呆過,hot的
: area都做過,但是都是打雜的那種。問題是,廠很大,area hot和你有什麼關係嗎?
:
: idea

n******t
发帖数: 4406
18
不管你做什麼方向的,只要你能抓住第一性的東西還能有點實際產出,不可能日子難過。

【在 g****t 的大作中提到】
: 只从技术来考虑。我是2015年开始折腾notebook的。几年后去了软件公司,反而新的发
: 展没有时间follow。听听新的观点也不错。
: 旧雨新知,都有好处。
:
:
: 如果你想比開會能力,你和他明顯還有差距,否則你不會還在羨慕什麼跑
: Jupyter
:
: notebook的。
:
: 你屬於那種做云的時候是做收費的,做ML的時候是寫UI的,什麼大廠都呆過,
: hot的
:
: area都做過,但是都是打雜的那種。問題是,廠很大,area hot和你有什麼關係

f*******t
发帖数: 7549
19
你做了啥,有资格看不起收费的?aws usage metering team 10年前就要处理海量的数
据。
论扯淡能力,guvest在版上说第二,估计没人会说自己第一。但把才能用来整天灌水也
是白瞎了。

【在 n******t 的大作中提到】
: 如果你想比開會能力,你和他明顯還有差距,否則你不會還在羨慕什麼跑Jupyter
: notebook的。
: 你屬於那種做云的時候是做收費的,做ML的時候是寫UI的,什麼大廠都呆過,hot的
: area都做過,但是都是打雜的那種。問題是,廠很大,area hot和你有什麼關係嗎?
:
: idea

n******t
发帖数: 4406
20
我可沒看不起收費的,問題是第一你不是收費的,你是做收費工具的,做收費工具其實
我也沒看不起。第二是你既然是做週邊的你就不能用core的姿態來說別人懂還不懂,尤
其是說怎麼在公司最好混的種事情。

【在 f*******t 的大作中提到】
: 你做了啥,有资格看不起收费的?aws usage metering team 10年前就要处理海量的数
: 据。
: 论扯淡能力,guvest在版上说第二,估计没人会说自己第一。但把才能用来整天灌水也
: 是白瞎了。

f*******t
发帖数: 7549
21
这就是你们不懂大公司的地方。一是既然已经变成大公司,核心产品基本固定,从零到
一的机会很少,挑新产品做失败的风险极高。楼主看起来是比较新的人,只有两条路,
要不带着domain knowledge去小地方赌,要不就去日子好过的地方混,内卷已经起来的
地方再努力也没出路。二是所有的pillar都细分成很多组,不管是底下打杂的还是
上边画饼的,谁离开都可能随时补上。像你可能觉得自己有两把刷子,小公司离了你就
混不下去,这种事在大公司是不会发生的,牛逼轰轰没意义,平时还是别有自己扛起了
一个domain这种幻想比较好。

【在 n******t 的大作中提到】
: 我可沒看不起收費的,問題是第一你不是收費的,你是做收費工具的,做收費工具其實
: 我也沒看不起。第二是你既然是做週邊的你就不能用core的姿態來說別人懂還不懂,尤
: 其是說怎麼在公司最好混的種事情。

g****t
发帖数: 31659
22
我以前所在的大公司离了我就在一个领域混不下去了。这是我的看法。是否正确,尚待
时间来验证。
我走之后三年换了三任Product line manager。design, FW, software tool, app
manager不知换了多
少。半年一次re org。
前不久换senior VP。有人找我。我说我们都在认识真理的路上。
没有炫耀的意思.你当故事看笑笑就好。
我的意思是:即便在大公司当螺丝钉,(尤其是年轻人)也没有理由限制自己的想象力
。十年时间走到领域第一排完全doable 。
为何你不行?
你不行别人就不行?
这些俗见毫无意义。实际上这些俗见才是未验证的illusion。
稍加思考就知道不可靠。


: 这就是你们不懂大公司的地方。一是既然已经变成大公司,核心产品基本
固定,
从零到

: 一的机会很少,挑新产品做失败的风险极高。楼主看起来是比较新的人,
只有两
条路,

: 要不带着domain knowledge去小地方赌,要不就去日子好过的地方混,内
卷已经
起来的

: 地方再努力也没出路。二是所有的pillar都细分成很多组,不管是底下打
杂的还是

: 上边画饼的,谁离开都可能随时补上。像你可能觉得自己有两把刷子,小
公司离
了你就

: 混不下去,这种事在大公司是不会发生的,牛逼轰轰没意义,平时还是别
有自己
扛起了

: 一个domain这种幻想比较好。



【在 f*******t 的大作中提到】
: 这就是你们不懂大公司的地方。一是既然已经变成大公司,核心产品基本固定,从零到
: 一的机会很少,挑新产品做失败的风险极高。楼主看起来是比较新的人,只有两条路,
: 要不带着domain knowledge去小地方赌,要不就去日子好过的地方混,内卷已经起来的
: 地方再努力也没出路。二是所有的pillar都细分成很多组,不管是底下打杂的还是
: 上边画饼的,谁离开都可能随时补上。像你可能觉得自己有两把刷子,小公司离了你就
: 混不下去,这种事在大公司是不会发生的,牛逼轰轰没意义,平时还是别有自己扛起了
: 一个domain这种幻想比较好。

g****t
发帖数: 31659
23
我刚看了下。好像周五INTC 股票居然跌了5%。
不知道是不是把TLB焊死的缘故。
还是因为我这两星期吐槽造成的。


: 你做了啥,有资格看不起收费的?aws usage metering team 10年前就要
处理海
量的数

: 据。

: 论扯淡能力,guvest在版上说第二,估计没人会说自己第一。但把才能用
来整天
灌水也

: 是白瞎了。



【在 f*******t 的大作中提到】
: 这就是你们不懂大公司的地方。一是既然已经变成大公司,核心产品基本固定,从零到
: 一的机会很少,挑新产品做失败的风险极高。楼主看起来是比较新的人,只有两条路,
: 要不带着domain knowledge去小地方赌,要不就去日子好过的地方混,内卷已经起来的
: 地方再努力也没出路。二是所有的pillar都细分成很多组,不管是底下打杂的还是
: 上边画饼的,谁离开都可能随时补上。像你可能觉得自己有两把刷子,小公司离了你就
: 混不下去,这种事在大公司是不会发生的,牛逼轰轰没意义,平时还是别有自己扛起了
: 一个domain这种幻想比较好。

w*****h
发帖数: 423
24
同在某大厂做ml方面的。我觉得不钻算法(或者没这个能力的)的ds或者ml scientist
还是不要花太多时间在提高什么auc或者pr上面, 你可以多熟悉熟悉你这个领域的
business logic,找到一些全新的问题。前者无非就是增高1%,或者2%, who
cares。 后者好歹是从0到1,影响大多了。
T*******r
发帖数: 5
25
听起来楼主似乎是亚麻某org的。调参和特征工程确实比较枯燥,争取数据上量吧,上
大数据平台跑起来。
1 (共1页)
进入Programming版参与讨论