由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - Re: 请教板上老司机 关于组和以后的发展方向
相关主题
各位大牛,Apache Apex 怎么样?这种情况该用那种big data tool?
大家对写map reduce有兴趣么?感觉很无聊阿有没工具或framework可以对大数据库运行中去重复?
问个Hadoop Word Count的简单问题问二爷一个题外话
菜鸟请教个hadoop streaming job 的问题 (转载)scala看来也就这样了
Mrjob很赞现在的云计算技术,比如hadoop,和数据挖掘data mining有联系吗?
是否值得把业务逻辑做到Hbase coprocessor里面?试了下spark,不过如此啊
aws EMR能设置一个mapper吗?coltzhao的公司还在用mongo吗?
spark is slower than java Mapreduce --scala big bulls pls adviseData Engineer @ ADP data team
相关话题的讨论汇总
话题: spark话题: 蛋疼话题: 目测话题: 仅限话题: platform
进入Programming版参与讨论
1 (共1页)
t*****n
发帖数: 481
1
已快奔四 半路出家
就是大家熟知的老帮菜
有2年左右经验 主要用java spark scala (仅限用spark的时候)
一个是grubhub, 给 rsu
title: sr data engineer
report 给 lead, 老印, 目测比较nice, 仅限目测
技术栈: s3, emr, spark, hive, c*, elastic search, presto, azkaban
以后会做: 公司全新的data platform 算是infra
蛋疼1: 此三哥在江湖混迹20年 你懂的
蛋疼2: 三哥告诉我这个platform 目前大概10个人在做 4个offshore 你懂的 2个
remote 估计我去了 除了他 办公室最多还有两个人写代码吧
一个是appnexus, 给 option
title: sde ii
report 给 sr sde, 白人小弟, 目测比较nice
技术栈: java, mapreduce, mysql, vertica, protocol buffer
以后会做: video ad reporting 的 pipeline, 主要是内部用户使用
蛋疼1: 这个pipeline目前只有他一个人在写 我进去算是第二个
蛋疼2: 我以后要report的这个小哥说他还在用java写mapper和reducer 难道现在不是
无脑spark 或者上更新的工具?
还望板上各位老兄弟指导一下
除了技术栈 能说说行业前景 公司前景什么的更好
当然 我知道这两个可能都很差
我会继续刷题的
争取去个比较好的地方
多谢
l**********0
发帖数: 150
2
目测第一个好,用AWS和spark,比较普世。不过印度人多,做好提高情商和斗争战斗力
的准备。
startup还在用mr的现在少见了
y**********u
发帖数: 2839
3
> 我会继续刷题的
> 争取去个比较好的地方
活到老,刷到死,像thisman兄学习,爱你

【在 t*****n 的大作中提到】
: 已快奔四 半路出家
: 就是大家熟知的老帮菜
: 有2年左右经验 主要用java spark scala (仅限用spark的时候)
: 一个是grubhub, 给 rsu
: title: sr data engineer
: report 给 lead, 老印, 目测比较nice, 仅限目测
: 技术栈: s3, emr, spark, hive, c*, elastic search, presto, azkaban
: 以后会做: 公司全新的data platform 算是infra
: 蛋疼1: 此三哥在江湖混迹20年 你懂的
: 蛋疼2: 三哥告诉我这个platform 目前大概10个人在做 4个offshore 你懂的 2个

t*****n
发帖数: 481
4
刷题哥
我就怕你们调皮
偷偷跑到娘家发帖问
还是被你们发现了。。。

【在 y**********u 的大作中提到】
: > 我会继续刷题的
: > 争取去个比较好的地方
: 活到老,刷到死,像thisman兄学习,爱你

y**********u
发帖数: 2839
5
把你顶起来

【在 t*****n 的大作中提到】
: 刷题哥
: 我就怕你们调皮
: 偷偷跑到娘家发帖问
: 还是被你们发现了。。。

n******g
发帖数: 2201
6
Spark 比aluxio 如何?
[在 thisman (thisman) 的大作中提到:]
:已快奔四 半路出家
:就是大家熟知的老帮菜
:有2年左右经验 主要用java spark scala (仅限用spark的时候)
:一个是grubhub, 给 rsu
:title: sr data engineer
:report 给 lead, 老印, 目测比较nice, 仅限目测
:技术栈: s3, emr, spark, hive, c*, elastic search, presto, azkaban
:以后会做: 公司全新的data platform 算是infra
:蛋疼1: 此三哥在江湖混迹20年 你懂的
:蛋疼2: 三哥告诉我这个platform 目前大概10个人在做 4个offshore 你懂的 2个
:..........
f******2
发帖数: 2455
7
烙印也分几类:
1. 有名校或者听说过的学校phd的,这种跟着(几乎)没有任何问题;
2. 在美国上过学的,在美国干过正经事儿的,这种跟着要观察;
3. 直接icc或者大公司从印度贩卖过来的,这种还是不要去fuck自己了。
其实跟老板主要是看老板自信不自信,要不要把机会给你,会不会把credit给你。
s********k
发帖数: 6180
8
appnexus都多少年了,还有上市计划吗

【在 t*****n 的大作中提到】
: 已快奔四 半路出家
: 就是大家熟知的老帮菜
: 有2年左右经验 主要用java spark scala (仅限用spark的时候)
: 一个是grubhub, 给 rsu
: title: sr data engineer
: report 给 lead, 老印, 目测比较nice, 仅限目测
: 技术栈: s3, emr, spark, hive, c*, elastic search, presto, azkaban
: 以后会做: 公司全新的data platform 算是infra
: 蛋疼1: 此三哥在江湖混迹20年 你懂的
: 蛋疼2: 三哥告诉我这个platform 目前大概10个人在做 4个offshore 你懂的 2个

t*****n
发帖数: 481
9
多谢老司机 但是第一种实在太少了

【在 f******2 的大作中提到】
: 烙印也分几类:
: 1. 有名校或者听说过的学校phd的,这种跟着(几乎)没有任何问题;
: 2. 在美国上过学的,在美国干过正经事儿的,这种跟着要观察;
: 3. 直接icc或者大公司从印度贩卖过来的,这种还是不要去fuck自己了。
: 其实跟老板主要是看老板自信不自信,要不要把机会给你,会不会把credit给你。

t**********n
发帖数: 1718
10
我知道楼主是谁了 作为街霸帮的成员竟然跑到这里发帖 哈哈 爱你哟
我等保健兄的高见

【在 t*****n 的大作中提到】
: 已快奔四 半路出家
: 就是大家熟知的老帮菜
: 有2年左右经验 主要用java spark scala (仅限用spark的时候)
: 一个是grubhub, 给 rsu
: title: sr data engineer
: report 给 lead, 老印, 目测比较nice, 仅限目测
: 技术栈: s3, emr, spark, hive, c*, elastic search, presto, azkaban
: 以后会做: 公司全新的data platform 算是infra
: 蛋疼1: 此三哥在江湖混迹20年 你懂的
: 蛋疼2: 三哥告诉我这个platform 目前大概10个人在做 4个offshore 你懂的 2个

d*******n
发帖数: 43
11
来了
楼主偷偷跑到这里问 太不厚道了

【在 t**********n 的大作中提到】
: 我知道楼主是谁了 作为街霸帮的成员竟然跑到这里发帖 哈哈 爱你哟
: 我等保健兄的高见

t*****n
发帖数: 481
12
唉 我也是没办法 没有达到刷题帮的目标 不好意思在闺版问啊
求指导啊


: 来了

: 楼主偷偷跑到这里问 太不厚道了



【在 d*******n 的大作中提到】
: 来了
: 楼主偷偷跑到这里问 太不厚道了

1 (共1页)
进入Programming版参与讨论
相关主题
Data Engineer @ ADP data teamMrjob很赞
感觉flink出来之后,hadoop就显得不怎么再需要了是否值得把业务逻辑做到Hbase coprocessor里面?
问个log处理的问题aws EMR能设置一个mapper吗?
问一道HIVE题 关于Efficiencyspark is slower than java Mapreduce --scala big bulls pls advise
各位大牛,Apache Apex 怎么样?这种情况该用那种big data tool?
大家对写map reduce有兴趣么?感觉很无聊阿有没工具或framework可以对大数据库运行中去重复?
问个Hadoop Word Count的简单问题问二爷一个题外话
菜鸟请教个hadoop streaming job 的问题 (转载)scala看来也就这样了
相关话题的讨论汇总
话题: spark话题: 蛋疼话题: 目测话题: 仅限话题: platform