由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 一个困扰我一段时间的问题:big data为什么要搞ml那些algorithm?
相关主题
哪些公司在用大数据? Big Data?怎么建一个AWS的real time scoring engine?
是选statistician 还是data warehouse ETL?一个 senior data scientist 的面试题。
Some thoughts on data science and data scientistsData/research scientist, Statistician 公司分档
洛杉矶LA求Data Science/Stat 相关工作内推,有经验面试的时候back propagation algorithm一般会怎么问?
Data Analyst/Statistician 工作求内推发现DS的工资在北加和南加好像差距太大了
所谓的大数据Bayesian inference
Kafka, Spark Streaming, ElasticSearch for Business IntelliFresh Grad求助:该不该接这个contractor (转载)
求Big Data Principles and best practices of scalable realtime data systems MEAP电子版求apple statistician内推 (转载)
相关话题的讨论汇总
话题: data话题: big话题: ml话题: 一段时间话题: algorithm
进入DataSciences版参与讨论
1 (共1页)
T*****u
发帖数: 7103
1
这个问题思考,搜索一段时间了,发现big data完全没必要,或者很少需要搞这些复杂
的ml。online/stream需要。大牛们分享一下吧。
c***z
发帖数: 6348
2
是ML需要big data,不是反过来
因为可以batch,所以大部分big data工作其实不是big data
hardcore的big data确实是online/stream/realtime那块
T*****u
发帖数: 7103
3
这也是我不明白的地方,big data是需求,ml是工具,为什么不是以需求为中心捏?
m*********r
发帖数: 119
4
是ML要做好就需要big data
而是反着来的
因为big data ,所以ML才能够弥补之前的不足
d******e
发帖数: 7844
5
... ...
Big Data是双刃剑。
并不是数据大了Performance就好了... ...

【在 m*********r 的大作中提到】
: 是ML要做好就需要big data
: 而是反着来的
: 因为big data ,所以ML才能够弥补之前的不足

a***g
发帖数: 2761
6
因为掌握工具的人群某种程度上形成了垄断
对有需求的人说
想搞定big data这样的需求就用我们提供的工具,不可能完全按照你们设想的来

【在 T*****u 的大作中提到】
: 这也是我不明白的地方,big data是需求,ml是工具,为什么不是以需求为中心捏?
z****e
发帖数: 54598
7
因为big data是ml的第一步
如果是规则数据,你没有必要折腾
很容易实现很多目的,比如oracle db
只有混乱的数据才需要一点智能去处理
其次
数据量要大,数据量小,你这个计算计算很复杂
穷举过去也不用多少时间,只有数据量大
大到你用最愚蠢的算法搞不定的时候
才有这个需求
m*********r
发帖数: 119
8
这个也是对的
请问有什么地方列举了big data的反面例子吗
想学习下。。。

【在 d******e 的大作中提到】
: ... ...
: Big Data是双刃剑。
: 并不是数据大了Performance就好了... ...

c******r
发帖数: 300
9
Because there are not many good applied statisticians out there.

【在 T*****u 的大作中提到】
: 这个问题思考,搜索一段时间了,发现big data完全没必要,或者很少需要搞这些复杂
: 的ml。online/stream需要。大牛们分享一下吧。

1 (共1页)
进入DataSciences版参与讨论
相关主题
求apple statistician内推 (转载)Data Analyst/Statistician 工作求内推
Re: 攒人品,发Google Statistician/Data Scientist电面面经所谓的大数据
推荐三本书Kafka, Spark Streaming, ElasticSearch for Business Intelli
A/B testing用generic algorithm优化可行吗?求Big Data Principles and best practices of scalable realtime data systems MEAP电子版
哪些公司在用大数据? Big Data?怎么建一个AWS的real time scoring engine?
是选statistician 还是data warehouse ETL?一个 senior data scientist 的面试题。
Some thoughts on data science and data scientistsData/research scientist, Statistician 公司分档
洛杉矶LA求Data Science/Stat 相关工作内推,有经验面试的时候back propagation algorithm一般会怎么问?
相关话题的讨论汇总
话题: data话题: big话题: ml话题: 一段时间话题: algorithm