由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Military版 - 大数据流行说明科学停滞了
相关主题
俺随便整整都是上亿的数据量乘上汇率和淘宝同品牌一个价
新一轮信息革命已经开始2年了,鳖没跟上农牧渔业产品价格低质量高
听说加拿大现在有个原居民法案,可快速移民扫过一眼机器学习,大数据的学习资料
谈谈低质量的郊区生活 (转载)川普时代,野鸡大学难生存了,挺好的
小孩学钢琴其实大部分都在浪费时间搞屠龙之术老邢纵容低质量机器人疯狂跟帖
重磅机级证据都是由低质量摄像头拍摄的自媒体造成大量低质量知识泛滥
这些AI就是垃圾吹牛的东西美国人开始戴口罩, 低质量口罩就开始畅销了
懂行的将军说是不说到创新,觉得丢脸的该是 PhD 们
相关话题的讨论汇总
话题: 数据话题: 规律话题: 科学话题: 统计话题: 土著人
进入Military版参与讨论
1 (共1页)
T****i
发帖数: 15191
1
话说太平洋上有个小岛,上面住了土著人,与世隔绝上千年,地处偏远,各国都对这个
岛没有兴趣。直到二战时,美国发现这个岛是个非常好的中转站,就去建了个空军基地
。每次飞机来了送给养,也给土著点东西比如午餐肉罐头什么的。后来战争结束了,美
军关了基地离开了。后来,70年代有人去这个岛,发现土著人有个宗教,是在废弃的跑
道两侧点燃两溜火把,然后祭拜,等待天神的到来。
不懂大数据,说下感觉,抛砖引玉,敬请批评。从学术界到商业届,从基因组到客户数
据发掘,大数据已经流行好多年了,有少数一些成功案例,大多数就是产生一些似是而
非的结论。其实大数据非常危险,首先单个数据错误可能性非常大,虽然这对得出统计
数据可能没影响,但对得出精确结论影响很大。更有很多高通量低质量的数据,对统计
结果都有影响,最后可能garbage in garbage out。其次数据量大了,总能形成
pattern,但这不一定是真正的规律或者机制性规律。无论数据量多大,你也不能保证
你采集的数据都有用,还有缺失数据,你压根都没想到的。
我认为还有一个重要问题,就是有多少问题是计算机可以解决的。比如,现代的超级计
算机,就算联网,给它们输入所有产生量子力学之前物理学的实验结果,比如光电效应
,原子光谱等等,它们能不能产生量子力学?如果不能,凭什么就认为大数据能解决复
杂系统如生物的机理性问题?
商业上一些大数据结果的效用也非常可疑。打个比方,比如Amazon买东西,总会被推荐
其他的产品,是其他人买了那个东西后也买或者看过的产品。反正我没碰到过几次推荐
我喜欢的,现在直接略过。当然这是小数据。但就算有一天大数据了,每个人的需求在
某个时刻还是不一样的。每个人的购物习惯也不一样,还有各种偶然性。比如我喜欢先
选好各种商品,比如我自己用的相机镜头,还有国内亲戚让我带的折叠童车,完全无关
,还就这一次,Amazon以后就给我推荐尿不湿了,婴儿玩具了。也许大多数人符合统计
规律,但这最终还是统计意义上的模糊营销。
我觉得大数据流行,正说明科学停滞了,无法发现复杂系统的本质规律。而没有爱因斯
坦,波尔和薛定谔那样的天才,而擅于包装的所谓能人又不喜欢闲着,资本也需要炒作
。所以一拍即合。
z**********e
发帖数: 22064
2
数据库里各种商品都加上了tag,你浏览带有某种tag的商品,数据库就会自动向你推荐
具有相同tag的商品。
如果你多次订购带有某种tag的商品,你的这种倾向在数据库里会被加权。
b********n
发帖数: 38600
3
大数据是 post hoc 方法,就是博观约取,厚积薄发。

【在 T****i 的大作中提到】
: 话说太平洋上有个小岛,上面住了土著人,与世隔绝上千年,地处偏远,各国都对这个
: 岛没有兴趣。直到二战时,美国发现这个岛是个非常好的中转站,就去建了个空军基地
: 。每次飞机来了送给养,也给土著点东西比如午餐肉罐头什么的。后来战争结束了,美
: 军关了基地离开了。后来,70年代有人去这个岛,发现土著人有个宗教,是在废弃的跑
: 道两侧点燃两溜火把,然后祭拜,等待天神的到来。
: 不懂大数据,说下感觉,抛砖引玉,敬请批评。从学术界到商业届,从基因组到客户数
: 据发掘,大数据已经流行好多年了,有少数一些成功案例,大多数就是产生一些似是而
: 非的结论。其实大数据非常危险,首先单个数据错误可能性非常大,虽然这对得出统计
: 数据可能没影响,但对得出精确结论影响很大。更有很多高通量低质量的数据,对统计
: 结果都有影响,最后可能garbage in garbage out。其次数据量大了,总能形成

x****o
发帖数: 29677
4
大数据不是推荐你买什么商品,而是你上网自定义需要的商品材料,性能,质量,参数
,电商迅速提供给你备选,然后找到可以接受价格的厂商接单,再通过3D打印生产给你
z****e
发帖数: 54598
5
这个大就是你用穷举做不了就算大
大数据本身就不是100%精确的东西
没有人能保证你一定能拿到你想要的结果
就像有的故事你不喜欢看一样
但是一部分人喜欢,就足够这个工具能够卖出一个好价钱了

【在 T****i 的大作中提到】
: 话说太平洋上有个小岛,上面住了土著人,与世隔绝上千年,地处偏远,各国都对这个
: 岛没有兴趣。直到二战时,美国发现这个岛是个非常好的中转站,就去建了个空军基地
: 。每次飞机来了送给养,也给土著点东西比如午餐肉罐头什么的。后来战争结束了,美
: 军关了基地离开了。后来,70年代有人去这个岛,发现土著人有个宗教,是在废弃的跑
: 道两侧点燃两溜火把,然后祭拜,等待天神的到来。
: 不懂大数据,说下感觉,抛砖引玉,敬请批评。从学术界到商业届,从基因组到客户数
: 据发掘,大数据已经流行好多年了,有少数一些成功案例,大多数就是产生一些似是而
: 非的结论。其实大数据非常危险,首先单个数据错误可能性非常大,虽然这对得出统计
: 数据可能没影响,但对得出精确结论影响很大。更有很多高通量低质量的数据,对统计
: 结果都有影响,最后可能garbage in garbage out。其次数据量大了,总能形成

r******y
发帖数: 1785
6
还是乜有任何说服力的reference,很多规律根本就用不到大数据
这是一种暴利的联系,不是机制性的

【在 z****e 的大作中提到】
: 这个大就是你用穷举做不了就算大
: 大数据本身就不是100%精确的东西
: 没有人能保证你一定能拿到你想要的结果
: 就像有的故事你不喜欢看一样
: 但是一部分人喜欢,就足够这个工具能够卖出一个好价钱了

T****i
发帖数: 15191
7
我举的Amazon的例子不太恰当。我的意思是统计规律很误导。

【在 z****e 的大作中提到】
: 这个大就是你用穷举做不了就算大
: 大数据本身就不是100%精确的东西
: 没有人能保证你一定能拿到你想要的结果
: 就像有的故事你不喜欢看一样
: 但是一部分人喜欢,就足够这个工具能够卖出一个好价钱了

a***o
发帖数: 3734
8
第一段就是扯淡,
所谓大数据,是说土著发现点火也没有罐头,就不点火了。至于为什么点火也没有罐头
,不了解也没啥关系。

【在 T****i 的大作中提到】
: 话说太平洋上有个小岛,上面住了土著人,与世隔绝上千年,地处偏远,各国都对这个
: 岛没有兴趣。直到二战时,美国发现这个岛是个非常好的中转站,就去建了个空军基地
: 。每次飞机来了送给养,也给土著点东西比如午餐肉罐头什么的。后来战争结束了,美
: 军关了基地离开了。后来,70年代有人去这个岛,发现土著人有个宗教,是在废弃的跑
: 道两侧点燃两溜火把,然后祭拜,等待天神的到来。
: 不懂大数据,说下感觉,抛砖引玉,敬请批评。从学术界到商业届,从基因组到客户数
: 据发掘,大数据已经流行好多年了,有少数一些成功案例,大多数就是产生一些似是而
: 非的结论。其实大数据非常危险,首先单个数据错误可能性非常大,虽然这对得出统计
: 数据可能没影响,但对得出精确结论影响很大。更有很多高通量低质量的数据,对统计
: 结果都有影响,最后可能garbage in garbage out。其次数据量大了,总能形成

u*****p
发帖数: 1110
9
该发现的发现的差不多, 该发明的发明的差不多了。
n*****n
发帖数: 5277
10
总得做点啥吧,在这个搞科学不受待见的年代里
相关主题
重磅机级证据都是由低质量摄像头拍摄的乘上汇率和淘宝同品牌一个价
这些AI就是垃圾吹牛的东西农牧渔业产品价格低质量高
懂行的将军说是不扫过一眼机器学习,大数据的学习资料
进入Military版参与讨论
v*******e
发帖数: 11604
11
很快电子计算机就可以发现量子力学。
z****e
发帖数: 54598
12
如果规律那么明显,那么容易找出来,那就没有big的意义了
就是因为规律不明显,不容易挖掘出来,才需要learning和intelligence
当然也许这个规律永远都发现不了,甚至干脆本身就没有规律
但是对于这种东西的探索是人类进步的一个阶段,现在人类已经到了这个阶段
所以就算前途茫茫,他也得超前走啊

【在 r******y 的大作中提到】
: 还是乜有任何说服力的reference,很多规律根本就用不到大数据
: 这是一种暴利的联系,不是机制性的

k*****r
发帖数: 21039
13
米疣忽悠的伪科学.
w********e
发帖数: 8594
14
大数据要成功,我觉得要在以点上下功夫
1. 观测的变量增加。
2. 观测值的数量增加。
3. 完善对于低质量数据的识别和处理。
4. 自动选择不同模型进行估计,自动进行各种常见的问题的分析(比如
heteroscedasticity, endogeneity),并评选出表现优秀的模型。
如果大数据只是一味地增加样本,没有多大意义。观测的变量要增加。但解释变量增加
了之后,样本就很有必要增加了,要不然会有自由度不够的问题。低质量数据是大数据
的一个大问题,尤其是那是网上得来的调查数据。当然,最后一条我觉得是最最重要的
。要不然弄出有几百上千个变量的数据库,用人不知道要分析到何年何月。
T****t
发帖数: 11162
15
大数据挺好的,就象中医一样,所有的症状一输入,就得出结论了。
我觉得如果数据能采集的再多一些,估计每个人的身体状况都能得到诊断,医生这行估
计失业。
q********n
发帖数: 308
16
你理解错了,科学还是科学,大数据是用来预测类似天气变化这类科学解决不了的问题
的,或者科学需要很长时间,而现实中必须短时间得到一个结论的问题,大数据不在乎
这个问题的根本原因是什么,这是科学的主要目的,大数据在乎的只有预测准不准。

【在 T****i 的大作中提到】
: 话说太平洋上有个小岛,上面住了土著人,与世隔绝上千年,地处偏远,各国都对这个
: 岛没有兴趣。直到二战时,美国发现这个岛是个非常好的中转站,就去建了个空军基地
: 。每次飞机来了送给养,也给土著点东西比如午餐肉罐头什么的。后来战争结束了,美
: 军关了基地离开了。后来,70年代有人去这个岛,发现土著人有个宗教,是在废弃的跑
: 道两侧点燃两溜火把,然后祭拜,等待天神的到来。
: 不懂大数据,说下感觉,抛砖引玉,敬请批评。从学术界到商业届,从基因组到客户数
: 据发掘,大数据已经流行好多年了,有少数一些成功案例,大多数就是产生一些似是而
: 非的结论。其实大数据非常危险,首先单个数据错误可能性非常大,虽然这对得出统计
: 数据可能没影响,但对得出精确结论影响很大。更有很多高通量低质量的数据,对统计
: 结果都有影响,最后可能garbage in garbage out。其次数据量大了,总能形成

j*****p
发帖数: 24000
17
土著人用草扎了个飞机,每天迎着朝阳列队,模仿当年美军的行为
这就是货物崇拜
cargo cult
h********3
发帖数: 2075
18
没错。大数据的分析结果,只要比“猜”更准就行了。哪怕100次推荐只有2-3个准也行
,因为你乱猜,100次推荐里面可能就1个准。实际效果上来看,是提高了2-3倍
的销量,所以价值很客观。

【在 z****e 的大作中提到】
: 这个大就是你用穷举做不了就算大
: 大数据本身就不是100%精确的东西
: 没有人能保证你一定能拿到你想要的结果
: 就像有的故事你不喜欢看一样
: 但是一部分人喜欢,就足够这个工具能够卖出一个好价钱了

h********3
发帖数: 2075
19
没错。machine learning比人工强的地方,在于对于高维的空间。如果你的feature很
多,成百上千,甚至有些上百万的feature,人工是没有办法去分析的。但是,你用
logistic regression或者linear regression,随便用matlab或者R跑一把,马上就可
以得出包含了成百上千甚至几百万的feature的一个预测model。你人工去做,估计眼睛
都看瞎了。

【在 z****e 的大作中提到】
: 如果规律那么明显,那么容易找出来,那就没有big的意义了
: 就是因为规律不明显,不容易挖掘出来,才需要learning和intelligence
: 当然也许这个规律永远都发现不了,甚至干脆本身就没有规律
: 但是对于这种东西的探索是人类进步的一个阶段,现在人类已经到了这个阶段
: 所以就算前途茫茫,他也得超前走啊

N*******e
发帖数: 3872
20
比统计本身更重要的是对统计结果的解释
而这需要知识、逻辑和思想
大数据只是为解决问题提供了一种新的工具或可能性,超越工具才能避免沦为工具的奴隶

【在 T****i 的大作中提到】
: 我举的Amazon的例子不太恰当。我的意思是统计规律很误导。
相关主题
川普时代,野鸡大学难生存了,挺好的美国人开始戴口罩, 低质量口罩就开始畅销了
老邢纵容低质量机器人疯狂跟帖说到创新,觉得丢脸的该是 PhD 们
自媒体造成大量低质量知识泛滥各位历史知识如何?来做题吧
进入Military版参与讨论
s******s
发帖数: 13035
21
不要对立大数据和科学嘛!大数据也是一种科学方法。
想想当年所谓语音识别啥的,无数科学家建立复杂的科学模型都搞不好,
大数据来了,最简单的统计模型加上一万倍的数据量,直接摧枯拉朽解决了。
其实很多复杂问题从原来来建模太复杂了,统计方法配合大数据是个有效简便的方法

【在 T****i 的大作中提到】
: 话说太平洋上有个小岛,上面住了土著人,与世隔绝上千年,地处偏远,各国都对这个
: 岛没有兴趣。直到二战时,美国发现这个岛是个非常好的中转站,就去建了个空军基地
: 。每次飞机来了送给养,也给土著点东西比如午餐肉罐头什么的。后来战争结束了,美
: 军关了基地离开了。后来,70年代有人去这个岛,发现土著人有个宗教,是在废弃的跑
: 道两侧点燃两溜火把,然后祭拜,等待天神的到来。
: 不懂大数据,说下感觉,抛砖引玉,敬请批评。从学术界到商业届,从基因组到客户数
: 据发掘,大数据已经流行好多年了,有少数一些成功案例,大多数就是产生一些似是而
: 非的结论。其实大数据非常危险,首先单个数据错误可能性非常大,虽然这对得出统计
: 数据可能没影响,但对得出精确结论影响很大。更有很多高通量低质量的数据,对统计
: 结果都有影响,最后可能garbage in garbage out。其次数据量大了,总能形成

o******d
发帖数: 743
22
说的很好。这里有个研讨会,就是说这个的:
http://journals.cambridge.org/action/displayAbstract?fromPage=o

【在 T****i 的大作中提到】
: 话说太平洋上有个小岛,上面住了土著人,与世隔绝上千年,地处偏远,各国都对这个
: 岛没有兴趣。直到二战时,美国发现这个岛是个非常好的中转站,就去建了个空军基地
: 。每次飞机来了送给养,也给土著点东西比如午餐肉罐头什么的。后来战争结束了,美
: 军关了基地离开了。后来,70年代有人去这个岛,发现土著人有个宗教,是在废弃的跑
: 道两侧点燃两溜火把,然后祭拜,等待天神的到来。
: 不懂大数据,说下感觉,抛砖引玉,敬请批评。从学术界到商业届,从基因组到客户数
: 据发掘,大数据已经流行好多年了,有少数一些成功案例,大多数就是产生一些似是而
: 非的结论。其实大数据非常危险,首先单个数据错误可能性非常大,虽然这对得出统计
: 数据可能没影响,但对得出精确结论影响很大。更有很多高通量低质量的数据,对统计
: 结果都有影响,最后可能garbage in garbage out。其次数据量大了,总能形成

x******r
发帖数: 3489
23
差的远呢。。。

【在 u*****p 的大作中提到】
: 该发现的发现的差不多, 该发明的发明的差不多了。
L*********4
发帖数: 883
24
正解.
Vapnik当年说过,物理化学那些东西,维数太低,所以才能建立人类能说得清楚的科学模
型.
而真正维数高的东西,只能靠从大数据里学习人类无法简单理解的模型来解决.

【在 s******s 的大作中提到】
: 不要对立大数据和科学嘛!大数据也是一种科学方法。
: 想想当年所谓语音识别啥的,无数科学家建立复杂的科学模型都搞不好,
: 大数据来了,最简单的统计模型加上一万倍的数据量,直接摧枯拉朽解决了。
: 其实很多复杂问题从原来来建模太复杂了,统计方法配合大数据是个有效简便的方法

t***o
发帖数: 4265
25
对,机器终究是人的工具,模型是人建造的。

奴隶

【在 N*******e 的大作中提到】
: 比统计本身更重要的是对统计结果的解释
: 而这需要知识、逻辑和思想
: 大数据只是为解决问题提供了一种新的工具或可能性,超越工具才能避免沦为工具的奴隶

u*****a
发帖数: 9489
26
不怕挨骂,小声说一句:
相信“穷举法万能”的,都是码工
相信“鸟枪法万能”的,都是生物千老
什么大数据,其实本质就是穷举法鸟枪法这种性质的东西。除非是码工千老染上了职业
病的,真的没必要迷信这个。鼓出这玩意的,都是为了商业利益炒作概念而已

【在 T****i 的大作中提到】
: 话说太平洋上有个小岛,上面住了土著人,与世隔绝上千年,地处偏远,各国都对这个
: 岛没有兴趣。直到二战时,美国发现这个岛是个非常好的中转站,就去建了个空军基地
: 。每次飞机来了送给养,也给土著点东西比如午餐肉罐头什么的。后来战争结束了,美
: 军关了基地离开了。后来,70年代有人去这个岛,发现土著人有个宗教,是在废弃的跑
: 道两侧点燃两溜火把,然后祭拜,等待天神的到来。
: 不懂大数据,说下感觉,抛砖引玉,敬请批评。从学术界到商业届,从基因组到客户数
: 据发掘,大数据已经流行好多年了,有少数一些成功案例,大多数就是产生一些似是而
: 非的结论。其实大数据非常危险,首先单个数据错误可能性非常大,虽然这对得出统计
: 数据可能没影响,但对得出精确结论影响很大。更有很多高通量低质量的数据,对统计
: 结果都有影响,最后可能garbage in garbage out。其次数据量大了,总能形成

u*****a
发帖数: 9489
27
看你说土著人长土著人短的,怎么总感觉是在说我呢,呵呵

【在 T****i 的大作中提到】
: 话说太平洋上有个小岛,上面住了土著人,与世隔绝上千年,地处偏远,各国都对这个
: 岛没有兴趣。直到二战时,美国发现这个岛是个非常好的中转站,就去建了个空军基地
: 。每次飞机来了送给养,也给土著点东西比如午餐肉罐头什么的。后来战争结束了,美
: 军关了基地离开了。后来,70年代有人去这个岛,发现土著人有个宗教,是在废弃的跑
: 道两侧点燃两溜火把,然后祭拜,等待天神的到来。
: 不懂大数据,说下感觉,抛砖引玉,敬请批评。从学术界到商业届,从基因组到客户数
: 据发掘,大数据已经流行好多年了,有少数一些成功案例,大多数就是产生一些似是而
: 非的结论。其实大数据非常危险,首先单个数据错误可能性非常大,虽然这对得出统计
: 数据可能没影响,但对得出精确结论影响很大。更有很多高通量低质量的数据,对统计
: 结果都有影响,最后可能garbage in garbage out。其次数据量大了,总能形成

E*******F
发帖数: 2165
28
问题是现在的机器学习只能是把数据map到一些简单的集合
用的方法还是回归,以及在回归基础上的各种变化
总之要做的工作还有很多

【在 L*********4 的大作中提到】
: 正解.
: Vapnik当年说过,物理化学那些东西,维数太低,所以才能建立人类能说得清楚的科学模
: 型.
: 而真正维数高的东西,只能靠从大数据里学习人类无法简单理解的模型来解决.

c********i
发帖数: 638
29
能说说照片来源吗?想指导下更具体的背景故事,这个真是太搞了。

【在 j*****p 的大作中提到】
: 土著人用草扎了个飞机,每天迎着朝阳列队,模仿当年美军的行为
: 这就是货物崇拜
: cargo cult

w***2
发帖数: 78
30
https://www.youtube.com/watch?v=c6dTtPyl-no
https://www.youtube.com/watch?v=SPilWzjNl_Y

【在 c********i 的大作中提到】
: 能说说照片来源吗?想指导下更具体的背景故事,这个真是太搞了。
相关主题
讨论刘晓波的点很奇怪新一轮信息革命已经开始2年了,鳖没跟上
老将(oldguy和oldcap)需要统一口径,以免误伤听说加拿大现在有个原居民法案,可快速移民
俺随便整整都是上亿的数据量谈谈低质量的郊区生活 (转载)
进入Military版参与讨论
a*******9
发帖数: 239
31

奴隶
说得很好。对科学问题,人的思考还是第一位的。虽然对有些本质困难的题目(如:人
类思考机制),“人类一思考,上帝就发笑”,但就像其他ID提到的,人类的科技总是
要向前发展的。借计算机的东风,大数据是一个有力的工具,但不能代替人类思考来发
现规律,不然就会本末倒置。

【在 N*******e 的大作中提到】
: 比统计本身更重要的是对统计结果的解释
: 而这需要知识、逻辑和思想
: 大数据只是为解决问题提供了一种新的工具或可能性,超越工具才能避免沦为工具的奴隶

x*****1
发帖数: 687
32
so what?
科学上没有大进步,小进步也是进步;
也许现在的阶段正是将来大进步的积累阶段;
再说大家都跑很快,你只要比别人快一点点你就赢了。

【在 T****i 的大作中提到】
: 话说太平洋上有个小岛,上面住了土著人,与世隔绝上千年,地处偏远,各国都对这个
: 岛没有兴趣。直到二战时,美国发现这个岛是个非常好的中转站,就去建了个空军基地
: 。每次飞机来了送给养,也给土著点东西比如午餐肉罐头什么的。后来战争结束了,美
: 军关了基地离开了。后来,70年代有人去这个岛,发现土著人有个宗教,是在废弃的跑
: 道两侧点燃两溜火把,然后祭拜,等待天神的到来。
: 不懂大数据,说下感觉,抛砖引玉,敬请批评。从学术界到商业届,从基因组到客户数
: 据发掘,大数据已经流行好多年了,有少数一些成功案例,大多数就是产生一些似是而
: 非的结论。其实大数据非常危险,首先单个数据错误可能性非常大,虽然这对得出统计
: 数据可能没影响,但对得出精确结论影响很大。更有很多高通量低质量的数据,对统计
: 结果都有影响,最后可能garbage in garbage out。其次数据量大了,总能形成

s*****r
发帖数: 1426
33
基因组不是大数据 用R跑俩package也不是
Infra+scalability才是
统计只是做分析 和原来没区别。方法这种东西早就不值钱了。关键在于应用和实现。
应了句老话,隔行如隔山
l*****i
发帖数: 20533
34
这种呢,就是从现象寻找规律。比起真懂自然是差很远,可是比起完全瞎撞还是会好一
点。这属于比较原始的经验式研究,建立唯象模型。中医其实就这么来的。
j**0
发帖数: 55
35
我觉得有误差还是因为数据不够啊,“我自己用的相机镜头”,比方说如果maps能发现
你经常去旅游,google+发现你经常些风景人物拍照就差不多可以预测。“还有国内亲
戚让我带的折叠童”,可以从contact或者google+圈子里查到你的亲友的需求。这当然
建立在大家都用google service的前提,其他商家还有很长距离要走。
我觉得有些方面不错,比如youtube,原先我还需要搜索,现在经常推荐出我感兴趣的。

【在 T****i 的大作中提到】
: 话说太平洋上有个小岛,上面住了土著人,与世隔绝上千年,地处偏远,各国都对这个
: 岛没有兴趣。直到二战时,美国发现这个岛是个非常好的中转站,就去建了个空军基地
: 。每次飞机来了送给养,也给土著点东西比如午餐肉罐头什么的。后来战争结束了,美
: 军关了基地离开了。后来,70年代有人去这个岛,发现土著人有个宗教,是在废弃的跑
: 道两侧点燃两溜火把,然后祭拜,等待天神的到来。
: 不懂大数据,说下感觉,抛砖引玉,敬请批评。从学术界到商业届,从基因组到客户数
: 据发掘,大数据已经流行好多年了,有少数一些成功案例,大多数就是产生一些似是而
: 非的结论。其实大数据非常危险,首先单个数据错误可能性非常大,虽然这对得出统计
: 数据可能没影响,但对得出精确结论影响很大。更有很多高通量低质量的数据,对统计
: 结果都有影响,最后可能garbage in garbage out。其次数据量大了,总能形成

b******7
发帖数: 123
36
大数据就是废物回收利用, 以前一直担心互联网引起数据爆炸, 海量垃圾数据存没地方
存, 毁了又不敢。现在总算有个方法废物回收了, 多少能挤出一点东西来。好像是管点
用就可以了。忽悠的好的好像用处巨大。
像这种类似环保的项目不是都挺吃香的吗?
b******7
发帖数: 123
37
说得对, 中医应该用大数据。

【在 l*****i 的大作中提到】
: 这种呢,就是从现象寻找规律。比起真懂自然是差很远,可是比起完全瞎撞还是会好一
: 点。这属于比较原始的经验式研究,建立唯象模型。中医其实就这么来的。

m*****g
发帖数: 691
38
年年有新玩意儿,生产运行成本年年猛长。
现在很多新"发明",根本不是提高生产率,确实商业运作成分太大。

【在 u*****a 的大作中提到】
: 不怕挨骂,小声说一句:
: 相信“穷举法万能”的,都是码工
: 相信“鸟枪法万能”的,都是生物千老
: 什么大数据,其实本质就是穷举法鸟枪法这种性质的东西。除非是码工千老染上了职业
: 病的,真的没必要迷信这个。鼓出这玩意的,都是为了商业利益炒作概念而已

1 (共1页)
进入Military版参与讨论
相关主题
说到创新,觉得丢脸的该是 PhD 们小孩学钢琴其实大部分都在浪费时间搞屠龙之术
各位历史知识如何?来做题吧重磅机级证据都是由低质量摄像头拍摄的
讨论刘晓波的点很奇怪这些AI就是垃圾吹牛的东西
老将(oldguy和oldcap)需要统一口径,以免误伤懂行的将军说是不
俺随便整整都是上亿的数据量乘上汇率和淘宝同品牌一个价
新一轮信息革命已经开始2年了,鳖没跟上农牧渔业产品价格低质量高
听说加拿大现在有个原居民法案,可快速移民扫过一眼机器学习,大数据的学习资料
谈谈低质量的郊区生活 (转载)川普时代,野鸡大学难生存了,挺好的
相关话题的讨论汇总
话题: 数据话题: 规律话题: 科学话题: 统计话题: 土著人