由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - Regression也属于ML?
相关主题
有没有做sentiment analysis的,求思路 (转载)Bioinformatics Position in a Genomics Center in a University in the Southern California
[Road map] From ClickStream to ConsumerInsightSE/Data scientist找工作总结[F/G/L/T/D/P/U…] (转载)
欢迎加入“机器学习实践” 俱乐部建模过程中对于outlier的处理问题
说说浅学ML的感受谁能推荐几本DS的书?
[Data Science Project Case] Generate Categories for Product新手学python, 有个简单数据结构问题,在线急等
[Data Science Project Case] Topic Learning求问一道关于NLP的面试题
Bioinformatics Position in a Genomics Center in a University in the Southern California如何evaluate an unsupervised learning method?
Bioinformatics Position in a Genomics Center in a University in the Southern California有没有大牛来classifiy一下 PCA用法吗?
相关话题的讨论汇总
话题: regression话题: nn话题: ml话题: deep话题: 统计
进入DataSciences版参与讨论
1 (共1页)
s******g
发帖数: 466
1
Regression也属于ML?
d******e
发帖数: 7844
2
过去认为predictive modelling都属于ML的范畴。
现在ML和Statistics非常Tricky,比如经典的Linear Regression和Logistic
Regression既是统计又是ML。但如果你用Deep Neural Network来build一个regression
model,统计的人八成是不会认这东西是统计,而ML的人会津津乐道地跟你说这就是ML
当下最火热的Deep Learning。

【在 s******g 的大作中提到】
: Regression也属于ML?
o****p
发帖数: 162
3
嗯。Deep Learning其实就是一些比较实用的建模方法,加上NN。本质就是一、二十年
前早就有的NN,记得N多年前和做NN一位师兄聊,他说,NN不知道啥时候才能在工业界
用上呢,现在给炒成这样,多少有点讽刺。从客观的学术上来评价,DL和十年前就有的
NN技术没多大差别,不过现在这些大公司一推一炒,就成热门了,嘿嘿,确实搞笑。这
个就和python成热门(主要google推的)一个道理;其实,好的语言一大堆,python没
那么特别。
不过NN和统计思想的联系,要从理论物理里统计(热)力学的角度来看。。。

regression
ML

【在 d******e 的大作中提到】
: 过去认为predictive modelling都属于ML的范畴。
: 现在ML和Statistics非常Tricky,比如经典的Linear Regression和Logistic
: Regression既是统计又是ML。但如果你用Deep Neural Network来build一个regression
: model,统计的人八成是不会认这东西是统计,而ML的人会津津乐道地跟你说这就是ML
: 当下最火热的Deep Learning。

o****p
发帖数: 162
4
哦,我还忘了,从最一般的MLS回归理论来说,NN就是建了一个条件期望估算子模型,
这个显然是统计的基本内容。统计行当里,SAS里众多的NN工具都几十年了。

但如果你用Deep Neural Network来build一个regression

【在 d******e 的大作中提到】
: 过去认为predictive modelling都属于ML的范畴。
: 现在ML和Statistics非常Tricky,比如经典的Linear Regression和Logistic
: Regression既是统计又是ML。但如果你用Deep Neural Network来build一个regression
: model,统计的人八成是不会认这东西是统计,而ML的人会津津乐道地跟你说这就是ML
: 当下最火热的Deep Learning。

g*****o
发帖数: 812
5
用NN来求regression的结果, 确实很蛋疼啊

regression
ML

【在 d******e 的大作中提到】
: 过去认为predictive modelling都属于ML的范畴。
: 现在ML和Statistics非常Tricky,比如经典的Linear Regression和Logistic
: Regression既是统计又是ML。但如果你用Deep Neural Network来build一个regression
: model,统计的人八成是不会认这东西是统计,而ML的人会津津乐道地跟你说这就是ML
: 当下最火热的Deep Learning。

T*****u
发帖数: 7103
6
街边上的包子铺和庆丰还是不一样 吧,虽然都是做包子的。

【在 o****p 的大作中提到】
: 嗯。Deep Learning其实就是一些比较实用的建模方法,加上NN。本质就是一、二十年
: 前早就有的NN,记得N多年前和做NN一位师兄聊,他说,NN不知道啥时候才能在工业界
: 用上呢,现在给炒成这样,多少有点讽刺。从客观的学术上来评价,DL和十年前就有的
: NN技术没多大差别,不过现在这些大公司一推一炒,就成热门了,嘿嘿,确实搞笑。这
: 个就和python成热门(主要google推的)一个道理;其实,好的语言一大堆,python没
: 那么特别。
: 不过NN和统计思想的联系,要从理论物理里统计(热)力学的角度来看。。。
:
: regression
: ML

d*****n
发帖数: 754
7
说明你还不懂DL

【在 o****p 的大作中提到】
: 嗯。Deep Learning其实就是一些比较实用的建模方法,加上NN。本质就是一、二十年
: 前早就有的NN,记得N多年前和做NN一位师兄聊,他说,NN不知道啥时候才能在工业界
: 用上呢,现在给炒成这样,多少有点讽刺。从客观的学术上来评价,DL和十年前就有的
: NN技术没多大差别,不过现在这些大公司一推一炒,就成热门了,嘿嘿,确实搞笑。这
: 个就和python成热门(主要google推的)一个道理;其实,好的语言一大堆,python没
: 那么特别。
: 不过NN和统计思想的联系,要从理论物理里统计(热)力学的角度来看。。。
:
: regression
: ML

d******e
发帖数: 7844
8
没啥蛋疼的,nonparametric regression用NN来做很正常。

【在 g*****o 的大作中提到】
: 用NN来求regression的结果, 确实很蛋疼啊
:
: regression
: ML

d******e
发帖数: 7844
9
你就是想说那两篇文章吧
一篇新的,被热炒的An exact mapping between the Variational Renormalization
Group and Deep Learning 2014
还有一篇老的,Unsupervised Deep Learning implements the Kadanoff Real Space
Variational Renormalization Group 1975
你说的太悬了,看这两篇也不用懂多少statistical physics,知道一点就够了。

【在 o****p 的大作中提到】
: 嗯。Deep Learning其实就是一些比较实用的建模方法,加上NN。本质就是一、二十年
: 前早就有的NN,记得N多年前和做NN一位师兄聊,他说,NN不知道啥时候才能在工业界
: 用上呢,现在给炒成这样,多少有点讽刺。从客观的学术上来评价,DL和十年前就有的
: NN技术没多大差别,不过现在这些大公司一推一炒,就成热门了,嘿嘿,确实搞笑。这
: 个就和python成热门(主要google推的)一个道理;其实,好的语言一大堆,python没
: 那么特别。
: 不过NN和统计思想的联系,要从理论物理里统计(热)力学的角度来看。。。
:
: regression
: ML

o****p
发帖数: 162
10
如果你关心哪个有名气,当然是庆丰。如果你关心哪个真正好吃或者和你胃口,其实街
边上的包子铺、还是庆丰就无差别了。我更关心解决实际问题和好用。就像大数据分析
这个新名词,就是一business buzz,不过是业内人士搞了几十年的机器学习,加各种
统计技术。好像在“大数据分析”之前,就没人在认真做网站和各类商用数据的统计机
器学习似的,我1998年在的那家公司,就已经做这类商用开发了。现在一炒作,一大堆
人临时学几个算法,赶时髦来做,嘿嘿。。。
这种现象就和十年前金融工程、quant开始热的效果一样。没过几年,这帮人中一大部
分被淘汰,开始被另外一个新名词“技术”牵着鼻子去凑热闹了而已。人要有自己的主
见和热爱的东西,做得才有意思,才有前途。话虽然老套,但是大实话,供真正喜欢机
器学习的人参考。

【在 T*****u 的大作中提到】
: 街边上的包子铺和庆丰还是不一样 吧,虽然都是做包子的。
相关主题
[Data Science Project Case] Topic LearningBioinformatics Position in a Genomics Center in a University in the Southern California
Bioinformatics Position in a Genomics Center in a University in the Southern CaliforniaSE/Data scientist找工作总结[F/G/L/T/D/P/U…] (转载)
Bioinformatics Position in a Genomics Center in a University in the Southern California建模过程中对于outlier的处理问题
进入DataSciences版参与讨论
o****p
发帖数: 162
11
多谢你的文献乐。我并不知道这两篇文章,我不过是从统计和机器学习一般教科书的观
点来说NN。我就是简单评论下你说的“搞统计的不把NN看作regression”。我以前的一
个小头就是统计博士,对NN regression很了解。不过你说的对,搞机器学习,懂更多
SP对于理论上的深入理解当然最好,但从实际工程和应用的角度,其实知道一点就够了。
另外关于DL的观点,我对DL看法就是,DL没那么悬,只是在几十年都存在的NN技术上,
加进乐一些特定的思想,比如convolutional NN就是一个关键技术,最早应用在特定的
机器视觉、图像、视频学习分析问题上的。其中关键的思想就是分层次地做特征学习和
抽取,最后达到更抽象的特征编码。这种思想并不是DL特有的特征,这个思想基本在任
何实际大型的机器学习系统开发中,都是一个基本的设计原则。所以我说,DL没那么玄
乎,其核心技术NN本质上,也就是一个条件期望估算子的回归算法而已。

Space

【在 d******e 的大作中提到】
: 你就是想说那两篇文章吧
: 一篇新的,被热炒的An exact mapping between the Variational Renormalization
: Group and Deep Learning 2014
: 还有一篇老的,Unsupervised Deep Learning implements the Kadanoff Real Space
: Variational Renormalization Group 1975
: 你说的太悬了,看这两篇也不用懂多少statistical physics,知道一点就够了。

o****p
发帖数: 162
12
嗯,是这样,不过作为黑盒子技术,容易被人滥用乐,学术界就是被滥用来灌水。

【在 d******e 的大作中提到】
: 没啥蛋疼的,nonparametric regression用NN来做很正常。
g*****o
发帖数: 812
13
都用nn了,直接上就行了嘛,准确率还高点。regression不是脱裤子放屁么。

【在 o****p 的大作中提到】
: 嗯,是这样,不过作为黑盒子技术,容易被人滥用乐,学术界就是被滥用来灌水。
d******e
发帖数: 7844
14
你误解regresion的含义了吧。
Regression就是分析response和predictor之间的关系。
NN不过是a class of nonparametric functions罢了,拿来做regression analysis很
正常。

【在 g*****o 的大作中提到】
: 都用nn了,直接上就行了嘛,准确率还高点。regression不是脱裤子放屁么。
o****p
发帖数: 162
15
虽然我很理解你抱怨,在绝大多数实际应用得项目里,NN做regression很令人蛋疼:)
,至少在我的经验里,也的确如此。不过,就像现在业界把Deep NN炒的过分热(只谈
pros,不谈cons,也就是我说的滥用),你这样完全否定NN的观点,也是不客观滴。还
是老套的话,我重复下:任何一项技术手段都是即有pros,也有cons的,没有哪个绝对
优于其他的。以我的经验,在那么某一“小类”的实际问题,用(非线性)NN来拟合是
很有优势的。
你自己客观回答下,真的“直接上”就肯定那么方便吗?我假设你说的“直接上”就是
直接估计整个的分布函数。另外,有什么根据来一般性地断言,“准确率还高点”?也
许在你做过的一些问题里,这么做是准确率高点,但没有任何客观或者理论支持的理由
,做这种一般性的断言。是吧?

【在 g*****o 的大作中提到】
: 都用nn了,直接上就行了嘛,准确率还高点。regression不是脱裤子放屁么。
T*****u
发帖数: 7103
16
我做大数据培训的,主要关心学校的10000多学生中午吃包子从数量到质量上到时
间上都有保障,不然吃不到包子的学生下午肚子饿就不来上学了。

【在 o****p 的大作中提到】
: 如果你关心哪个有名气,当然是庆丰。如果你关心哪个真正好吃或者和你胃口,其实街
: 边上的包子铺、还是庆丰就无差别了。我更关心解决实际问题和好用。就像大数据分析
: 这个新名词,就是一business buzz,不过是业内人士搞了几十年的机器学习,加各种
: 统计技术。好像在“大数据分析”之前,就没人在认真做网站和各类商用数据的统计机
: 器学习似的,我1998年在的那家公司,就已经做这类商用开发了。现在一炒作,一大堆
: 人临时学几个算法,赶时髦来做,嘿嘿。。。
: 这种现象就和十年前金融工程、quant开始热的效果一样。没过几年,这帮人中一大部
: 分被淘汰,开始被另外一个新名词“技术”牵着鼻子去凑热闹了而已。人要有自己的主
: 见和热爱的东西,做得才有意思,才有前途。话虽然老套,但是大实话,供真正喜欢机
: 器学习的人参考。

O*********y
发帖数: 923
17

问一下牛人,ml里面是不是create new feature是非常重要的?而这个新的feature是
基于一些背景知识的content的基础上生成的?thanks

【在 T*****u 的大作中提到】
: 我做大数据培训的,主要关心学校的10000多学生中午吃包子从数量到质量上到时
: 间上都有保障,不然吃不到包子的学生下午肚子饿就不来上学了。

1 (共1页)
进入DataSciences版参与讨论
相关主题
有没有大牛来classifiy一下 PCA用法吗?[Data Science Project Case] Generate Categories for Product
One phone interview question.[Data Science Project Case] Topic Learning
请各位前辈推荐Bioinformatics Position in a Genomics Center in a University in the Southern California
Customer Journey Analytics的一般方法跟modelsBioinformatics Position in a Genomics Center in a University in the Southern California
有没有做sentiment analysis的,求思路 (转载)Bioinformatics Position in a Genomics Center in a University in the Southern California
[Road map] From ClickStream to ConsumerInsightSE/Data scientist找工作总结[F/G/L/T/D/P/U…] (转载)
欢迎加入“机器学习实践” 俱乐部建模过程中对于outlier的处理问题
说说浅学ML的感受谁能推荐几本DS的书?
相关话题的讨论汇总
话题: regression话题: nn话题: ml话题: deep话题: 统计