由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 答水泡泡:陈立功是谁教出来的?
相关主题
数学家们在统计学领域犯下了几个严重的错误临界回归模型的连续性
Re: 关于肖手术的最新review (转载)陈大师不是民科
Great Confucius网上哪位比较熟悉分段回归的,能否简单介绍一下其基本的方法论?
陈来错地方了统计学的新地平线——陈立功与他的自权重曲线
陈大师, 我很好奇如果你不是孬种数学背景的统计学家,请接受挑战
居然还有人试图和陈大师讨论统计问题陈大师的两大硬伤和两大法宝
也从工程的角度给陈老师提个意见吧.陈大师居然在维基百科上大放厥词
好奇问陈老师一个问题那些挺陈大师的
相关话题的讨论汇总
话题: 统计学话题: 统计话题: 数学话题: 模型话题: validation
进入Statistics版参与讨论
1 (共1页)
T*******I
发帖数: 5138
1
水泡泡很轻视地问我是谁教出来的。让我告诉你以及这里所有的人。
我的老师有很多。本科时教我统计学的老师有好几个,他们是同济医科大学原卫生
统计教研室的老师们。他们全都毕业于老同济医学院(也就是后来的武汉医学院、同济
医科大学)的卫生系。我认为他们对统计学的理解绝对不比任何一个美国大学的统计学
教授差!其中的余松林教授成为了我后来读硕士时的导师。余在国内的前辈中是很有名
望的。但是,所有这些人只教了我最基本的东西,但对于我初入统计学却极其重要。令
我感到荣幸的是,我最终也成了其中的一员,并在那里服务了大约11年。
我在统计学领域的其他老师,应该是佩第、凯特勒、高尔顿、皮尔逊以及戈塞特和
费舍尔等(这仅是我自己妄称的,没人会承认),这些人是统计学史上的顶级人物。
我的另外的老师就完全不是搞统计的。一个是彭本智、一个是袁建国、另外就是罗
素以及他所尊崇的同僚们。这些人都是人类史上的顶级人物(注明一下,这个群体里没
有中国人)。
还有就是贝多芬和其同僚们。这些人个个都是超人(注明一下,这个同僚群体里也
没有中国人)。他们享受到了上帝的恩典,说的是上帝的语言。人间仅
w*****n
发帖数: 375
2
I服了You. 大家洗洗睡吧。
g********r
发帖数: 8017
3
这是准备好的诺贝尔得奖感言?
D******n
发帖数: 2836
4
有时候我觉得,就算物质灭了,陈老师的精神也不会湮灭。
b*****o
发帖数: 482
5
读了沉老师的经历, 我想问一下: 陈老师, 咱不说统计了, 你会求导和积分吗?
原谅我粗俗的怀疑.
h***i
发帖数: 3844
6
这个他应该会吧。这是高中的啊。

【在 b*****o 的大作中提到】
: 读了沉老师的经历, 我想问一下: 陈老师, 咱不说统计了, 你会求导和积分吗?
: 原谅我粗俗的怀疑.

d*******e
发帖数: 1649
7
这就像听祥林嫂讲阿毛的故事,一遍又一遍。我其实挺同情他的。

【在 w*****n 的大作中提到】
: I服了You. 大家洗洗睡吧。
h***i
发帖数: 3844
8
见过数学爱好者,拿了一大堆纸,很执着,统计这还是头一遭见到。

【在 d*******e 的大作中提到】
: 这就像听祥林嫂讲阿毛的故事,一遍又一遍。我其实挺同情他的。
p********a
发帖数: 5352
9
这说明--
1.陈老师很在乎我们对他的看法,所以码了这么多字说服我们
2.陈老师很闲,一点都不象做RESEARCH的忙人
ANYWAY,执着也是好事,看用在哪里了
g********r
发帖数: 8017
10
我们都被陈老师利用了。不出多久,陈老师的履历里就会多一条“陈老师的新方法在统
计论坛引起前所未有的轰动和追捧,讨论长达数十页”,或者“陈老师舌战群儒,数百
统计博士都不能驳倒他的新方法”。

【在 p********a 的大作中提到】
: 这说明--
: 1.陈老师很在乎我们对他的看法,所以码了这么多字说服我们
: 2.陈老师很闲,一点都不象做RESEARCH的忙人
: ANYWAY,执着也是好事,看用在哪里了

相关主题
居然还有人试图和陈大师讨论统计问题临界回归模型的连续性
也从工程的角度给陈老师提个意见吧.陈大师不是民科
好奇问陈老师一个问题网上哪位比较熟悉分段回归的,能否简单介绍一下其基本的方法论?
进入Statistics版参与讨论
o****o
发帖数: 8077
11
you got it, man

【在 g********r 的大作中提到】
: 我们都被陈老师利用了。不出多久,陈老师的履历里就会多一条“陈老师的新方法在统
: 计论坛引起前所未有的轰动和追捧,讨论长达数十页”,或者“陈老师舌战群儒,数百
: 统计博士都不能驳倒他的新方法”。

s*r
发帖数: 2757
12
我有两个老师,一个是孔子 另一个是老子

【在 T*******I 的大作中提到】
: 水泡泡很轻视地问我是谁教出来的。让我告诉你以及这里所有的人。
: 我的老师有很多。本科时教我统计学的老师有好几个,他们是同济医科大学原卫生
: 统计教研室的老师们。他们全都毕业于老同济医学院(也就是后来的武汉医学院、同济
: 医科大学)的卫生系。我认为他们对统计学的理解绝对不比任何一个美国大学的统计学
: 教授差!其中的余松林教授成为了我后来读硕士时的导师。余在国内的前辈中是很有名
: 望的。但是,所有这些人只教了我最基本的东西,但对于我初入统计学却极其重要。令
: 我感到荣幸的是,我最终也成了其中的一员,并在那里服务了大约11年。
: 我在统计学领域的其他老师,应该是佩第、凯特勒、高尔顿、皮尔逊以及戈塞特和
: 费舍尔等(这仅是我自己妄称的,没人会承认),这些人是统计学史上的顶级人物。
: 我的另外的老师就完全不是搞统计的。一个是彭本智、一个是袁建国、另外就是罗

P****D
发帖数: 11146
13
师兄(师姐?)你好。

【在 s*r 的大作中提到】
: 我有两个老师,一个是孔子 另一个是老子
w*****e
发帖数: 806
14
re~~~

【在 g********r 的大作中提到】
: 我们都被陈老师利用了。不出多久,陈老师的履历里就会多一条“陈老师的新方法在统
: 计论坛引起前所未有的轰动和追捧,讨论长达数十页”,或者“陈老师舌战群儒,数百
: 统计博士都不能驳倒他的新方法”。

A*******s
发帖数: 3942
15
据说以前某p大学生在简历里写道
在中国最大的科研论坛上发表文章千余篇

【在 g********r 的大作中提到】
: 我们都被陈老师利用了。不出多久,陈老师的履历里就会多一条“陈老师的新方法在统
: 计论坛引起前所未有的轰动和追捧,讨论长达数十页”,或者“陈老师舌战群儒,数百
: 统计博士都不能驳倒他的新方法”。

A*******s
发帖数: 3942
16
他好像说过他高中数学不及格?

【在 h***i 的大作中提到】
: 这个他应该会吧。这是高中的啊。
P****D
发帖数: 11146
17
对p大如此仇视,你是t大的?

【在 A*******s 的大作中提到】
: 据说以前某p大学生在简历里写道
: 在中国最大的科研论坛上发表文章千余篇

A*******s
发帖数: 3942
18
这真的是我在水木joke板看到得
不过估计在未名joke板就改成t大得了

【在 P****D 的大作中提到】
: 对p大如此仇视,你是t大的?
T*******I
发帖数: 5138
19
说句大实话。我虽然初中分班考试时数学仅得了4分,但语文却得了99分。由于数学成
绩太低了,所以,被分在了全年级5个班中的中班,前面两个是快班,后面两个是慢班
。然而,分班考试的分数之所以如此低,是因为那年暑假在我大姐那里读了整整一个暑
假的小说。然而,一个学期后参加数学竞赛,我竟然得了第一名。中班的!
然而,遗憾的是,整个初中我没有学过几何学中的圆,尽管初中毕业时我以全年级第三
名的成绩考上了县重点班,且平时单元考试中数学成绩一直很高(常常满分,也有例外
),但由于几何学的缺陷,导致高考时与圆有关的大小题丢分面积很大。
大学里学了一点微积分,读研究生时又学了一遍。说实话,那没什么高深的,只要不涉
及圆,我都不会害怕。
不过,我想告诉大家的是,我真真厉害的是哲学思维。我考研究生时没有花一秒钟的时
间复习那些内容,得分85,而录取分数线仅45分。
我考过清华大学的行政管理第二学位班,在200多名考生中列第一名。考试科目有英语
、哲学、国际国内时事政治、历史、地理以及两篇写作:议论文和叙述文。其它就不说
了,作文得分89分,最高。哲学和政治没有花1秒钟复习,得分76,但也许是74或78,


【在 h***i 的大作中提到】
: 这个他应该会吧。这是高中的啊。
A*******s
发帖数: 3942
20
非常真实的励志故事
微积分里面有啥圆得应用么?极坐标?
清华行政管理第二学位是继续教育学院的么?

【在 T*******I 的大作中提到】
: 说句大实话。我虽然初中分班考试时数学仅得了4分,但语文却得了99分。由于数学成
: 绩太低了,所以,被分在了全年级5个班中的中班,前面两个是快班,后面两个是慢班
: 。然而,分班考试的分数之所以如此低,是因为那年暑假在我大姐那里读了整整一个暑
: 假的小说。然而,一个学期后参加数学竞赛,我竟然得了第一名。中班的!
: 然而,遗憾的是,整个初中我没有学过几何学中的圆,尽管初中毕业时我以全年级第三
: 名的成绩考上了县重点班,且平时单元考试中数学成绩一直很高(常常满分,也有例外
: ),但由于几何学的缺陷,导致高考时与圆有关的大小题丢分面积很大。
: 大学里学了一点微积分,读研究生时又学了一遍。说实话,那没什么高深的,只要不涉
: 及圆,我都不会害怕。
: 不过,我想告诉大家的是,我真真厉害的是哲学思维。我考研究生时没有花一秒钟的时

相关主题
统计学的新地平线——陈立功与他的自权重曲线陈大师居然在维基百科上大放厥词
如果你不是孬种数学背景的统计学家,请接受挑战那些挺陈大师的
陈大师的两大硬伤和两大法宝let's settle this once and for all
进入Statistics版参与讨论
h***i
发帖数: 3844
21
你啊,建议你自己回去读几本书再来讨论,看你这架势,估计是没时间读书有时间讨论
了。

【在 T*******I 的大作中提到】
: 说句大实话。我虽然初中分班考试时数学仅得了4分,但语文却得了99分。由于数学成
: 绩太低了,所以,被分在了全年级5个班中的中班,前面两个是快班,后面两个是慢班
: 。然而,分班考试的分数之所以如此低,是因为那年暑假在我大姐那里读了整整一个暑
: 假的小说。然而,一个学期后参加数学竞赛,我竟然得了第一名。中班的!
: 然而,遗憾的是,整个初中我没有学过几何学中的圆,尽管初中毕业时我以全年级第三
: 名的成绩考上了县重点班,且平时单元考试中数学成绩一直很高(常常满分,也有例外
: ),但由于几何学的缺陷,导致高考时与圆有关的大小题丢分面积很大。
: 大学里学了一点微积分,读研究生时又学了一遍。说实话,那没什么高深的,只要不涉
: 及圆,我都不会害怕。
: 不过,我想告诉大家的是,我真真厉害的是哲学思维。我考研究生时没有花一秒钟的时

A*******s
发帖数: 3942
22
陈老师有高屋建瓴的哲学做指导,完全不用纠缠于具体统计理论的细枝末节。

【在 h***i 的大作中提到】
: 你啊,建议你自己回去读几本书再来讨论,看你这架势,估计是没时间读书有时间讨论
: 了。

f***a
发帖数: 329
23
打酱油路过,陈老师早生几百年说不定就牛了。。。
s********p
发帖数: 637
24
陈老师a陈老师

【在 f***a 的大作中提到】
: 打酱油路过,陈老师早生几百年说不定就牛了。。。
d*******e
发帖数: 1649
25
你对这些分数什么的记得很清楚,我很佩服。
不过这个世界上,光凭考试分数衡量一个人那是在十七八岁以前。而且分数高未必说明
了解这门知识。
喜欢哲学是好事,但是沉迷进去了容易颠狂,希望能把持得住。

【在 T*******I 的大作中提到】
: 说句大实话。我虽然初中分班考试时数学仅得了4分,但语文却得了99分。由于数学成
: 绩太低了,所以,被分在了全年级5个班中的中班,前面两个是快班,后面两个是慢班
: 。然而,分班考试的分数之所以如此低,是因为那年暑假在我大姐那里读了整整一个暑
: 假的小说。然而,一个学期后参加数学竞赛,我竟然得了第一名。中班的!
: 然而,遗憾的是,整个初中我没有学过几何学中的圆,尽管初中毕业时我以全年级第三
: 名的成绩考上了县重点班,且平时单元考试中数学成绩一直很高(常常满分,也有例外
: ),但由于几何学的缺陷,导致高考时与圆有关的大小题丢分面积很大。
: 大学里学了一点微积分,读研究生时又学了一遍。说实话,那没什么高深的,只要不涉
: 及圆,我都不会害怕。
: 不过,我想告诉大家的是,我真真厉害的是哲学思维。我考研究生时没有花一秒钟的时

T*******I
发帖数: 5138
26
不是说喜欢哲学是好事。搞统计的必须学哲学,因为统计本身就是哲学的一个分支,而
非像你们所学的说它是一门数学的分支,或一门独特的数学。它是数学化的认识论,而
非认识论化的数学。
我这样说你们可能不同意,但终有一天我将证明给你们看:这是不可辩驳的事实!
可以这样说,一个数学头脑若没有哲学来武装,它很可能在统计学领域犯错误;而一个
哲学头脑若没有数学来武装,那么它在这个领域将一事无成(It can do nothing!)。
以Spline为例,它试图在全空间建立一个smoothy的model,要计算knots,然后根据前提
假设:连续空间里的模型间是连续的,来做smoothy处理。这个假设看起来很符合数学理
性,但事实上这个假设根本不成立!为什么?从统计学的随机测量角度看,如果临界点
在总体空间里存在,或总体空间里的回归关系具有可变性,则抽样时,临界点就是随机
事件,临界模型间是否连续有一个连接变异,而这个连接变异的大小是完全随机化的从
而不可假设。只能通过样本估计来推断,也就是连续性检验。从而,我们就可以知道
Spline的前提错了,因为那个前提不可假设,必须抛弃!从而方法论也就必须被重

【在 d*******e 的大作中提到】
: 你对这些分数什么的记得很清楚,我很佩服。
: 不过这个世界上,光凭考试分数衡量一个人那是在十七八岁以前。而且分数高未必说明
: 了解这门知识。
: 喜欢哲学是好事,但是沉迷进去了容易颠狂,希望能把持得住。

b*****o
发帖数: 482
27
学好哲学当然好. 但是有些人披着哲学的外衣来装13就不好了. 我理解得对不对, 陈老师

【在 T*******I 的大作中提到】
: 不是说喜欢哲学是好事。搞统计的必须学哲学,因为统计本身就是哲学的一个分支,而
: 非像你们所学的说它是一门数学的分支,或一门独特的数学。它是数学化的认识论,而
: 非认识论化的数学。
: 我这样说你们可能不同意,但终有一天我将证明给你们看:这是不可辩驳的事实!
: 可以这样说,一个数学头脑若没有哲学来武装,它很可能在统计学领域犯错误;而一个
: 哲学头脑若没有数学来武装,那么它在这个领域将一事无成(It can do nothing!)。
: 以Spline为例,它试图在全空间建立一个smoothy的model,要计算knots,然后根据前提
: 假设:连续空间里的模型间是连续的,来做smoothy处理。这个假设看起来很符合数学理
: 性,但事实上这个假设根本不成立!为什么?从统计学的随机测量角度看,如果临界点
: 在总体空间里存在,或总体空间里的回归关系具有可变性,则抽样时,临界点就是随机

T*******I
发帖数: 5138
28
无论一个人试图说什么或说了什么,我们必须认真听,认真思考。

老师

【在 b*****o 的大作中提到】
: 学好哲学当然好. 但是有些人披着哲学的外衣来装13就不好了. 我理解得对不对, 陈老师
b*****o
发帖数: 482
29
我是试着听来着. 但是装13的话实在听不懂. 你觉得呢

【在 T*******I 的大作中提到】
: 无论一个人试图说什么或说了什么,我们必须认真听,认真思考。
:
: 老师

T*******I
发帖数: 5138
30
那好,请说明白点。我怎样装13了?在哪里装的?让我在外界帮助下有个自省的机会。
请不要只有命题没有论证,这不是数学的风格!
先谢了!

【在 b*****o 的大作中提到】
: 我是试着听来着. 但是装13的话实在听不懂. 你觉得呢
相关主题
一个统计学的问题,请大家指教Re: 关于肖手术的最新review (转载)
多谢版主解封,并请教“什么是统计学?”Great Confucius
数学家们在统计学领域犯下了几个严重的错误陈来错地方了
进入Statistics版参与讨论
s*r
发帖数: 2757
31
师妹 (师弟?) 你好。摸一摸

【在 P****D 的大作中提到】
: 师兄(师姐?)你好。
f***a
发帖数: 329
32
太毛了。。。。

【在 s*r 的大作中提到】
: 师妹 (师弟?) 你好。摸一摸
s********p
发帖数: 637
33
虽然俺样条懂不多,可也看不下去了
样条函数在很多领域应用广泛,比如飞机制造,感不成陈大师因为样条有问题,连飞机
都不坐?
很好奇是谁在雇佣你?

前提
学理

【在 T*******I 的大作中提到】
: 不是说喜欢哲学是好事。搞统计的必须学哲学,因为统计本身就是哲学的一个分支,而
: 非像你们所学的说它是一门数学的分支,或一门独特的数学。它是数学化的认识论,而
: 非认识论化的数学。
: 我这样说你们可能不同意,但终有一天我将证明给你们看:这是不可辩驳的事实!
: 可以这样说,一个数学头脑若没有哲学来武装,它很可能在统计学领域犯错误;而一个
: 哲学头脑若没有数学来武装,那么它在这个领域将一事无成(It can do nothing!)。
: 以Spline为例,它试图在全空间建立一个smoothy的model,要计算knots,然后根据前提
: 假设:连续空间里的模型间是连续的,来做smoothy处理。这个假设看起来很符合数学理
: 性,但事实上这个假设根本不成立!为什么?从统计学的随机测量角度看,如果临界点
: 在总体空间里存在,或总体空间里的回归关系具有可变性,则抽样时,临界点就是随机

s********p
发帖数: 637
34
这个肯定是师兄了
那个夜里暗爽的发呆的也许是师弟
错了,是贱妾同学
怪不得师兄那么说

【在 s*r 的大作中提到】
: 师妹 (师弟?) 你好。摸一摸
T*******I
发帖数: 5138
35
可否请你对样条在飞机设计中的应用说得比较详细点?它是怎么应用的?应用在那个设计
的方面?我不懂飞机设计。

【在 s********p 的大作中提到】
: 虽然俺样条懂不多,可也看不下去了
: 样条函数在很多领域应用广泛,比如飞机制造,感不成陈大师因为样条有问题,连飞机
: 都不坐?
: 很好奇是谁在雇佣你?
:
: 前提
: 学理

b*****o
发帖数: 482
36
你扎就对号入座了呢
如果说到你, 那就先说说你自封"一个统计学家和临床流行病学家"算不算装13吧.
时不时的还自封自己是医生, 应该也算装13吧.

【在 T*******I 的大作中提到】
: 那好,请说明白点。我怎样装13了?在哪里装的?让我在外界帮助下有个自省的机会。
: 请不要只有命题没有论证,这不是数学的风格!
: 先谢了!

T*******I
发帖数: 5138
37
我显然不能装个数学家或哲学家吧?我的专业背景就是医学和统计,而两者相加就是
流行病学。因此,流行病学本就是我的专业研究方向之一。我怎么不能说自己是个什
么“家”呢?请问,Statistician和Epidemiologist的中文翻译是什么?
我确实接受了系统的医学教育,也在临床医院当过短暂的住院实习医生,诊断过病人、
开过处方,查过病房。我怎么不可以说自己是个医生呢?

【在 b*****o 的大作中提到】
: 你扎就对号入座了呢
: 如果说到你, 那就先说说你自封"一个统计学家和临床流行病学家"算不算装13吧.
: 时不时的还自封自己是医生, 应该也算装13吧.

s********p
发帖数: 637
38
这个大师google一下,俺也不多说了。哦,忘了汽车也是,当然你也不可能知道,CAD也许你从没听说过
样条函数集本身就假设是连续的,用结点去构造平滑表面,从而满足特定的特性。你非要从采样的角度来说结点不一定存在,无语
你大概也不知道样条在实际中是怎么用的吧?很多情况下,结点是预先设定好的,或随即调整的,not from sampling,OK?
当然,俺也就说说简单的,大师如果从哲学的角度再来分析,俺理解不了
你其实已经跨越了哲学大师的高度,到了神这个境界了

设计

【在 T*******I 的大作中提到】
: 可否请你对样条在飞机设计中的应用说得比较详细点?它是怎么应用的?应用在那个设计
: 的方面?我不懂飞机设计。

b*****o
发帖数: 482
39
要你这么说所有搞统计的和搞流行病的人都是统计学家和流行病学家了. 一般非
牛人介绍自己的时候最多说自己是搞统计的.
你当了多久的医生, 看过多少病人. 哪个科的.

【在 T*******I 的大作中提到】
: 我显然不能装个数学家或哲学家吧?我的专业背景就是医学和统计,而两者相加就是
: 流行病学。因此,流行病学本就是我的专业研究方向之一。我怎么不能说自己是个什
: 么“家”呢?请问,Statistician和Epidemiologist的中文翻译是什么?
: 我确实接受了系统的医学教育,也在临床医院当过短暂的住院实习医生,诊断过病人、
: 开过处方,查过病房。我怎么不可以说自己是个医生呢?

T*******I
发帖数: 5138
40
我不是搞飞机设计的。如果考虑到机身的曲线或流线型形态需要整出个smoothy的函数出
来,那是数学的事情,而非统计的随机样本观察的事情,因为类似飞机机身这样的
model,当然只能是平滑的。这样的前提是确定性的。
你认为飞机的机身设计是一个随机问题吗?
在随机观察的总体中,例如生存模型、投资或股票的波动、气候变化等的样条化,就是荒
谬的了。我们需要发现连续或非连续的变化。
你如果固执地认定一个随机空间的连续性以及模型的连续性,那么,如果模型不连续怎么
办?你的假设的信心如何?事实上,你根本没有那个信心。不然,你怎么会引入penalty?
怎么会想到要做cross-validation?

【在 s********p 的大作中提到】
: 这个大师google一下,俺也不多说了。哦,忘了汽车也是,当然你也不可能知道,CAD也许你从没听说过
: 样条函数集本身就假设是连续的,用结点去构造平滑表面,从而满足特定的特性。你非要从采样的角度来说结点不一定存在,无语
: 你大概也不知道样条在实际中是怎么用的吧?很多情况下,结点是预先设定好的,或随即调整的,not from sampling,OK?
: 当然,俺也就说说简单的,大师如果从哲学的角度再来分析,俺理解不了
: 你其实已经跨越了哲学大师的高度,到了神这个境界了
:
: 设计

相关主题
陈来错地方了也从工程的角度给陈老师提个意见吧.
陈大师, 我很好奇好奇问陈老师一个问题
居然还有人试图和陈大师讨论统计问题临界回归模型的连续性
进入Statistics版参与讨论
T*******I
发帖数: 5138
41
请问,“最多说自己是搞统计的”英文如何翻译?
以后我就用这个。
关于我的临床实习医师的经历我不是已经告诉过你吗?我在广州军区的空军医院做了
4个月的临床。几乎每天都接受新病人。参与过抢救一位食道破裂大出血的晚期血吸虫
病人,以及其他,包括我的中学政治课教师,因为疑似脑部肿瘤被收进该医院,我是
他的管床医生。
遗憾的是,看过的病人数没有统计过。

【在 b*****o 的大作中提到】
: 要你这么说所有搞统计的和搞流行病的人都是统计学家和流行病学家了. 一般非
: 牛人介绍自己的时候最多说自己是搞统计的.
: 你当了多久的医生, 看过多少病人. 哪个科的.

T*******I
发帖数: 5138
42
“在实际中……,很多情况下,结点是预先设定好的,……,not from sampling, OK?”
我看我已经真的有点不知道统计学为何物了。统计量(结点)不是由样本获得的,而是
主观预设的。客观世界(客体)将随着主观世界(主体)的假定而“变化”或“运动”。
你是上帝啊!这种思维已经完全彻底地背离了Bacon、Galtoon, Pearson以及Fisher等人
的逻辑体系了,而成为彻头彻尾的确定性数学了。

【在 s********p 的大作中提到】
: 这个大师google一下,俺也不多说了。哦,忘了汽车也是,当然你也不可能知道,CAD也许你从没听说过
: 样条函数集本身就假设是连续的,用结点去构造平滑表面,从而满足特定的特性。你非要从采样的角度来说结点不一定存在,无语
: 你大概也不知道样条在实际中是怎么用的吧?很多情况下,结点是预先设定好的,或随即调整的,not from sampling,OK?
: 当然,俺也就说说简单的,大师如果从哲学的角度再来分析,俺理解不了
: 你其实已经跨越了哲学大师的高度,到了神这个境界了
:
: 设计

s********p
发帖数: 637
43

您问这个问题的逻辑点在哪,真的要晕了!
是荒
怎么
penalty?
难道引入penalty就单单只为了解决连续性的问题?
大师,我学识浅薄,麻烦您解释下cross-validation和连续性之间的关系,用浅显的统
计语言说,不要上升到哲学的高度

【在 T*******I 的大作中提到】
: “在实际中……,很多情况下,结点是预先设定好的,……,not from sampling, OK?”
: 我看我已经真的有点不知道统计学为何物了。统计量(结点)不是由样本获得的,而是
: 主观预设的。客观世界(客体)将随着主观世界(主体)的假定而“变化”或“运动”。
: 你是上帝啊!这种思维已经完全彻底地背离了Bacon、Galtoon, Pearson以及Fisher等人
: 的逻辑体系了,而成为彻头彻尾的确定性数学了。

A*******s
发帖数: 3942
44
呵呵,我也想问这个
聆听大师教诲
再问大师怎么理解generalization error

【在 s********p 的大作中提到】
:
: 您问这个问题的逻辑点在哪,真的要晕了!
: 是荒
: 怎么
: penalty?
: 难道引入penalty就单单只为了解决连续性的问题?
: 大师,我学识浅薄,麻烦您解释下cross-validation和连续性之间的关系,用浅显的统
: 计语言说,不要上升到哲学的高度

b*****o
发帖数: 482
45
"I do statistical work"
Statistician的翻译是统计师, 一般人不会自我介绍的时候翻成统计学家.
你大概在10-20年前在医院里实习过4个月, 结果你就变成"医生"了. 现在在BBS发个帖
还得提一下. 这就叫装13了.
我大学本科毕业的时候在证券公司实习的过6个月, 那我现在也可以自称金融分析师了.
A*******s
发帖数: 3942
46
要是我啥时候能混个vp,一定得在名片上印一个副总裁

了.

【在 b*****o 的大作中提到】
: "I do statistical work"
: Statistician的翻译是统计师, 一般人不会自我介绍的时候翻成统计学家.
: 你大概在10-20年前在医院里实习过4个月, 结果你就变成"医生"了. 现在在BBS发个帖
: 还得提一下. 这就叫装13了.
: 我大学本科毕业的时候在证券公司实习的过6个月, 那我现在也可以自称金融分析师了.

b*****o
发帖数: 482
47
呵呵 老师就把各种名词挂在嘴边乱吐, 砸晕几个算几个, 自己都不知道自己在说啥.

【在 s********p 的大作中提到】
:
: 您问这个问题的逻辑点在哪,真的要晕了!
: 是荒
: 怎么
: penalty?
: 难道引入penalty就单单只为了解决连续性的问题?
: 大师,我学识浅薄,麻烦您解释下cross-validation和连续性之间的关系,用浅显的统
: 计语言说,不要上升到哲学的高度

s********p
发帖数: 637
48
结点-->统计学-->客体-->主体-->上帝
您真的太会上岗上线了

OK?”
”。
等人

【在 T*******I 的大作中提到】
: “在实际中……,很多情况下,结点是预先设定好的,……,not from sampling, OK?”
: 我看我已经真的有点不知道统计学为何物了。统计量(结点)不是由样本获得的,而是
: 主观预设的。客观世界(客体)将随着主观世界(主体)的假定而“变化”或“运动”。
: 你是上帝啊!这种思维已经完全彻底地背离了Bacon、Galtoon, Pearson以及Fisher等人
: 的逻辑体系了,而成为彻头彻尾的确定性数学了。

s********p
发帖数: 637
49
直接问他有没有行医执照好了,曾经也行,不然就别装13

了.

【在 b*****o 的大作中提到】
: "I do statistical work"
: Statistician的翻译是统计师, 一般人不会自我介绍的时候翻成统计学家.
: 你大概在10-20年前在医院里实习过4个月, 结果你就变成"医生"了. 现在在BBS发个帖
: 还得提一下. 这就叫装13了.
: 我大学本科毕业的时候在证券公司实习的过6个月, 那我现在也可以自称金融分析师了.

A*******s
发帖数: 3942
50
实习的应该没有吧
要不做个TA岂不是教授了

【在 s********p 的大作中提到】
: 直接问他有没有行医执照好了,曾经也行,不然就别装13
:
: 了.

相关主题
陈大师不是民科如果你不是孬种数学背景的统计学家,请接受挑战
网上哪位比较熟悉分段回归的,能否简单介绍一下其基本的方法论?陈大师的两大硬伤和两大法宝
统计学的新地平线——陈立功与他的自权重曲线陈大师居然在维基百科上大放厥词
进入Statistics版参与讨论
b*****o
发帖数: 482
51
intership的时候去vp办公室打过杂 应该就可以算vp了

【在 A*******s 的大作中提到】
: 要是我啥时候能混个vp,一定得在名片上印一个副总裁
:
: 了.

T*******I
发帖数: 5138
52
为了不引起误会,那么,“统计学家”怎么翻译?

了.

【在 b*****o 的大作中提到】
: "I do statistical work"
: Statistician的翻译是统计师, 一般人不会自我介绍的时候翻成统计学家.
: 你大概在10-20年前在医院里实习过4个月, 结果你就变成"医生"了. 现在在BBS发个帖
: 还得提一下. 这就叫装13了.
: 我大学本科毕业的时候在证券公司实习的过6个月, 那我现在也可以自称金融分析师了.

s********p
发帖数: 637
53
样条本来就是数学中的东西,工程上的应用都来自于您说的“确定性数学”
麻烦陈医生解释下您心中的样条是啥?如果觉得用您的统计语言不好讲,上升到哲学甚至神学角度来讲也行

OK?”
”。
等人

【在 T*******I 的大作中提到】
: “在实际中……,很多情况下,结点是预先设定好的,……,not from sampling, OK?”
: 我看我已经真的有点不知道统计学为何物了。统计量(结点)不是由样本获得的,而是
: 主观预设的。客观世界(客体)将随着主观世界(主体)的假定而“变化”或“运动”。
: 你是上帝啊!这种思维已经完全彻底地背离了Bacon、Galtoon, Pearson以及Fisher等人
: 的逻辑体系了,而成为彻头彻尾的确定性数学了。

s********p
发帖数: 637
54
陈医生,麻烦回答下本页三楼的问题,给俺解解惑

【在 T*******I 的大作中提到】
: 为了不引起误会,那么,“统计学家”怎么翻译?
:
: 了.

T*******I
发帖数: 5138
55
你无需这样紧张,只需告诉我,在总体中的可变回归关系上,临界点可以不可以预先
设定?模型间的连续性可以不可以预先设定?
请回答,但不要含糊!

【在 s********p 的大作中提到】
: 结点-->统计学-->客体-->主体-->上帝
: 您真的太会上岗上线了
:
: OK?”
: ”。
: 等人

T*******I
发帖数: 5138
56
我想问的是,确定性问题可否用非确定性手段解决;反之,非确定性问题可否用确定性
假设作为前提来解决。

【在 s********p 的大作中提到】
: 陈医生,麻烦回答下本页三楼的问题,给俺解解惑
b*****o
发帖数: 482
57
也是statistican.
Secrectary可以翻成小秘, 也可以翻成书记. 你如果是秘书应该是会自称是书记了.

【在 T*******I 的大作中提到】
: 为了不引起误会,那么,“统计学家”怎么翻译?
:
: 了.

s********p
发帖数: 637
58
首先,我不紧张
第二,我一直在说样条的节点。您说的“总体中的可变回归关系”和样条有什么联系能
否先解释清楚,我才能回答您的问题。
当然,还请您回答我楼上的问题,即什么是spline,我才好回答。所以,请你说清楚些
,但不要含糊!

【在 T*******I 的大作中提到】
: 你无需这样紧张,只需告诉我,在总体中的可变回归关系上,临界点可以不可以预先
: 设定?模型间的连续性可以不可以预先设定?
: 请回答,但不要含糊!

s********p
发帖数: 637
59
这跟飞机机身制造有什么关系?
我想问您说的那个关于cross-validation的问题,即cross-validation和连续性的关系的问题
麻烦解答,不要含糊!!

【在 T*******I 的大作中提到】
: 我想问的是,确定性问题可否用非确定性手段解决;反之,非确定性问题可否用确定性
: 假设作为前提来解决。

a**n
发帖数: 3801
60
你现在做成了啥

【在 T*******I 的大作中提到】
: 水泡泡很轻视地问我是谁教出来的。让我告诉你以及这里所有的人。
: 我的老师有很多。本科时教我统计学的老师有好几个,他们是同济医科大学原卫生
: 统计教研室的老师们。他们全都毕业于老同济医学院(也就是后来的武汉医学院、同济
: 医科大学)的卫生系。我认为他们对统计学的理解绝对不比任何一个美国大学的统计学
: 教授差!其中的余松林教授成为了我后来读硕士时的导师。余在国内的前辈中是很有名
: 望的。但是,所有这些人只教了我最基本的东西,但对于我初入统计学却极其重要。令
: 我感到荣幸的是,我最终也成了其中的一员,并在那里服务了大约11年。
: 我在统计学领域的其他老师,应该是佩第、凯特勒、高尔顿、皮尔逊以及戈塞特和
: 费舍尔等(这仅是我自己妄称的,没人会承认),这些人是统计学史上的顶级人物。
: 我的另外的老师就完全不是搞统计的。一个是彭本智、一个是袁建国、另外就是罗

相关主题
那些挺陈大师的多谢版主解封,并请教“什么是统计学?”
let's settle this once and for all数学家们在统计学领域犯下了几个严重的错误
一个统计学的问题,请大家指教Re: 关于肖手术的最新review (转载)
进入Statistics版参与讨论
d*****t
发帖数: 7903
61
你们这些人太坏了。。。
T*******I
发帖数: 5138
62
So, I am a statistician.

【在 b*****o 的大作中提到】
: 也是statistican.
: Secrectary可以翻成小秘, 也可以翻成书记. 你如果是秘书应该是会自称是书记了.

s********p
发帖数: 637
63
他是神!!!

【在 a**n 的大作中提到】
: 你现在做成了啥
A*******s
发帖数: 3942
64
这样翻译没错。正如master可以是硕士,也可以是大师。所以我们都说陈大师

【在 b*****o 的大作中提到】
: 也是statistican.
: Secrectary可以翻成小秘, 也可以翻成书记. 你如果是秘书应该是会自称是书记了.

T*******I
发帖数: 5138
65
事实是,我的几个关键问题总是在先提出。你们都没有认真回答。
这里,我把我个人对Spline的分析逻辑的简单理解写在这里。如果不对或不全,请大家
批评指正。
所谓Spline,就是在一个复杂的随机空间里建立一个smoothy的模型表达。例如,一组
二维空间里的气候数据股票数据等。这种连续平滑的假定,要求结点的计算由两个相邻
模型的相等性来解联立方程组获得。从而,任意两个相邻模型间的连接变异=0。如果模
型间的连接不够平滑,而是凸现拐点之类的,要做平滑处理。

【在 s********p 的大作中提到】
: 首先,我不紧张
: 第二,我一直在说样条的节点。您说的“总体中的可变回归关系”和样条有什么联系能
: 否先解释清楚,我才能回答您的问题。
: 当然,还请您回答我楼上的问题,即什么是spline,我才好回答。所以,请你说清楚些
: ,但不要含糊!

T*******I
发帖数: 5138
66
所谓Cross-validation,是缘于结点的临界模型的相等性解衍生的一个关于结点估计的
结果在整个随机空间里的有效性、可靠性、稳定性等的检验或validation。这是它与连
续性的假设之间发生的关系。
为什么会发生这个问题呢?根本原因就在于任何结点的估计都是由模型的相等性或连续
性假设来得到的。而这样的估计常常会大大偏离甚至超出一个随机空间的合理范畴。因
而对任何结点需要做cross-validation。
为了校正结点估计的偏离,因而引入了penalty。

【在 s********p 的大作中提到】
: 这跟飞机机身制造有什么关系?
: 我想问您说的那个关于cross-validation的问题,即cross-validation和连续性的关系的问题
: 麻烦解答,不要含糊!!

T*******I
发帖数: 5138
67
I am not a 神。I never claim it. I always say I am a statistician, just as
everyone of you.
I have anwsered your questions. Now it is your turn.

【在 s********p 的大作中提到】
: 他是神!!!
s********p
发帖数: 637
68
这是你的问题:
你无需这样紧张,只需告诉我,在总体中的可变回归关系上,临界点可以不可以预先
设定?模型间的连续性可以不可以预先设定?
T*******I
发帖数: 5138
69
看来,你拒绝回答我的重要提问。那好,我的答案是:不可以。
我承认样条在工程领域的应用是非常有意义的,因为在工程设计之类的问题上,我们面
对的是确定性选择,例如机身流线型设计等。但在随机系统里,样条完全没有意义。
正如你所说,具体情况具体分析。但原则是,随机系统里,随机事件不可假定。这是一
条不可跨越的思维红线。由于临界模型间的连续性不可被假定,于是,采用解联立方程
组估计结点的算法便彻底丧失意义,从而cross-validation也变得失去意义。
[sheepsheep (Oldy)在大作中提到:]
:“临界点可以不可以预先设定?模型间的连续性可以不可以预先设定?”
:这是你的问题。
:更具体来说,我是搞工程出身的,虽然数学学得比较浅显,但样条方面的
:应用比较多。
:在许多应用上,节点是需要事先确定,或在一个小范围内活动的。
:所以,问题必须跟实际情况相结合。脱离具体环境,有些问题其实不是
:问题。
D**g
发帖数: 739
70
路过插一句:做人不能太mean了。做男人不能太刻薄了。统计的海深得很,就算你比人
能喝,也没到把水喝完的程度。大家说话何不悠着点?
相关主题
Re: 关于肖手术的最新review (转载)陈大师, 我很好奇
Great Confucius居然还有人试图和陈大师讨论统计问题
陈来错地方了也从工程的角度给陈老师提个意见吧.
进入Statistics版参与讨论
s********p
发帖数: 637
71
你给我举一个现实生活中需要随机系统解决样条节点的连续性的例子吧
也许有,但我想不出
我也许可以举一个例子来说明为什么事物都是随机的,
比方说,陈大师是随机的
为什么?
当陈爸爸的那一群喽喽兵向前冲的时候,如果代表陈大师的那个喽喽兵脚底一滑,或旁边那个喽喽档一下,陈大师就没有了
所以陈大师是随机的
笑话,不要当真

【在 T*******I 的大作中提到】
: 看来,你拒绝回答我的重要提问。那好,我的答案是:不可以。
: 我承认样条在工程领域的应用是非常有意义的,因为在工程设计之类的问题上,我们面
: 对的是确定性选择,例如机身流线型设计等。但在随机系统里,样条完全没有意义。
: 正如你所说,具体情况具体分析。但原则是,随机系统里,随机事件不可假定。这是一
: 条不可跨越的思维红线。由于临界模型间的连续性不可被假定,于是,采用解联立方程
: 组估计结点的算法便彻底丧失意义,从而cross-validation也变得失去意义。
: [sheepsheep (Oldy)在大作中提到:]
: :“临界点可以不可以预先设定?模型间的连续性可以不可以预先设定?”
: :这是你的问题。
: :更具体来说,我是搞工程出身的,虽然数学学得比较浅显,但样条方面的

h***i
发帖数: 3844
72
说得好,不过数学才能算海,统计也就是小湖泊吧。

【在 D**g 的大作中提到】
: 路过插一句:做人不能太mean了。做男人不能太刻薄了。统计的海深得很,就算你比人
: 能喝,也没到把水喝完的程度。大家说话何不悠着点?

T*******I
发帖数: 5138
73
例如,天气预报。
说真的,我很荣幸地感到有机会与你认真地讨论学术问题。请不要把我想象得如何mean。
我们在讨论什么是真理,而非任何其它。
不错,每个人都是随机地来到这个世界的。在千百万个精虫中,你战胜了所有其它同伴而
来到这个世界。你是其中最伟大的。

旁边那个喽喽档一下,陈大师就没有了

【在 s********p 的大作中提到】
: 你给我举一个现实生活中需要随机系统解决样条节点的连续性的例子吧
: 也许有,但我想不出
: 我也许可以举一个例子来说明为什么事物都是随机的,
: 比方说,陈大师是随机的
: 为什么?
: 当陈爸爸的那一群喽喽兵向前冲的时候,如果代表陈大师的那个喽喽兵脚底一滑,或旁边那个喽喽档一下,陈大师就没有了
: 所以陈大师是随机的
: 笑话,不要当真

T*******I
发帖数: 5138
74
你可能还没意识到,统计学是海,数学不过是统计学的一个特例。正如我的文章里指出
的那样,确定性的对应是随机对应的一个特例。而前者是数学的基础,后者则是统计学
的基础。请不要颠倒了两者之间的关系,正如数学是哲学的一部分,而非哲学是数学的
一部分一样。

【在 h***i 的大作中提到】
: 说得好,不过数学才能算海,统计也就是小湖泊吧。
s********p
发帖数: 637
75
我从来没有把你想象为mean
相反,你执着的可爱!
很高兴和你讨论问题!

mean。

【在 T*******I 的大作中提到】
: 例如,天气预报。
: 说真的,我很荣幸地感到有机会与你认真地讨论学术问题。请不要把我想象得如何mean。
: 我们在讨论什么是真理,而非任何其它。
: 不错,每个人都是随机地来到这个世界的。在千百万个精虫中,你战胜了所有其它同伴而
: 来到这个世界。你是其中最伟大的。
:
: 旁边那个喽喽档一下,陈大师就没有了

h***i
发帖数: 3844
76
证明随机是存在的在讨论这些吧,呵呵

【在 T*******I 的大作中提到】
: 你可能还没意识到,统计学是海,数学不过是统计学的一个特例。正如我的文章里指出
: 的那样,确定性的对应是随机对应的一个特例。而前者是数学的基础,后者则是统计学
: 的基础。请不要颠倒了两者之间的关系,正如数学是哲学的一部分,而非哲学是数学的
: 一部分一样。

S******t
发帖数: 1437
77
貌似这里就这个帖最火啊。 恕我无知,都不知道你们说的这个陈大师是谁...
google了一下,搜到这个: http://baike.baidu.com/view/1345559.htm
是这个吗?
g********r
发帖数: 8017
78
第一个就是。陈大师自己写的。他的“非线性过程的泛函临界回归分析的统计算法”至
今未能发表。就拿着编辑拒稿的套话和未经审稿的会议摘要说事儿。
在BBS上发表专业论文好几百篇,非常有影响力。

【在 S******t 的大作中提到】
: 貌似这里就这个帖最火啊。 恕我无知,都不知道你们说的这个陈大师是谁...
: google了一下,搜到这个: http://baike.baidu.com/view/1345559.htm
: 是这个吗?

S******t
发帖数: 1437
79
我还在wiki上看到 什么陈立功事件, 好长, 而且我还没看懂

【在 g********r 的大作中提到】
: 第一个就是。陈大师自己写的。他的“非线性过程的泛函临界回归分析的统计算法”至
: 今未能发表。就拿着编辑拒稿的套话和未经审稿的会议摘要说事儿。
: 在BBS上发表专业论文好几百篇,非常有影响力。

g********r
发帖数: 8017
80
都是陈大师自己写的。你够无聊的。我更无聊还回这个贴。

【在 S******t 的大作中提到】
: 我还在wiki上看到 什么陈立功事件, 好长, 而且我还没看懂
相关主题
好奇问陈老师一个问题网上哪位比较熟悉分段回归的,能否简单介绍一下其基本的方法论?
临界回归模型的连续性统计学的新地平线——陈立功与他的自权重曲线
陈大师不是民科如果你不是孬种数学背景的统计学家,请接受挑战
进入Statistics版参与讨论
T*******I
发帖数: 5138
81
我敢说自己是创造性地提出了……,是因为它是一个事实。我在统计学领域否定最优化
、bootstrap以及spline是因为我有严谨的逻辑。我的文章不被发表是因为它对整个学科
的冲击是无法估量的。
再说,那不是一个会议摘要,而是有着概念定义、推理、论证、数学证明、算法构造、
随机模拟、应用实例以及结论和参考文献的完整而翔实的科研论文

【在 g********r 的大作中提到】
: 第一个就是。陈大师自己写的。他的“非线性过程的泛函临界回归分析的统计算法”至
: 今未能发表。就拿着编辑拒稿的套话和未经审稿的会议摘要说事儿。
: 在BBS上发表专业论文好几百篇,非常有影响力。

T*******I
发帖数: 5138
82
Hi, drburnie,
Thanks a lot. 这是你在将近大半年里与我的对话中第一次说了一句人话。
如果我的那段话是由笔写下的,确实是很惊煞人的。
如果你能再说一句人话,我就决定将你从我的黑名单里释放出来。目前,那个集里只有你是唯一的元素。
Thanks again!
g********r
发帖数: 8017
83
陈大师我对你有个建议。很邪恶的建议。你把方法包装一下,去投那些审稿的会议。一
些机器学习的会议也能接受一些统计学习的稿子。
因为审稿时间短,错漏难免。记得几年前几个大学生搞的那片假稿子么?
你的稿子被接受的机会大些。一旦接受,你就可以宣称这是同行评议的论文了。

学科

【在 T*******I 的大作中提到】
: 我敢说自己是创造性地提出了……,是因为它是一个事实。我在统计学领域否定最优化
: 、bootstrap以及spline是因为我有严谨的逻辑。我的文章不被发表是因为它对整个学科
: 的冲击是无法估量的。
: 再说,那不是一个会议摘要,而是有着概念定义、推理、论证、数学证明、算法构造、
: 随机模拟、应用实例以及结论和参考文献的完整而翔实的科研论文

T*******I
发帖数: 5138
84
你貌似一个菩萨心肠的人,怎么会出此“邪恶”的建议呢?何况还是在学术领域?

【在 g********r 的大作中提到】
: 陈大师我对你有个建议。很邪恶的建议。你把方法包装一下,去投那些审稿的会议。一
: 些机器学习的会议也能接受一些统计学习的稿子。
: 因为审稿时间短,错漏难免。记得几年前几个大学生搞的那片假稿子么?
: 你的稿子被接受的机会大些。一旦接受,你就可以宣称这是同行评议的论文了。
:
: 学科

T*******I
发帖数: 5138
85
再说,那不是一个会议摘要,而是有着概念定义、推理、论证、数学证明、算法构造、
随机模拟、应用实例以及结论和参考文献的完整而翔实的科研论文。
是的,Pearson当年的回归分析和卡方检验的稿件发往数学期刊,被审稿了,然后被拒了。
现在的很多统计期刊也被数学化了,却冒称统计期刊。

【在 g********r 的大作中提到】
: 第一个就是。陈大师自己写的。他的“非线性过程的泛函临界回归分析的统计算法”至
: 今未能发表。就拿着编辑拒稿的套话和未经审稿的会议摘要说事儿。
: 在BBS上发表专业论文好几百篇,非常有影响力。

s*****r
发帖数: 790
86
"数学不过是统计学的一个特例"????
are you serious? Do you mean statistics is more general/abstract than
mathematics? then you will be the first one to claim it. Usually, my
impression is that people in abstract/pure mathematics disregard applied
mathematics, statistics is even behind applied math.
Can I ask you a question? What relationship do you think between mathematics
, probability, and statistics. Before you answer this question, please
define the three terms and give some simple examples or branches. T

【在 T*******I 的大作中提到】
: 你可能还没意识到,统计学是海,数学不过是统计学的一个特例。正如我的文章里指出
: 的那样,确定性的对应是随机对应的一个特例。而前者是数学的基础,后者则是统计学
: 的基础。请不要颠倒了两者之间的关系,正如数学是哲学的一部分,而非哲学是数学的
: 一部分一样。

d******e
发帖数: 7844
87
你开什么玩笑,陈大师连实分析都没有上过,让他来解释这个,肯定有跟你拿上帝说事儿

mathematics

【在 s*****r 的大作中提到】
: "数学不过是统计学的一个特例"????
: are you serious? Do you mean statistics is more general/abstract than
: mathematics? then you will be the first one to claim it. Usually, my
: impression is that people in abstract/pure mathematics disregard applied
: mathematics, statistics is even behind applied math.
: Can I ask you a question? What relationship do you think between mathematics
: , probability, and statistics. Before you answer this question, please
: define the three terms and give some simple examples or branches. T

T*******I
发帖数: 5138
88
I believe that I am the first one to claim it and I am serious, although I am not a mathematician but a statistician with medical science education background.
Actually, I have proven the statement not only in the paragraph in Chinese that you cited, but also in my paper. If you are interested, please refer my paper.

mathematics

【在 s*****r 的大作中提到】
: "数学不过是统计学的一个特例"????
: are you serious? Do you mean statistics is more general/abstract than
: mathematics? then you will be the first one to claim it. Usually, my
: impression is that people in abstract/pure mathematics disregard applied
: mathematics, statistics is even behind applied math.
: Can I ask you a question? What relationship do you think between mathematics
: , probability, and statistics. Before you answer this question, please
: define the three terms and give some simple examples or branches. T

p********a
发帖数: 5352
89
再说一遍,请理性讨论,不要辱骂。
s*****r
发帖数: 790
90
What you believe is not important. So many people have so many believes, and
some have very strong faith. So what?
My education so far has been like this: a great researcher can give a simple
and straightforward explanation. If one can't do that, he/she probably is
not great.
My question did not ask for your proof. It asks for an answer. Dont refer to
your great paper.

Chinese
my

【在 T*******I 的大作中提到】
: I believe that I am the first one to claim it and I am serious, although I am not a mathematician but a statistician with medical science education background.
: Actually, I have proven the statement not only in the paragraph in Chinese that you cited, but also in my paper. If you are interested, please refer my paper.
:
: mathematics

相关主题
陈大师的两大硬伤和两大法宝let's settle this once and for all
陈大师居然在维基百科上大放厥词一个统计学的问题,请大家指教
那些挺陈大师的多谢版主解封,并请教“什么是统计学?”
进入Statistics版参与讨论
T*******I
发帖数: 5138
91
If you wouldn't like to read my paper, how could you understand what I
claimed here? You even do not have a basic picture on what I have done in
both mathematics and statistics.
So, the first step is to know what I have said and done, then back here to
post your opinions.

【在 s*****r 的大作中提到】
: What you believe is not important. So many people have so many believes, and
: some have very strong faith. So what?
: My education so far has been like this: a great researcher can give a simple
: and straightforward explanation. If one can't do that, he/she probably is
: not great.
: My question did not ask for your proof. It asks for an answer. Dont refer to
: your great paper.
:
: Chinese
: my

s*****r
发帖数: 790
92
what I asked has nothing to do with what you have done. Just your opinion. I
don't ask your proof for your claim.
let me ask again:
what relationship do you think it is among mathematics, probability, and
statistics? When you answer, please briefly define the three terms,
preferrably some examples/branches for each.

【在 T*******I 的大作中提到】
: If you wouldn't like to read my paper, how could you understand what I
: claimed here? You even do not have a basic picture on what I have done in
: both mathematics and statistics.
: So, the first step is to know what I have said and done, then back here to
: post your opinions.

T*******I
发帖数: 5138
93
I am sorry, I wouldn't like to post my explanation in detail here, although
I have a such one. I just made the claim here according to my logics.
However, according to the relationship between certain correspondences and
radnom correspondence, the big picture for that claim will be very clear
and that is true.

I

【在 s*****r 的大作中提到】
: what I asked has nothing to do with what you have done. Just your opinion. I
: don't ask your proof for your claim.
: let me ask again:
: what relationship do you think it is among mathematics, probability, and
: statistics? When you answer, please briefly define the three terms,
: preferrably some examples/branches for each.

b*****o
发帖数: 482
94
埃 那我来帮沉老师解释一下吧
他的意思就是统计是研究随机变量的, 一般的数学是研究非随机变量的. 非随机变量就是prob=1的随机变量, 所以变量是随机变量的子集. 所以数学是统计的子集.
说得不好, 清沉老师补充

【在 T*******I 的大作中提到】
: 你可能还没意识到,统计学是海,数学不过是统计学的一个特例。正如我的文章里指出
: 的那样,确定性的对应是随机对应的一个特例。而前者是数学的基础,后者则是统计学
: 的基础。请不要颠倒了两者之间的关系,正如数学是哲学的一部分,而非哲学是数学的
: 一部分一样。

T*******I
发帖数: 5138
95
大致意思是这样的,也完全可以作为论证过程的论据之一。
但更严谨的论证不是如此简单。我们需要在概率论中定义随机对应,由此就有了那个
simple big picture.

就是prob=1的随机变量, 所以变量是随机变量的子集. 所以数学是统计的子集.

【在 b*****o 的大作中提到】
: 埃 那我来帮沉老师解释一下吧
: 他的意思就是统计是研究随机变量的, 一般的数学是研究非随机变量的. 非随机变量就是prob=1的随机变量, 所以变量是随机变量的子集. 所以数学是统计的子集.
: 说得不好, 清沉老师补充

d*******e
发帖数: 1649
96
发个包子吧

【在 T*******I 的大作中提到】
: 大致意思是这样的,也完全可以作为论证过程的论据之一。
: 但更严谨的论证不是如此简单。我们需要在概率论中定义随机对应,由此就有了那个
: simple big picture.
:
: 就是prob=1的随机变量, 所以变量是随机变量的子集. 所以数学是统计的子集.

T*******I
发帖数: 5138
97
好吧。发几个口头包子给来过这里的每一个人做安慰剂吧。
Thanks for all of you.

【在 d*******e 的大作中提到】
: 发个包子吧
s*****r
发帖数: 790
98
是我的问题不清楚,还是你脑子有毛病?seriously.
我完全没有要求detailed explanation, 也不需要跟你的研究有关。
这样吧,我把问题拆开来。
1)什么是你认为的数学。请举简单例说明。
2)什么是你认为的概率论。请举简单例说明。
3)什么是你认为的统计学。请举简单例说明。
4)以上三者有关系么?什么样的关系。
请注意,以上没有任何一个要求你的证明,甚至不需要非常严谨。

although

【在 T*******I 的大作中提到】
: I am sorry, I wouldn't like to post my explanation in detail here, although
: I have a such one. I just made the claim here according to my logics.
: However, according to the relationship between certain correspondences and
: radnom correspondence, the big picture for that claim will be very clear
: and that is true.
:
: I

T*******I
发帖数: 5138
99
首先回答你关于什么是统计学。
正如Fisher很早以前就指出过一样,统计是一门通用的方法论。方法论有很多,不同的
学科有不同的方法论,例如,研究数学的有数学的方法论,研究物理的有物理的方法论
,等等等等。那么,Fisher在这里说的通用方法论是什么样的方法论呢?答曰:是认识
世界的方法论。用我们现在的语言说,就是,是认识随机世界的方法论,或简而言之,
是认识方法论,或认识论中的方法学(Statistics is a methodology in
epistemology),或数学化的认识论(Statistics is a mathematized epistemology)。
请问,数学是认识世界的方法论吗?数学是研究如何认识世界的相关问题的学科吗?
那么,数学是什么?请参考wikipedia词条,我对此无太多的异议。
概率论是什么?是一门数学的分支学科,具体研究各种概率发生现象并找出不同条件下
概率计算的法则。概率论的研究遵循一般数学研究的法则或数学方法论。例如,概念或
性质的定义、性质的证明、定理的引入和证明、引理和推理及其证明,等等。也请参考wikipedia的词条。
至于三者之

【在 s*****r 的大作中提到】
: 是我的问题不清楚,还是你脑子有毛病?seriously.
: 我完全没有要求detailed explanation, 也不需要跟你的研究有关。
: 这样吧,我把问题拆开来。
: 1)什么是你认为的数学。请举简单例说明。
: 2)什么是你认为的概率论。请举简单例说明。
: 3)什么是你认为的统计学。请举简单例说明。
: 4)以上三者有关系么?什么样的关系。
: 请注意,以上没有任何一个要求你的证明,甚至不需要非常严谨。
:
: although

w**********y
发帖数: 1691
100
去打篮球之前,还是忍不住来向大师请教一下.请问陈大师:
1. 什么是random variable?就是随机变量
2. 什么是function?就是映射
就你理解,他哥俩有啥关系? 你搞了个新名词出来,啥随机映射,给解释解释.
3.你知道functional space么?就是泛函空间
random variable跟functional space又有啥关系你知道么?
你说清楚了,再试着去定义统计,概率,数学吧..
btw:俺学统计的,不是学数学的..
相关主题
数学家们在统计学领域犯下了几个严重的错误陈来错地方了
Re: 关于肖手术的最新review (转载)陈大师, 我很好奇
Great Confucius居然还有人试图和陈大师讨论统计问题
进入Statistics版参与讨论
d******e
发帖数: 7844
101
陈大师,你除了提纲挈领之外,能不能说点细节的东西?
天天吹这些虚无的东西有啥用?难道是“这事儿不能说太细?”

)。

【在 T*******I 的大作中提到】
: 首先回答你关于什么是统计学。
: 正如Fisher很早以前就指出过一样,统计是一门通用的方法论。方法论有很多,不同的
: 学科有不同的方法论,例如,研究数学的有数学的方法论,研究物理的有物理的方法论
: ,等等等等。那么,Fisher在这里说的通用方法论是什么样的方法论呢?答曰:是认识
: 世界的方法论。用我们现在的语言说,就是,是认识随机世界的方法论,或简而言之,
: 是认识方法论,或认识论中的方法学(Statistics is a methodology in
: epistemology),或数学化的认识论(Statistics is a mathematized epistemology)。
: 请问,数学是认识世界的方法论吗?数学是研究如何认识世界的相关问题的学科吗?
: 那么,数学是什么?请参考wikipedia词条,我对此无太多的异议。
: 概率论是什么?是一门数学的分支学科,具体研究各种概率发生现象并找出不同条件下

T*******I
发帖数: 5138
102
考我数学里的基本概念啊。你考不倒我。即使我现在不能通过我脑海里的现有
知识系统给出正确的答案,但我手头有一整套《数学大百科辞典》。我翻词典
照抄也能回答你。
所以,此刻我不想欺骗任何人。我还需要学习那几个概念。
等我学习了,理解了,再来回答你。可以吗?

【在 w**********y 的大作中提到】
: 去打篮球之前,还是忍不住来向大师请教一下.请问陈大师:
: 1. 什么是random variable?就是随机变量
: 2. 什么是function?就是映射
: 就你理解,他哥俩有啥关系? 你搞了个新名词出来,啥随机映射,给解释解释.
: 3.你知道functional space么?就是泛函空间
: random variable跟functional space又有啥关系你知道么?
: 你说清楚了,再试着去定义统计,概率,数学吧..
: btw:俺学统计的,不是学数学的..

T*******I
发帖数: 5138
103
ok, drburnie, 这种认真讨论学术的态度我表示敬意。所以,我将履行对你的诺言。
这样的话,我的那个集就是一个空集了。
我会给出关于这个命题的严谨的论证的。这是一个很大的命题,需要付出很多的努力。
我想借此机会告诉大家的是,在12年前的那场艰难痛苦的思考里,我已经基本完成了
这个论证。我现在需要做的就是整理那时的思路,并找个时间完成它。
不过,我现在的主要精力不在这个问题上。它无论对于我个人还是对于统计学本身都
不是很急迫,因为,结论我已经给出了。

【在 d******e 的大作中提到】
: 陈大师,你除了提纲挈领之外,能不能说点细节的东西?
: 天天吹这些虚无的东西有啥用?难道是“这事儿不能说太细?”
:
: )。

s*****r
发帖数: 790
104
你不是说了数学是统计的一个特殊分支么?为什么说这三者的关系你不想说呢?
那么我再问你一个问题,没有概率论,怎么做统计? 或者,没有统计学,没法做概率
论?

)。

【在 T*******I 的大作中提到】
: 首先回答你关于什么是统计学。
: 正如Fisher很早以前就指出过一样,统计是一门通用的方法论。方法论有很多,不同的
: 学科有不同的方法论,例如,研究数学的有数学的方法论,研究物理的有物理的方法论
: ,等等等等。那么,Fisher在这里说的通用方法论是什么样的方法论呢?答曰:是认识
: 世界的方法论。用我们现在的语言说,就是,是认识随机世界的方法论,或简而言之,
: 是认识方法论,或认识论中的方法学(Statistics is a methodology in
: epistemology),或数学化的认识论(Statistics is a mathematized epistemology)。
: 请问,数学是认识世界的方法论吗?数学是研究如何认识世界的相关问题的学科吗?
: 那么,数学是什么?请参考wikipedia词条,我对此无太多的异议。
: 概率论是什么?是一门数学的分支学科,具体研究各种概率发生现象并找出不同条件下

s*****r
发帖数: 790
105
谢谢你的坦白。
如果对于这些最基本的概念,你都不清楚,不理解,请问你是怎么得出结论,特别是现
代统计学从根本上错误的?

【在 T*******I 的大作中提到】
: 考我数学里的基本概念啊。你考不倒我。即使我现在不能通过我脑海里的现有
: 知识系统给出正确的答案,但我手头有一整套《数学大百科辞典》。我翻词典
: 照抄也能回答你。
: 所以,此刻我不想欺骗任何人。我还需要学习那几个概念。
: 等我学习了,理解了,再来回答你。可以吗?

T*******I
发帖数: 5138
106
对不起。你误会我的话了。我并没说数学是统计学的分支。数学体系中并非每一个部分
都与统计学有关。
我想简单地说一句:没有概率论是可以做统计的。例如,计算平均数、标准差、变异系
数、频数和率,甚至相关系数和回归模型等。这些基本统计量的构造和计算不需要概率
论。只有到了高级的推断方法学中才需要概率论。

【在 s*****r 的大作中提到】
: 你不是说了数学是统计的一个特殊分支么?为什么说这三者的关系你不想说呢?
: 那么我再问你一个问题,没有概率论,怎么做统计? 或者,没有统计学,没法做概率
: 论?
:
: )。

s*****r
发帖数: 790
107
计算那些量,以及计算任何量,都是数学运算,不是统计,如果照你说的。
但是,统计更重要的是解释那些数字。 如果没有这一部分,谈什么统计呢?你说对不
对?

【在 T*******I 的大作中提到】
: 对不起。你误会我的话了。我并没说数学是统计学的分支。数学体系中并非每一个部分
: 都与统计学有关。
: 我想简单地说一句:没有概率论是可以做统计的。例如,计算平均数、标准差、变异系
: 数、频数和率,甚至相关系数和回归模型等。这些基本统计量的构造和计算不需要概率
: 论。只有到了高级的推断方法学中才需要概率论。

T*******I
发帖数: 5138
108
Yes, you are right.

【在 s*****r 的大作中提到】
: 计算那些量,以及计算任何量,都是数学运算,不是统计,如果照你说的。
: 但是,统计更重要的是解释那些数字。 如果没有这一部分,谈什么统计呢?你说对不
: 对?

T*******I
发帖数: 5138
109
你错了。现代统计学从根本上是正确的!我只是说有些方法错了,由于它们take
assumptions 而不是hypothesises。而
a hypothesis 不等于 an assumption.

【在 s*****r 的大作中提到】
: 谢谢你的坦白。
: 如果对于这些最基本的概念,你都不清楚,不理解,请问你是怎么得出结论,特别是现
: 代统计学从根本上错误的?

s*****r
发帖数: 790
110
那么你是承认概率论是统计学的基础了?

【在 T*******I 的大作中提到】
: Yes, you are right.
相关主题
居然还有人试图和陈大师讨论统计问题临界回归模型的连续性
也从工程的角度给陈老师提个意见吧.陈大师不是民科
好奇问陈老师一个问题网上哪位比较熟悉分段回归的,能否简单介绍一下其基本的方法论?
进入Statistics版参与讨论
T*******I
发帖数: 5138
111
部分地,而不是全部,即,统计学中的每一部分并非一定要有概率论作为基础。
概率论对于统计是至关重要的。没有概率论支持的统计学是小儿科;而得到概
率论支持的统计方法论是人类最高的智慧。

【在 s*****r 的大作中提到】
: 那么你是承认概率论是统计学的基础了?
s*****r
发帖数: 790
112
你解释一下,什么叫 “统计学中的每一部分并非一定要有概率论作为基础”。
给个例子,哪一部份不需要以概率论做基础。如果不是一概率论为基础,那么以什么为
基础,或者已经是最基础的了?
概率论这么伟大呀?有无之间,把统计从地上变到天上。请问你又怎么得出“人类最高
的智慧”这么一个地位的? 至少给几条大的理由吧.

【在 T*******I 的大作中提到】
: 部分地,而不是全部,即,统计学中的每一部分并非一定要有概率论作为基础。
: 概率论对于统计是至关重要的。没有概率论支持的统计学是小儿科;而得到概
: 率论支持的统计方法论是人类最高的智慧。

A*******s
发帖数: 3942
113
please teach me how to do regression without assumptions based on
probability

【在 T*******I 的大作中提到】
: 对不起。你误会我的话了。我并没说数学是统计学的分支。数学体系中并非每一个部分
: 都与统计学有关。
: 我想简单地说一句:没有概率论是可以做统计的。例如,计算平均数、标准差、变异系
: 数、频数和率,甚至相关系数和回归模型等。这些基本统计量的构造和计算不需要概率
: 论。只有到了高级的推断方法学中才需要概率论。

T*******I
发帖数: 5138
114
如果你把相关和回归系数的检验部分从方法学中拿掉,就是没有概率论支持的方法论。
这时,相关和回归的系数计算没有任何困难。困难的是关于它们的可信区间和不等于0
的可信度。
借这个回答一并答复shinder的疑问。
顺便指出Actuaries的下列陈述中的一个错误:
the "assumptions" should be "hypothesises".

【在 A*******s 的大作中提到】
: please teach me how to do regression without assumptions based on
: probability

s*****r
发帖数: 790
115
我想我已经说过了,计算部分单独的看不是统计的一部分。那个计算是数学的一部分。
只有把它房子统计的框子里,才成为统计的一部分。

0

【在 T*******I 的大作中提到】
: 如果你把相关和回归系数的检验部分从方法学中拿掉,就是没有概率论支持的方法论。
: 这时,相关和回归的系数计算没有任何困难。困难的是关于它们的可信区间和不等于0
: 的可信度。
: 借这个回答一并答复shinder的疑问。
: 顺便指出Actuaries的下列陈述中的一个错误:
: the "assumptions" should be "hypothesises".

D******n
发帖数: 2836
116
least square,

【在 A*******s 的大作中提到】
: please teach me how to do regression without assumptions based on
: probability

T*******I
发帖数: 5138
117
我不能赞成你的这个认识。这是一个偏见。统计的计算部分不是抽象的数字运算,而是
有实际意义的属性或概念的运算,因为在一个统计数据库中不存在抽象的数,而全部是
有实际意义的关于外部世界的属性的判断和测量的结果。
反过来看,任何一个统计计算的公式若被抽象到没有任何实际意义,那么,它也就不是
一个统计的方法。然而,一个统计计算的方法又不是为了某个特定的样本设计的。因此,
统计算法体现了具体与抽象在形式上的完美统一。这是与一般数学计算不一样的特性。

【在 s*****r 的大作中提到】
: 我想我已经说过了,计算部分单独的看不是统计的一部分。那个计算是数学的一部分。
: 只有把它房子统计的框子里,才成为统计的一部分。
:
: 0

s*****r
发帖数: 790
118
那些量的意义从何而来?从它们的分布而来(不看实际问题),对不对?

【在 T*******I 的大作中提到】
: 我不能赞成你的这个认识。这是一个偏见。统计的计算部分不是抽象的数字运算,而是
: 有实际意义的属性或概念的运算,因为在一个统计数据库中不存在抽象的数,而全部是
: 有实际意义的关于外部世界的属性的判断和测量的结果。
: 反过来看,任何一个统计计算的公式若被抽象到没有任何实际意义,那么,它也就不是
: 一个统计的方法。然而,一个统计计算的方法又不是为了某个特定的样本设计的。因此,
: 统计算法体现了具体与抽象在形式上的完美统一。这是与一般数学计算不一样的特性。

T*******I
发帖数: 5138
119
由它们的定义和测量单位而来。

【在 s*****r 的大作中提到】
: 那些量的意义从何而来?从它们的分布而来(不看实际问题),对不对?
A*******s
发帖数: 3942
120
only for continuous target variables...

【在 D******n 的大作中提到】
: least square,
相关主题
统计学的新地平线——陈立功与他的自权重曲线陈大师居然在维基百科上大放厥词
如果你不是孬种数学背景的统计学家,请接受挑战那些挺陈大师的
陈大师的两大硬伤和两大法宝let's settle this once and for all
进入Statistics版参与讨论
A*******s
发帖数: 3942
121
why people use MLE?

0

【在 T*******I 的大作中提到】
: 如果你把相关和回归系数的检验部分从方法学中拿掉,就是没有概率论支持的方法论。
: 这时,相关和回归的系数计算没有任何困难。困难的是关于它们的可信区间和不等于0
: 的可信度。
: 借这个回答一并答复shinder的疑问。
: 顺便指出Actuaries的下列陈述中的一个错误:
: the "assumptions" should be "hypothesises".

s*****r
发帖数: 790
122
那么我先问你,随机变量是统计概念还是概率概念?

【在 T*******I 的大作中提到】
: 由它们的定义和测量单位而来。
T*******I
发帖数: 5138
123
请问,MLE是最大似然估计的意思吧?

【在 A*******s 的大作中提到】
: why people use MLE?
:
: 0

s*****r
发帖数: 790
124
least square is not statistical method, it is mathematical method.
http://en.wikipedia.org/wiki/Least_squares

【在 D******n 的大作中提到】
: least square,
T*******I
发帖数: 5138
125
It is for both with the same connotations if it is an abstract concept.

【在 s*****r 的大作中提到】
: 那么我先问你,随机变量是统计概念还是概率概念?
T*******I
发帖数: 5138
126
right. just as 加减乘除或对数等一样。

【在 s*****r 的大作中提到】
: least square is not statistical method, it is mathematical method.
: http://en.wikipedia.org/wiki/Least_squares

s*****r
发帖数: 790
127
居然是both?
原来统计也有随机变量,而不是用的概率论中的。
那么统计中的随机变量这个概念,是什么时候发展起来的?

【在 T*******I 的大作中提到】
: It is for both with the same connotations if it is an abstract concept.
s*****r
发帖数: 790
128
陈大师再回答回答这个问题吧。
我还不知道有任何一个统计学家认为统计是人类的最高智慧呢。
您这样的统计学家,对统计的推崇,真是令人钦佩。

【在 s*****r 的大作中提到】
: 你解释一下,什么叫 “统计学中的每一部分并非一定要有概率论作为基础”。
: 给个例子,哪一部份不需要以概率论做基础。如果不是一概率论为基础,那么以什么为
: 基础,或者已经是最基础的了?
: 概率论这么伟大呀?有无之间,把统计从地上变到天上。请问你又怎么得出“人类最高
: 的智慧”这么一个地位的? 至少给几条大的理由吧.

T*******I
发帖数: 5138
129
“居然是both? 原来统计也有随机变量,……”
我对此感到震惊得几乎无语!一个统计专业的人员怎么会说出这样的话?你们在美国学
的统计学究竟是一门什么样的“统计学”?难道你想说统计学里没有随机变量?或者统
计学与随机变量无关?

【在 s*****r 的大作中提到】
: 居然是both?
: 原来统计也有随机变量,而不是用的概率论中的。
: 那么统计中的随机变量这个概念,是什么时候发展起来的?

T*******I
发帖数: 5138
130
是的。这就是我的观点!如果你把统计放到认识论中,你就会得出同样的结论。如果你
把以确定性为导向的数学放在以非确定性为导向的统计学里,你就会发现,数学成了小
儿科,而统计学则拥有了科学中的最高王冠之尊号。

【在 s*****r 的大作中提到】
: 陈大师再回答回答这个问题吧。
: 我还不知道有任何一个统计学家认为统计是人类的最高智慧呢。
: 您这样的统计学家,对统计的推崇,真是令人钦佩。

相关主题
一个统计学的问题,请大家指教Re: 关于肖手术的最新review (转载)
多谢版主解封,并请教“什么是统计学?”Great Confucius
数学家们在统计学领域犯下了几个严重的错误陈来错地方了
进入Statistics版参与讨论
s*****r
发帖数: 790
131
统计里也用对数,难道对数是统计概念?

【在 T*******I 的大作中提到】
: “居然是both? 原来统计也有随机变量,……”
: 我对此感到震惊得几乎无语!一个统计专业的人员怎么会说出这样的话?你们在美国学
: 的统计学究竟是一门什么样的“统计学”?难道你想说统计学里没有随机变量?或者统
: 计学与随机变量无关?

T*******I
发帖数: 5138
132
这位客人的问题非常好。
让我给出一个关于我的方法论的应用实例。
我上大学时所在系的那个年级有两个专业4个小班共计128人从中毕业。如果某个研究者想
用这个班的学生成绩与其所有可能调查得到的p个影响因素建一个回归模型。按照现有
的方法学体系,我们会拥有一个单一的全域模型(fullwise model)。在这个模型里,所
有的有显著性的回归系数都是不变的,意味着无论成绩在整个空间上怎样变化,它与各影
响因素之间的关系是不变的!
现在,我想知道,如果成绩空间被分为三个临界区间,分别为高、中、低,那么,成绩的
变异在各临界空间里与上述m个影响因素之间的关系还是如同全域模型所给定的那样吗?
如何找到分割空间的标准——即两个临界点在哪里?怎样才能找到它们?这个三分法成立
吗——即两个临界点的期望估计是相等的吗?(这个可能性是不能被排除的!)
o***o
发帖数: 43
133
你的方法和threshold model有什么区别?有什么优势?这方面有很多的研究.
还有,为什么你的方法要叫做“方法论”?

者想
,所
各影
绩的
吗?

【在 T*******I 的大作中提到】
: 这位客人的问题非常好。
: 让我给出一个关于我的方法论的应用实例。
: 我上大学时所在系的那个年级有两个专业4个小班共计128人从中毕业。如果某个研究者想
: 用这个班的学生成绩与其所有可能调查得到的p个影响因素建一个回归模型。按照现有
: 的方法学体系,我们会拥有一个单一的全域模型(fullwise model)。在这个模型里,所
: 有的有显著性的回归系数都是不变的,意味着无论成绩在整个空间上怎样变化,它与各影
: 响因素之间的关系是不变的!
: 现在,我想知道,如果成绩空间被分为三个临界区间,分别为高、中、低,那么,成绩的
: 变异在各临界空间里与上述m个影响因素之间的关系还是如同全域模型所给定的那样吗?
: 如何找到分割空间的标准——即两个临界点在哪里?怎样才能找到它们?这个三分法成立

d******e
发帖数: 7844
134
很难想象,长在你脖子上的真的是一颗人类的脑袋

【在 T*******I 的大作中提到】
: ok, drburnie, 这种认真讨论学术的态度我表示敬意。所以,我将履行对你的诺言。
: 这样的话,我的那个集就是一个空集了。
: 我会给出关于这个命题的严谨的论证的。这是一个很大的命题,需要付出很多的努力。
: 我想借此机会告诉大家的是,在12年前的那场艰难痛苦的思考里,我已经基本完成了
: 这个论证。我现在需要做的就是整理那时的思路,并找个时间完成它。
: 不过,我现在的主要精力不在这个问题上。它无论对于我个人还是对于统计学本身都
: 不是很急迫,因为,结论我已经给出了。

T*******I
发帖数: 5138
135
我没有说只有我的方法才能被称为“方法论”,全部统计方法构成了“方法论”这个集
合。
我的方法与现有方法存在着重大的,或者说根本的区别。我的方法中的临界点是一个期望
估计和可信区间估计,亦即意味着由这个期望临界点组成的集合,决定了期望临界模型这
个集合。而现有的方法论完全违反了统计学的基本公理体系,而成为不可接受的方法论。

【在 o***o 的大作中提到】
: 你的方法和threshold model有什么区别?有什么优势?这方面有很多的研究.
: 还有,为什么你的方法要叫做“方法论”?
:
: 者想
: ,所
: 各影
: 绩的
: 吗?

T*******I
发帖数: 5138
136
有人就我提出的应用实例有过自己的独立思考吗?若有,请发表你的看法。谢谢。

【在 T*******I 的大作中提到】
: 这位客人的问题非常好。
: 让我给出一个关于我的方法论的应用实例。
: 我上大学时所在系的那个年级有两个专业4个小班共计128人从中毕业。如果某个研究者想
: 用这个班的学生成绩与其所有可能调查得到的p个影响因素建一个回归模型。按照现有
: 的方法学体系,我们会拥有一个单一的全域模型(fullwise model)。在这个模型里,所
: 有的有显著性的回归系数都是不变的,意味着无论成绩在整个空间上怎样变化,它与各影
: 响因素之间的关系是不变的!
: 现在,我想知道,如果成绩空间被分为三个临界区间,分别为高、中、低,那么,成绩的
: 变异在各临界空间里与上述m个影响因素之间的关系还是如同全域模型所给定的那样吗?
: 如何找到分割空间的标准——即两个临界点在哪里?怎样才能找到它们?这个三分法成立

s*****r
发帖数: 790
137
陈大师再解释一下,统计学里的随机变量和概率里的有什么区别? 是独立发展起来的
么?或者先于概率发展起来?

【在 T*******I 的大作中提到】
: “居然是both? 原来统计也有随机变量,……”
: 我对此感到震惊得几乎无语!一个统计专业的人员怎么会说出这样的话?你们在美国学
: 的统计学究竟是一门什么样的“统计学”?难道你想说统计学里没有随机变量?或者统
: 计学与随机变量无关?

T*******I
发帖数: 5138
138
那好,请你详细比较一下我的方法与现有方法在哪些方面不同?各有什么理论基础?
各有何优缺点?
可以自信地告诉大家,如果一个分析逻辑是正确的,则一个方法并不需要一个所谓的
random simulation 来验证,因为验证的结果一定是非常理想的.

【在 o***o 的大作中提到】
: 你的方法和threshold model有什么区别?有什么优势?这方面有很多的研究.
: 还有,为什么你的方法要叫做“方法论”?
:
: 者想
: ,所
: 各影
: 绩的
: 吗?

T*******I
发帖数: 5138
139
说实在的,我从未研究过这个问题。我也从未意识到这会成为一个问题。
如果两者在学科发生学上确曾有过分离,那么,现在它们应该统一起来了。没有区别。

【在 s*****r 的大作中提到】
: 陈大师再解释一下,统计学里的随机变量和概率里的有什么区别? 是独立发展起来的
: 么?或者先于概率发展起来?

A*******s
发帖数: 3942
140
你要是没有simulation,又没有validation,怎么证明你的model更好?

【在 T*******I 的大作中提到】
: 那好,请你详细比较一下我的方法与现有方法在哪些方面不同?各有什么理论基础?
: 各有何优缺点?
: 可以自信地告诉大家,如果一个分析逻辑是正确的,则一个方法并不需要一个所谓的
: random simulation 来验证,因为验证的结果一定是非常理想的.

相关主题
陈来错地方了也从工程的角度给陈老师提个意见吧.
陈大师, 我很好奇好奇问陈老师一个问题
居然还有人试图和陈大师讨论统计问题临界回归模型的连续性
进入Statistics版参与讨论
T*******I
发帖数: 5138
141
实际上我做了simulation for both mine and a current one, the classical
segmented regression, in just 500 simulated samples。这是一个很小规模
的模拟试验。但已经足够了。用传统的方法估计的临界点极其不稳定,而用我的
方法估计的结果非常的收敛、稳定且有可信区间。

【在 A*******s 的大作中提到】
: 你要是没有simulation,又没有validation,怎么证明你的model更好?
s*****r
发帖数: 790
142
既然如此,你不觉得你的如下回答太武断了么?
发信人: TNEGIETNI (lovewisdom), 信区: Statistics
标 题: Re: 答水泡泡:陈立功是谁教出来的?
发信站: BBS 未名空间站 (Fri Oct 1 22:51:42 2010, 美东)
“居然是both? 原来统计也有随机变量,……”
我对此感到震惊得几乎无语!一个统计专业的人员怎么会说出这样的话?你们在美国学
的统计学究竟是一门什么样的“统计学”?难道你想说统计学里没有随机变量?或者统
计学与随机变量无关?

【在 s*****r 的大作中提到】
: 居然是both?
: 原来统计也有随机变量,而不是用的概率论中的。
: 那么统计中的随机变量这个概念,是什么时候发展起来的?

T*******I
发帖数: 5138
143
我的临界点的可信区间不是由bootstrap法得到的,而是由原始样本直接得到的。

【在 T*******I 的大作中提到】
: 实际上我做了simulation for both mine and a current one, the classical
: segmented regression, in just 500 simulated samples。这是一个很小规模
: 的模拟试验。但已经足够了。用传统的方法估计的临界点极其不稳定,而用我的
: 方法估计的结果非常的收敛、稳定且有可信区间。

T*******I
发帖数: 5138
144
如果按照我提出的算法来估计临界点集合的话,cross-validation显然是不再需要的了
,因为不会存在一个比由全部随机样本点的假设估计得到的稳定的期望估计更稳定和更
可靠的临界点集合了。

【在 A*******s 的大作中提到】
: 你要是没有simulation,又没有validation,怎么证明你的model更好?
T*******I
发帖数: 5138
145
因为在我初入统计学时,对随机变量的解释由于结合医学观察数据库中的随机现象的表
现形式已经是很清楚的概念了。

【在 s*****r 的大作中提到】
: 既然如此,你不觉得你的如下回答太武断了么?
: 发信人: TNEGIETNI (lovewisdom), 信区: Statistics
: 标 题: Re: 答水泡泡:陈立功是谁教出来的?
: 发信站: BBS 未名空间站 (Fri Oct 1 22:51:42 2010, 美东)
: “居然是both? 原来统计也有随机变量,……”
: 我对此感到震惊得几乎无语!一个统计专业的人员怎么会说出这样的话?你们在美国学
: 的统计学究竟是一门什么样的“统计学”?难道你想说统计学里没有随机变量?或者统
: 计学与随机变量无关?

A*******s
发帖数: 3942
146
我不太清楚你的model和spline里面的CV是拿来干嘛的
但是别的方法里面,CV是拿来干model selection和model validation的

【在 T*******I 的大作中提到】
: 如果按照我提出的算法来估计临界点集合的话,cross-validation显然是不再需要的了
: ,因为不会存在一个比由全部随机样本点的假设估计得到的稳定的期望估计更稳定和更
: 可靠的临界点集合了。

c****1
发帖数: 1095
147
mark.
d*******e
发帖数: 1649
148
强贴留名
d******e
发帖数: 7844
149
你是脑残教出来的?

【在 T*******I 的大作中提到】
: 因为在我初入统计学时,对随机变量的解释由于结合医学观察数据库中的随机现象的表
: 现形式已经是很清楚的概念了。

s*****r
发帖数: 790
150
很清楚了?这样吧,让我们看看你对随机变量的理解吧。以下是wiki对random
variable 的定义。你就告诉我们你理解里面牵扯到的每一个名词么?例如,
probability space, measurable space .
http://en.wikipedia.org/wiki/Random_variable
就算你理解随即变量在医学观察中的应用,但是你显然不知道怎样把这个现象抽象成一
个准确的概念。这也是大家质疑你所谓文章里的那些定义的缘由。
你要推翻一个已经well established, widely accepted的科学分支,首先你要理解那
个分支。很显然,这边的大多数人,都不认为你理解了。同时这边的人质疑你的理论,
是因为你的定义就不准确,完整,无法理解。
如果你不嫌弃的话,我再给你一个忠告。统计的理论基础是概率论和数学,是基于概率
论和数学的一门应用学科。所以统计学的理论,看上去就跟数学一样。你的所谓研究,
是统计学的理论研究,所以一定需要准确的数学描述。你还是加强自己的数学功底吧,
否则描述出来的东西,贻笑大方呀。
再挑一个刺,你在你自己的wiki里面反复

【在 T*******I 的大作中提到】
: 因为在我初入统计学时,对随机变量的解释由于结合医学观察数据库中的随机现象的表
: 现形式已经是很清楚的概念了。

相关主题
陈大师不是民科如果你不是孬种数学背景的统计学家,请接受挑战
网上哪位比较熟悉分段回归的,能否简单介绍一下其基本的方法论?陈大师的两大硬伤和两大法宝
统计学的新地平线——陈立功与他的自权重曲线陈大师居然在维基百科上大放厥词
进入Statistics版参与讨论
b*****o
发帖数: 482
151
他在系里做个报告都是应邀的

【在 s*****r 的大作中提到】
: 很清楚了?这样吧,让我们看看你对随机变量的理解吧。以下是wiki对random
: variable 的定义。你就告诉我们你理解里面牵扯到的每一个名词么?例如,
: probability space, measurable space .
: http://en.wikipedia.org/wiki/Random_variable
: 就算你理解随即变量在医学观察中的应用,但是你显然不知道怎样把这个现象抽象成一
: 个准确的概念。这也是大家质疑你所谓文章里的那些定义的缘由。
: 你要推翻一个已经well established, widely accepted的科学分支,首先你要理解那
: 个分支。很显然,这边的大多数人,都不认为你理解了。同时这边的人质疑你的理论,
: 是因为你的定义就不准确,完整,无法理解。
: 如果你不嫌弃的话,我再给你一个忠告。统计的理论基础是概率论和数学,是基于概率

P****D
发帖数: 11146
152
过来看下最新进展。大家都很开心哈哈。

【在 b*****o 的大作中提到】
: 他在系里做个报告都是应邀的
T*******I
发帖数: 5138
153
在我的方法里,每个期望的临界点都被处理为一个随机变量,且被定义在被分割变量的
一个可测空间(这应该是概率论中的基本概念了)里。由此,每个随机临界点的期望估
计必然伴随着一个可信区间。这个思路就是经典的统计思路。如果没有可信区间,临界
点就成了一个由所有被测点的共同期望所估计的、不变的随机点估计。
反观现有的方法论,它们不是把临界点这个随机现象定义在一个可测空间里,而是定义
在一个联立方程组的共解之上。这是一个孤立的随机点估计,没有可信区间,除非采用
bootstrap法。按照我在文章里指出的那样,这个联立解不是一个随机变量,意味着以此
方法估计的临界点也不是一个随机变量,既然它不是由一个随机变量获得的估计,那么,
它怎么可以被称为是一个statistic(统计量)?这岂不是真真地颠覆了统计学么?
在我看来,CV不应该是被用来做模型选择的,因为除了期望临界点外,没有比它更好的
了。这就好比用一个连续型随机变量的抽样均数对总体均数作期望估计并需要一个可信
区间一样,这里已经没有了任何其它更好的选择。临界点的可信区间不过是用来作为控
制空间关系变异时的参考范围而已。

【在 A*******s 的大作中提到】
: 我不太清楚你的model和spline里面的CV是拿来干嘛的
: 但是别的方法里面,CV是拿来干model selection和model validation的

T*******I
发帖数: 5138
154
搞概率论的人都知道,直接将其中的基本概念引入统计学来解释统计学的理论基础还存
在一定的距离。很多在统计学领域应该是浅显的概念,在概率论中变得比较复杂化和数
学理论化。一个没有学过概率论的人可以很好地使用统计学的方法论。这是有目共睹的。
相反,我至今没有看到一部直接用概率论的概念系统来论述应用统计学原理的著作,除
了数理统计学以外。
这个现象说明了什么呢?说明了这种直接引入的困难。但人们认识世界却应该是个非常
简单的事情。
就我个人不太透彻的理解,probability space, measurable space以及sample space
等都应该是很直观的概念。没什么可玄乎的。

【在 s*****r 的大作中提到】
: 很清楚了?这样吧,让我们看看你对随机变量的理解吧。以下是wiki对random
: variable 的定义。你就告诉我们你理解里面牵扯到的每一个名词么?例如,
: probability space, measurable space .
: http://en.wikipedia.org/wiki/Random_variable
: 就算你理解随即变量在医学观察中的应用,但是你显然不知道怎样把这个现象抽象成一
: 个准确的概念。这也是大家质疑你所谓文章里的那些定义的缘由。
: 你要推翻一个已经well established, widely accepted的科学分支,首先你要理解那
: 个分支。很显然,这边的大多数人,都不认为你理解了。同时这边的人质疑你的理论,
: 是因为你的定义就不准确,完整,无法理解。
: 如果你不嫌弃的话,我再给你一个忠告。统计的理论基础是概率论和数学,是基于概率

T*******I
发帖数: 5138
155
我没有说我“三次”应JSM之邀。但第一次确实是。因为那时我在国内,我都甚至不知道
我的文章被这个会议录用,因为那时我连这个会议本身都不知道。我只是将文章投给了
当年9月在北京召开的国际公共卫生联盟大会,而这个会议的主席(但也可能是与统计有
关的小组的主席。具体已经无法确认了)是美国CDC搞统计的。所以,我怀疑是否是他推
荐的,因为我的文章讨论的是用一个方法论在疾病控制领域找临界点以修正控制策略从而
降低成本,也就是说,这样的临界点是有实际意义的点。我是当年唯一从国内来的。
我是直到5月初过后才突然间得到会议邀请通知的。我想,每一个参加JSM会议的人都早在
此前就已经收到通知了吧。邀请人说,由于所有资助早已在二月份就发放完毕,所以,如
果我决定参加的话,需要自己找资助。于是,我到教育部找到了资助。
回国之后很快就发现自己的算法很幼稚,因为我与所有人一样,采用了最优化作为模型选
择的准则。所以,当会议proceedings发来邮件要我提交全文时,我放弃了。因此,大家
只能在2000 JSM上找到一个摘要。但,仅此摘要已经突显了我与众不同的思路:我没有采
用解联立方程组的方式估计临界点!这是

【在 s*****r 的大作中提到】
: 很清楚了?这样吧,让我们看看你对随机变量的理解吧。以下是wiki对random
: variable 的定义。你就告诉我们你理解里面牵扯到的每一个名词么?例如,
: probability space, measurable space .
: http://en.wikipedia.org/wiki/Random_variable
: 就算你理解随即变量在医学观察中的应用,但是你显然不知道怎样把这个现象抽象成一
: 个准确的概念。这也是大家质疑你所谓文章里的那些定义的缘由。
: 你要推翻一个已经well established, widely accepted的科学分支,首先你要理解那
: 个分支。很显然,这边的大多数人,都不认为你理解了。同时这边的人质疑你的理论,
: 是因为你的定义就不准确,完整,无法理解。
: 如果你不嫌弃的话,我再给你一个忠告。统计的理论基础是概率论和数学,是基于概率

T*******I
发帖数: 5138
156
没错。我没夸张,因为我在系里不是搞教学和研究的人员,仅仅只是搞数据分析,日常
工作里没有这方面的职责。我的研究没有一分钱的经费,也没有理论或应用课题,纯粹
是个人兴趣所至。

【在 b*****o 的大作中提到】
: 他在系里做个报告都是应邀的
A*******s
发帖数: 3942
157
你知道CV的目的是啥么?我怎么觉得你对CV一点都不懂

以此
么,

【在 T*******I 的大作中提到】
: 在我的方法里,每个期望的临界点都被处理为一个随机变量,且被定义在被分割变量的
: 一个可测空间(这应该是概率论中的基本概念了)里。由此,每个随机临界点的期望估
: 计必然伴随着一个可信区间。这个思路就是经典的统计思路。如果没有可信区间,临界
: 点就成了一个由所有被测点的共同期望所估计的、不变的随机点估计。
: 反观现有的方法论,它们不是把临界点这个随机现象定义在一个可测空间里,而是定义
: 在一个联立方程组的共解之上。这是一个孤立的随机点估计,没有可信区间,除非采用
: bootstrap法。按照我在文章里指出的那样,这个联立解不是一个随机变量,意味着以此
: 方法估计的临界点也不是一个随机变量,既然它不是由一个随机变量获得的估计,那么,
: 它怎么可以被称为是一个statistic(统计量)?这岂不是真真地颠覆了统计学么?
: 在我看来,CV不应该是被用来做模型选择的,因为除了期望临界点外,没有比它更好的

T*******I
发帖数: 5138
158
我应当承认这一点,因为你所说的这个CV是在你的概念系统下的概念。
在我的方法中没有CV这个概念,因为所有临界点都是由可测空间里的全部样本点对临界点
的期望的加权贡献估计的,因而是最稳定可靠的,且是唯一的期望,何来需要对它们做CV
一说?难道说我们需要对一个样本均数本身做CV? 果真如此,岂不荒谬?
鉴于我们俩对关于临界回归分析中CV的理解不一致,恳请你谈谈你的CV的基本分析逻辑是
怎样的,算法如何,应该如何理解它。谢谢。
顺便解释一下我的方法中临界点的可信区间是一个非对称区间的原因。首先,我的CI与一
般用样本均数估计总体均数时的CI没有本质的区别,差别仅仅在于我的CI是一个经过加权
和非对称处理过的而已。之所以要做非对称校正,是因为临界点在被分割变量上其两侧的
密度分布可能不一致。这是与一般正态分布下估计CI

【在 A*******s 的大作中提到】
: 你知道CV的目的是啥么?我怎么觉得你对CV一点都不懂
:
: 以此
: 么,

A*******s
发帖数: 3942
159
一般的建模里面,k-fold CV多用于估计generalization error(model validation)
,或用于决定参数的多少和形式(model selection)。至于参数本身的估计
expectation和variance(model fitting),当然是用整个sample做的。
我没看过你的论文,我也完全不懂piecewise regression, 但就你所说的CV,我有点怀
疑你根本不懂。

一般
非对
度分

【在 T*******I 的大作中提到】
: 我应当承认这一点,因为你所说的这个CV是在你的概念系统下的概念。
: 在我的方法中没有CV这个概念,因为所有临界点都是由可测空间里的全部样本点对临界点
: 的期望的加权贡献估计的,因而是最稳定可靠的,且是唯一的期望,何来需要对它们做CV
: 一说?难道说我们需要对一个样本均数本身做CV? 果真如此,岂不荒谬?
: 鉴于我们俩对关于临界回归分析中CV的理解不一致,恳请你谈谈你的CV的基本分析逻辑是
: 怎样的,算法如何,应该如何理解它。谢谢。
: 顺便解释一下我的方法中临界点的可信区间是一个非对称区间的原因。首先,我的CI与一
: 般用样本均数估计总体均数时的CI没有本质的区别,差别仅仅在于我的CI是一个经过加权
: 和非对称处理过的而已。之所以要做非对称校正,是因为临界点在被分割变量上其两侧的
: 密度分布可能不一致。这是与一般正态分布下估计CI

A*******s
发帖数: 3942
160
靠,你难道不一直在说cross validation?

一般
非对
度分
计算
现在

【在 T*******I 的大作中提到】
: 我应当承认这一点,因为你所说的这个CV是在你的概念系统下的概念。
: 在我的方法中没有CV这个概念,因为所有临界点都是由可测空间里的全部样本点对临界点
: 的期望的加权贡献估计的,因而是最稳定可靠的,且是唯一的期望,何来需要对它们做CV
: 一说?难道说我们需要对一个样本均数本身做CV? 果真如此,岂不荒谬?
: 鉴于我们俩对关于临界回归分析中CV的理解不一致,恳请你谈谈你的CV的基本分析逻辑是
: 怎样的,算法如何,应该如何理解它。谢谢。
: 顺便解释一下我的方法中临界点的可信区间是一个非对称区间的原因。首先,我的CI与一
: 般用样本均数估计总体均数时的CI没有本质的区别,差别仅仅在于我的CI是一个经过加权
: 和非对称处理过的而已。之所以要做非对称校正,是因为临界点在被分割变量上其两侧的
: 密度分布可能不一致。这是与一般正态分布下估计CI

相关主题
那些挺陈大师的多谢版主解封,并请教“什么是统计学?”
let's settle this once and for all数学家们在统计学领域犯下了几个严重的错误
一个统计学的问题,请大家指教Re: 关于肖手术的最新review (转载)
进入Statistics版参与讨论
s*****r
发帖数: 790
161
你的回答,令我无话可说。看来你真的明白/相信你自己所说的,但是我真切地希望你
不要理解错我无话可说的意思。
谢谢。

的。
space

【在 T*******I 的大作中提到】
: 搞概率论的人都知道,直接将其中的基本概念引入统计学来解释统计学的理论基础还存
: 在一定的距离。很多在统计学领域应该是浅显的概念,在概率论中变得比较复杂化和数
: 学理论化。一个没有学过概率论的人可以很好地使用统计学的方法论。这是有目共睹的。
: 相反,我至今没有看到一部直接用概率论的概念系统来论述应用统计学原理的著作,除
: 了数理统计学以外。
: 这个现象说明了什么呢?说明了这种直接引入的困难。但人们认识世界却应该是个非常
: 简单的事情。
: 就我个人不太透彻的理解,probability space, measurable space以及sample space
: 等都应该是很直观的概念。没什么可玄乎的。

T*******I
发帖数: 5138
162
由于误会。建议删除这个。我已经对上述内容作了修改。请根据修改后的内容作答。
你删除这个后,我的这个建议贴也会被删除。
权作建议,酌情处理。谢谢。

【在 A*******s 的大作中提到】
: 靠,你难道不一直在说cross validation?
:
: 一般
: 非对
: 度分
: 计算
: 现在

d******e
发帖数: 7844
163
你说你跟陈大师还有啥好说的?

【在 A*******s 的大作中提到】
: 靠,你难道不一直在说cross validation?
:
: 一般
: 非对
: 度分
: 计算
: 现在

T*******I
发帖数: 5138
164
你这个回帖没有说清楚。名词和术语一大堆,但没有解释,因而无法让人对CV的分析
逻辑有个清楚的picture,即什么是一个CV?它的逻辑来源是什么?——即为什么要对
model做validation?CV算法的构造是怎样的?统计量如何解释?
由于你没看过我的论文,因此,你不知道我的临界点是如何估计的,它有什么性质,它
与临界模型间的关系是怎样的,等等。如果你希望我讨论CV在我的方法中的地位,我只
能说,它没有必要。

【在 A*******s 的大作中提到】
: 一般的建模里面,k-fold CV多用于估计generalization error(model validation)
: ,或用于决定参数的多少和形式(model selection)。至于参数本身的估计
: expectation和variance(model fitting),当然是用整个sample做的。
: 我没看过你的论文,我也完全不懂piecewise regression, 但就你所说的CV,我有点怀
: 疑你根本不懂。
:
: 一般
: 非对
: 度分

T*******I
发帖数: 5138
165
如果你觉得我说的有误。这没有什么,因为从上面的讨论看,我们对统计学、概率论、
数学、哲学特别是认识论等的认识存在着重大的分歧。就当成是学术分歧好了。
请相互包容。
如果你能推荐一本根据概率论的基本概念系统写的应用统计学专著,我愿意花点时间
来学习。我在这方面信息比较闭塞,还请多帮助。

【在 s*****r 的大作中提到】
: 你的回答,令我无话可说。看来你真的明白/相信你自己所说的,但是我真切地希望你
: 不要理解错我无话可说的意思。
: 谢谢。
:
: 的。
: space

d******e
发帖数: 7844
166
Cross Validation的算法还用别人给你讲啊?但凡学过点统计课程都知道怎么回事啊,
呵呵。
http://en.wikipedia.org/wiki/Cross-validation_(statistics)

【在 T*******I 的大作中提到】
: 你这个回帖没有说清楚。名词和术语一大堆,但没有解释,因而无法让人对CV的分析
: 逻辑有个清楚的picture,即什么是一个CV?它的逻辑来源是什么?——即为什么要对
: model做validation?CV算法的构造是怎样的?统计量如何解释?
: 由于你没看过我的论文,因此,你不知道我的临界点是如何估计的,它有什么性质,它
: 与临界模型间的关系是怎样的,等等。如果你希望我讨论CV在我的方法中的地位,我只
: 能说,它没有必要。

d******e
发帖数: 7844
167
问题是你读得懂么?

如果你觉得我说的有误。这没有什么,因为从上面的讨论看,我们对统计学、概率论、
数学、哲学特别是认识论等的认识存在着重大的分歧。就当成是学术分歧好了。
请相互包容。
如果你能推荐一本根据概率论的基本概念系统写的应用统计学专著,我愿意花点时间
来学习。我在这方面信息比较闭塞,还请多帮助。

【在 T*******I 的大作中提到】
: 如果你觉得我说的有误。这没有什么,因为从上面的讨论看,我们对统计学、概率论、
: 数学、哲学特别是认识论等的认识存在着重大的分歧。就当成是学术分歧好了。
: 请相互包容。
: 如果你能推荐一本根据概率论的基本概念系统写的应用统计学专著,我愿意花点时间
: 来学习。我在这方面信息比较闭塞,还请多帮助。

T*******I
发帖数: 5138
168
如果一个关于如何认识世界的方法论我读不懂,我就要问写书的人他写的是什么东西?
我是否读得懂,请提供了我需要的书,并让我做了回应后再发评论。

【在 d******e 的大作中提到】
: 问题是你读得懂么?
:
: 如果你觉得我说的有误。这没有什么,因为从上面的讨论看,我们对统计学、概率论、
: 数学、哲学特别是认识论等的认识存在着重大的分歧。就当成是学术分歧好了。
: 请相互包容。
: 如果你能推荐一本根据概率论的基本概念系统写的应用统计学专著,我愿意花点时间
: 来学习。我在这方面信息比较闭塞,还请多帮助。

d******e
发帖数: 7844
169
前面就有人推荐过,你仔细看了么?
Jun Shao的Mathematical Statistics,绝对是好书,既然你号称是资深统计学家,读
起来应该没啥问题吧。
btw: 读不懂就承认,别赖人家写的不好。

【在 T*******I 的大作中提到】
: 如果一个关于如何认识世界的方法论我读不懂,我就要问写书的人他写的是什么东西?
: 我是否读得懂,请提供了我需要的书,并让我做了回应后再发评论。

T*******I
发帖数: 5138
170
hi drburnie,谢谢提供的信息。
读完后,我想我大致明白了CV的分析逻辑是怎么回事。但我实在难以把它与我的方法关联
起来。
我在前面给出过关于成绩的分段模型的应用实例,可否请你根据其中提出的分析问题和解
决思路把CV与此关联起来?
谢谢!

【在 d******e 的大作中提到】
: Cross Validation的算法还用别人给你讲啊?但凡学过点统计课程都知道怎么回事啊,
: 呵呵。
: http://en.wikipedia.org/wiki/Cross-validation_(statistics)

相关主题
Re: 关于肖手术的最新review (转载)陈大师, 我很好奇
Great Confucius居然还有人试图和陈大师讨论统计问题
陈来错地方了也从工程的角度给陈老师提个意见吧.
进入Statistics版参与讨论
T*******I
发帖数: 5138
171
哪里能弄到这本书?根据书名,这应该是一本数理统计的理论著作,而非我期望的“用
概率论的基本概念系统”阐述的应用统计专著。不过,如果能弄到,我愿意读。我可能
会被那些令人眼花缭乱的数学表述弄昏头,但我相信透过那些表面上的花哨,我会从中
发现其基本的分析逻辑。这难不倒我,因为我们的逻辑系统是一样的。

【在 d******e 的大作中提到】
: 前面就有人推荐过,你仔细看了么?
: Jun Shao的Mathematical Statistics,绝对是好书,既然你号称是资深统计学家,读
: 起来应该没啥问题吧。
: btw: 读不懂就承认,别赖人家写的不好。

b*****o
发帖数: 482
172
我可能会被那些令人眼花缭乱的数学表述弄昏头
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
<数理统计学引论>你读了6页
<概率论基础>你读了100页
合着你根本就读不懂数学书啊.

【在 T*******I 的大作中提到】
: 哪里能弄到这本书?根据书名,这应该是一本数理统计的理论著作,而非我期望的“用
: 概率论的基本概念系统”阐述的应用统计专著。不过,如果能弄到,我愿意读。我可能
: 会被那些令人眼花缭乱的数学表述弄昏头,但我相信透过那些表面上的花哨,我会从中
: 发现其基本的分析逻辑。这难不倒我,因为我们的逻辑系统是一样的。

T*******I
发帖数: 5138
173
我读过的部分读懂了,尽管不能在合上书本后复述出来。
这并不重要。重要的是,你能否驳倒我提出那个关于分段回归的完整的分析逻辑以及详
尽的统计算法!!
你有本事不妨试试看!驳不倒就不要拿人家的弱点论事!

【在 b*****o 的大作中提到】
: 我可能会被那些令人眼花缭乱的数学表述弄昏头
: ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
: <数理统计学引论>你读了6页
: <概率论基础>你读了100页
: 合着你根本就读不懂数学书啊.

b*****o
发帖数: 482
174
这个不是嘲笑在你的弱点. 问题是你连最最基本的统计书都没读懂过, 我不明白你那些颠覆整个统计学的理论是怎么研究出来的.
就像一个不会游泳的人跟人吹嘘他打破了世界纪录一样.
别人说, 你狗刨都不会, 乍打破世界纪录的.
他说, 你有本事证明我没打破啊, 拿我不会游泳这个弱点说事干嘛.

【在 T*******I 的大作中提到】
: 我读过的部分读懂了,尽管不能在合上书本后复述出来。
: 这并不重要。重要的是,你能否驳倒我提出那个关于分段回归的完整的分析逻辑以及详
: 尽的统计算法!!
: 你有本事不妨试试看!驳不倒就不要拿人家的弱点论事!

T*******I
发帖数: 5138
175
陈希孺的那本书,开篇讲的是卡方分布的定义和证明!接下来t-分布、F-分布等的定义
和证明。这是与众不同的。

有可能读懂了.
些颠覆整个统计学

【在 b*****o 的大作中提到】
: 这个不是嘲笑在你的弱点. 问题是你连最最基本的统计书都没读懂过, 我不明白你那些颠覆整个统计学的理论是怎么研究出来的.
: 就像一个不会游泳的人跟人吹嘘他打破了世界纪录一样.
: 别人说, 你狗刨都不会, 乍打破世界纪录的.
: 他说, 你有本事证明我没打破啊, 拿我不会游泳这个弱点说事干嘛.

T*******I
发帖数: 5138
176
我想请问你,读了我的文章中关于随机变量的9条性质以及关于统计学的7个公理性
陈述没有?这些性质和陈述的抽象需要什么样的数学方法?笑话!它们根本不需要
数学!它们是哲学性的陈述!更何况我已经尽了很大的努力试着用数学的语言风格
来表述它们。
你如果想要用更好的数学语言风格表述也没什么不可。

【在 b*****o 的大作中提到】
: 这个不是嘲笑在你的弱点. 问题是你连最最基本的统计书都没读懂过, 我不明白你那些颠覆整个统计学的理论是怎么研究出来的.
: 就像一个不会游泳的人跟人吹嘘他打破了世界纪录一样.
: 别人说, 你狗刨都不会, 乍打破世界纪录的.
: 他说, 你有本事证明我没打破啊, 拿我不会游泳这个弱点说事干嘛.

c****u
发帖数: 243
177
如果陈大师有背景,像前武大校长之子的背景,
回国应该有用武之地,可惜的是没有背景,
而忽悠水平连普通本科生也很难唬倒,
可惜了一身武艺
T*******I
发帖数: 5138
178
我再问你一遍:你的数理统计、概率论学得那么好,你能否驳倒我提出那个关于分段
回归的完整的分析逻辑以及详尽的统计算法!!(请不要说,啊,你是民科,不屑于
驳你。)
它们总共只有6句话。每句话只有30个单词以内长。读完它们对于你可能只需30秒钟。
驳不倒就不要在此炫耀自己的学识!
我再重申一次:我没有颠覆整个统计学! 那是颠覆不了的。我颠覆的是建立在确定性
假设基础上的错误的方法 since nothing can be assumed for randomness!

【在 b*****o 的大作中提到】
: 这个不是嘲笑在你的弱点. 问题是你连最最基本的统计书都没读懂过, 我不明白你那些颠覆整个统计学的理论是怎么研究出来的.
: 就像一个不会游泳的人跟人吹嘘他打破了世界纪录一样.
: 别人说, 你狗刨都不会, 乍打破世界纪录的.
: 他说, 你有本事证明我没打破啊, 拿我不会游泳这个弱点说事干嘛.

T*******I
发帖数: 5138
179
To betatwo:
怎么样?敢接受这样的挑战吗?你有数理统计和概率论等如此强大而坚实的理论基础作
支柱,驳倒它们岂不易如反掌?
我等着。

【在 T*******I 的大作中提到】
: 我再问你一遍:你的数理统计、概率论学得那么好,你能否驳倒我提出那个关于分段
: 回归的完整的分析逻辑以及详尽的统计算法!!(请不要说,啊,你是民科,不屑于
: 驳你。)
: 它们总共只有6句话。每句话只有30个单词以内长。读完它们对于你可能只需30秒钟。
: 驳不倒就不要在此炫耀自己的学识!
: 我再重申一次:我没有颠覆整个统计学! 那是颠覆不了的。我颠覆的是建立在确定性
: 假设基础上的错误的方法 since nothing can be assumed for randomness!

b*****o
发帖数: 482
180
你那篇文章我捏着鼻子读了一下, 实在是不知所云.
你可不可以告诉我, 根据你的研究, 现有的方法哪儿错了, 会导致怎样错误的结论. 可以举一个实际的
例子吗?

【在 T*******I 的大作中提到】
: 我再问你一遍:你的数理统计、概率论学得那么好,你能否驳倒我提出那个关于分段
: 回归的完整的分析逻辑以及详尽的统计算法!!(请不要说,啊,你是民科,不屑于
: 驳你。)
: 它们总共只有6句话。每句话只有30个单词以内长。读完它们对于你可能只需30秒钟。
: 驳不倒就不要在此炫耀自己的学识!
: 我再重申一次:我没有颠覆整个统计学! 那是颠覆不了的。我颠覆的是建立在确定性
: 假设基础上的错误的方法 since nothing can be assumed for randomness!

相关主题
好奇问陈老师一个问题网上哪位比较熟悉分段回归的,能否简单介绍一下其基本的方法论?
临界回归模型的连续性统计学的新地平线——陈立功与他的自权重曲线
陈大师不是民科如果你不是孬种数学背景的统计学家,请接受挑战
进入Statistics版参与讨论
d******e
发帖数: 7844
181
陈大师最好顺便提供点Real Data的结果。

可以举一个实际的

【在 b*****o 的大作中提到】
: 你那篇文章我捏着鼻子读了一下, 实在是不知所云.
: 你可不可以告诉我, 根据你的研究, 现有的方法哪儿错了, 会导致怎样错误的结论. 可以举一个实际的
: 例子吗?

T*******I
发帖数: 5138
182
请你先接受上述挑战,用6个或更少或更多的陈述来批驳我的分析逻辑。
当你完成了这个工作,我就展开下一步的讨论。不然,永远争论下去没完没了。这种无意义的争论纯粹是浪费口舌和情感。

【在 b*****o 的大作中提到】
: 你那篇文章我捏着鼻子读了一下, 实在是不知所云.
: 你可不可以告诉我, 根据你的研究, 现有的方法哪儿错了, 会导致怎样错误的结论. 可以举一个实际的
: 例子吗?

b*****o
发帖数: 482
183
陈老师, 就让我们暂时认为你的逻辑分析完全正确吧.
那你可不可以举一个具体的例子, 一般的统计方法会怎么分析, 错误在哪儿. 你的方法
会怎么分析.

无意义的争论纯
粹是浪费口舌和情感。

【在 T*******I 的大作中提到】
: 请你先接受上述挑战,用6个或更少或更多的陈述来批驳我的分析逻辑。
: 当你完成了这个工作,我就展开下一步的讨论。不然,永远争论下去没完没了。这种无意义的争论纯粹是浪费口舌和情感。

T*******I
发帖数: 5138
184
我的研究领域是分段回归,即试图在样本空间里找到一个或多个有显著意义的临界点,
以此为根据建立临界模型,从而可以在不同的临界空间里建立可变的回归关系。
在这个领域里,数据迭代、最优化、强制连续性假设以及平滑处理技术是当前方法的核
心支柱。可是,最优化是一个理论错误(见我的论证过程)、强制连续性的假设是一个
确定性的假设,并由此引出了各种smoothing techniques。所以,我说现有的方法论在
统计学中不可接受。
我们需要新的分析逻辑和新的算法。

【在 b*****o 的大作中提到】
: 陈老师, 就让我们暂时认为你的逻辑分析完全正确吧.
: 那你可不可以举一个具体的例子, 一般的统计方法会怎么分析, 错误在哪儿. 你的方法
: 会怎么分析.
:
: 无意义的争论纯
: 粹是浪费口舌和情感。

T*******I
发帖数: 5138
185
我有。是一个关于冠心病的发生危险因素的多变量logistic回归模型,它在2007年
的JSM proceedings中。然而,这实际是不需要的。我当时之所以要用实例和随机模
拟试验来支持自己的方法,是因为我还没有找到强有力的理论作为支持。现在,仅通
过理论分析就足以颠覆现有的分析方法。
事实上,我做的分段回归不是仅仅在二维空间里的,而是n(n>=2)维(连续型随机变
量+离散型随机变量的混合空间)。
最后,你们为什么不找个样本(建议100~200例以内)按照我设计的算法算一个三分
模型试试看呢?相信你们会被结果震撼得跌破眼睛的。

【在 d******e 的大作中提到】
: 陈大师最好顺便提供点Real Data的结果。
:
: 可以举一个实际的

d******e
发帖数: 7844
186
大师啊,凭什么不可以假设Continuity和Smoothness?
大师啊,这么多人在使用Linear Model,你为什么不去质疑Linearity的Assumption啊?
Nonlinear Model随处可见,可哪个人说Nonlinear Model颠覆传统的Linear Model了?
姑且认为你提出的Model是正确的(实在是没办法,你写的那个玩艺,作为人类基本是
没人看得懂了),你无非也就是解决了一个连续性不成立的情况而已。而你说的连续性
或者平滑性不成立的例子你又能举出多少?

【在 T*******I 的大作中提到】
: 我的研究领域是分段回归,即试图在样本空间里找到一个或多个有显著意义的临界点,
: 以此为根据建立临界模型,从而可以在不同的临界空间里建立可变的回归关系。
: 在这个领域里,数据迭代、最优化、强制连续性假设以及平滑处理技术是当前方法的核
: 心支柱。可是,最优化是一个理论错误(见我的论证过程)、强制连续性的假设是一个
: 确定性的假设,并由此引出了各种smoothing techniques。所以,我说现有的方法论在
: 统计学中不可接受。
: 我们需要新的分析逻辑和新的算法。

d******e
发帖数: 7844
187
又见“颠覆”。哈哈,大师,你当理论是你家房顶啊,想颠覆就颠覆?

【在 T*******I 的大作中提到】
: 我有。是一个关于冠心病的发生危险因素的多变量logistic回归模型,它在2007年
: 的JSM proceedings中。然而,这实际是不需要的。我当时之所以要用实例和随机模
: 拟试验来支持自己的方法,是因为我还没有找到强有力的理论作为支持。现在,仅通
: 过理论分析就足以颠覆现有的分析方法。
: 事实上,我做的分段回归不是仅仅在二维空间里的,而是n(n>=2)维(连续型随机变
: 量+离散型随机变量的混合空间)。
: 最后,你们为什么不找个样本(建议100~200例以内)按照我设计的算法算一个三分
: 模型试试看呢?相信你们会被结果震撼得跌破眼睛的。

T*******I
发帖数: 5138
188
“你无非也就是解决了一个连续性不成立的情况而已。”
如果你手里有我那篇文章的打印稿,请翻到关于连续性检验的部分,那里有一个二维
空间的两分段模型。
我想请问,根据那个图,能否说两个模型间是断离的?请分别从数学上和统计学上给
出回答。
我的解决方案不是仅针对“连续性不成立的情形”,而是针对“连续性不可确定的情
形”。你的判断和认知能力值得怀疑啊.

啊?

【在 d******e 的大作中提到】
: 大师啊,凭什么不可以假设Continuity和Smoothness?
: 大师啊,这么多人在使用Linear Model,你为什么不去质疑Linearity的Assumption啊?
: Nonlinear Model随处可见,可哪个人说Nonlinear Model颠覆传统的Linear Model了?
: 姑且认为你提出的Model是正确的(实在是没办法,你写的那个玩艺,作为人类基本是
: 没人看得懂了),你无非也就是解决了一个连续性不成立的情况而已。而你说的连续性
: 或者平滑性不成立的例子你又能举出多少?

d******e
发帖数: 7844
189
那是啊,陈大师质疑一切人的判断力和认知能力。

【在 T*******I 的大作中提到】
: “你无非也就是解决了一个连续性不成立的情况而已。”
: 如果你手里有我那篇文章的打印稿,请翻到关于连续性检验的部分,那里有一个二维
: 空间的两分段模型。
: 我想请问,根据那个图,能否说两个模型间是断离的?请分别从数学上和统计学上给
: 出回答。
: 我的解决方案不是仅针对“连续性不成立的情形”,而是针对“连续性不可确定的情
: 形”。你的判断和认知能力值得怀疑啊.
:
: 啊?

T*******I
发帖数: 5138
190
你显然是不会为此说:O, sorry. I made a mistake.
Every time if you make a mistake you will never try to correct it.

【在 d******e 的大作中提到】
: 那是啊,陈大师质疑一切人的判断力和认知能力。
相关主题
陈大师的两大硬伤和两大法宝let's settle this once and for all
陈大师居然在维基百科上大放厥词一个统计学的问题,请大家指教
那些挺陈大师的多谢版主解封,并请教“什么是统计学?”
进入Statistics版参与讨论
A*******s
发帖数: 3942
191
validation难道不是你应该做的东西?我还从来没有哪个学者提出一个新的model,不
做validation就宣称自己的model比旧的model好。

【在 T*******I 的大作中提到】
: 我有。是一个关于冠心病的发生危险因素的多变量logistic回归模型,它在2007年
: 的JSM proceedings中。然而,这实际是不需要的。我当时之所以要用实例和随机模
: 拟试验来支持自己的方法,是因为我还没有找到强有力的理论作为支持。现在,仅通
: 过理论分析就足以颠覆现有的分析方法。
: 事实上,我做的分段回归不是仅仅在二维空间里的,而是n(n>=2)维(连续型随机变
: 量+离散型随机变量的混合空间)。
: 最后,你们为什么不找个样本(建议100~200例以内)按照我设计的算法算一个三分
: 模型试试看呢?相信你们会被结果震撼得跌破眼睛的。

A*******s
发帖数: 3942
192
你都在美国混这么久时间了,
我怎么觉得你连cross validation是啥含义都不懂?
还有MLE这种最基本的统计名词,还得我给你解释?

【在 T*******I 的大作中提到】
: 由于误会。建议删除这个。我已经对上述内容作了修改。请根据修改后的内容作答。
: 你删除这个后,我的这个建议贴也会被删除。
: 权作建议,酌情处理。谢谢。

T*******I
发帖数: 5138
193
根据网上提供的不完整的信息,我初步了解了cross-validation (may not be the
validation you said here)的基本分析逻辑。
由于用我的方法fit出来的分段模型是由全部样本估计出来的临界点以及临界模型,因
此,全部统计量都是充分统计量。也就是说,这里的分段模型在本质上是最稳定的估计,
与一般回归分析中用全部样本fit出来的模型在稳定性上没有二至。因此,我想知道,
常规的回归分析中是否需要对model做validation? 如果是,那么,我就要问,既然一个
全域模型是用完全样本fit出来的,意即它使用了全部的样本信息,所以其中的所有统计
量都是充分统计量,那为什么还要做validation?你的手上只有一个原始样本,除此之
外,你拿什么来validate那个由充分统计量构成的集?
按照cross-validation的思想,用来做validation的任何一个样本都来自原始样本的一
部分,意即,相对于原始样本来说,validation中的较小样本的模型都不可能是一个更
充分的模型,而是恰恰相反。因此,你能用一个比较不充分的统计量来vali

【在 A*******s 的大作中提到】
: validation难道不是你应该做的东西?我还从来没有哪个学者提出一个新的model,不
: 做validation就宣称自己的model比旧的model好。

G*****7
发帖数: 1759
194
你知道什么是overfit么。

计,
一个
统计

【在 T*******I 的大作中提到】
: 根据网上提供的不完整的信息,我初步了解了cross-validation (may not be the
: validation you said here)的基本分析逻辑。
: 由于用我的方法fit出来的分段模型是由全部样本估计出来的临界点以及临界模型,因
: 此,全部统计量都是充分统计量。也就是说,这里的分段模型在本质上是最稳定的估计,
: 与一般回归分析中用全部样本fit出来的模型在稳定性上没有二至。因此,我想知道,
: 常规的回归分析中是否需要对model做validation? 如果是,那么,我就要问,既然一个
: 全域模型是用完全样本fit出来的,意即它使用了全部的样本信息,所以其中的所有统计
: 量都是充分统计量,那为什么还要做validation?你的手上只有一个原始样本,除此之
: 外,你拿什么来validate那个由充分统计量构成的集?
: 按照cross-validation的思想,用来做validation的任何一个样本都来自原始样本的一

T*******I
发帖数: 5138
195
诚实地说,只知道有这个名词,但不知道具体的统计学内涵。请解释。

【在 G*****7 的大作中提到】
: 你知道什么是overfit么。
:
: 计,
: 一个
: 统计

A*******s
发帖数: 3942
196
果然你不懂啥是validation的目的
你也不知道啥是generalization error吧
你这统计的常识比上过工科/社科统计基础课的本科生都差远了

息,

【在 T*******I 的大作中提到】
: 根据网上提供的不完整的信息,我初步了解了cross-validation (may not be the
: validation you said here)的基本分析逻辑。
: 由于用我的方法fit出来的分段模型是由全部样本估计出来的临界点以及临界模型,因
: 此,全部统计量都是充分统计量。也就是说,这里的分段模型在本质上是最稳定的估计,
: 与一般回归分析中用全部样本fit出来的模型在稳定性上没有二至。因此,我想知道,
: 常规的回归分析中是否需要对model做validation? 如果是,那么,我就要问,既然一个
: 全域模型是用完全样本fit出来的,意即它使用了全部的样本信息,所以其中的所有统计
: 量都是充分统计量,那为什么还要做validation?你的手上只有一个原始样本,除此之
: 外,你拿什么来validate那个由充分统计量构成的集?
: 按照cross-validation的思想,用来做validation的任何一个样本都来自原始样本的一

T*******I
发帖数: 5138
197
你这三句话毫无份量。
你得回答我就你所谓的validation提出的问题作答,请解释那个逻辑,以便你能够
自圆其说。

【在 A*******s 的大作中提到】
: 果然你不懂啥是validation的目的
: 你也不知道啥是generalization error吧
: 你这统计的常识比上过工科/社科统计基础课的本科生都差远了
:
: 息,

G*****7
发帖数: 1759
198
参见cross validation和generalization error。

【在 T*******I 的大作中提到】
: 诚实地说,只知道有这个名词,但不知道具体的统计学内涵。请解释。
A*******s
发帖数: 3942
199
CV是拿来fit model的么?你先把最基本的统计概念搞清楚,要不你和我这种烂校出来
的统计MS都没有讨论基础,更不要说和板上的PhD讨论了吧。至于颠覆理论启蒙世界之
类的,还远着呢...

【在 T*******I 的大作中提到】
: 你这三句话毫无份量。
: 你得回答我就你所谓的validation提出的问题作答,请解释那个逻辑,以便你能够
: 自圆其说。

T*******I
发帖数: 5138
200
其实,我们讨论的主题应该是我提出的那个三分回归法的算法及其理论基础。我认为我
确实不需要所谓的crooss-validation。我也没有意愿做这个。如果哪位有兴趣,且觉得
那个三分法有意义,不妨将CV引入进去。

【在 A*******s 的大作中提到】
: CV是拿来fit model的么?你先把最基本的统计概念搞清楚,要不你和我这种烂校出来
: 的统计MS都没有讨论基础,更不要说和板上的PhD讨论了吧。至于颠覆理论启蒙世界之
: 类的,还远着呢...

相关主题
数学家们在统计学领域犯下了几个严重的错误陈来错地方了
Re: 关于肖手术的最新review (转载)陈大师, 我很好奇
Great Confucius居然还有人试图和陈大师讨论统计问题
进入Statistics版参与讨论
G*****7
发帖数: 1759
201
其实他是来颠覆的,不是来讨论的。

【在 A*******s 的大作中提到】
: CV是拿来fit model的么?你先把最基本的统计概念搞清楚,要不你和我这种烂校出来
: 的统计MS都没有讨论基础,更不要说和板上的PhD讨论了吧。至于颠覆理论启蒙世界之
: 类的,还远着呢...

T*******I
发帖数: 5138
202
你们知道吗?我的整个方法体系中的每一个基本要素都是最简单的方法,也就是说,
我以基本统计方法为一个泛函,将它们按照那个分析逻辑组合在一起而构成了一个
三分回归分析法。因此,你怎么能说我是来颠覆什么的呢?我岂能用被颠覆的东西
来造一个工具然后再颠覆它自己?这是什么nb逻辑?

【在 G*****7 的大作中提到】
: 其实他是来颠覆的,不是来讨论的。
T*******I
发帖数: 5138
203
就很多人在此的发言看,他们的判断能力和逻辑思维能力是令人忧虑的。
在我看来,没有一个良好的判断能力和严谨的逻辑思维能力,要想在统计方法研究
中不犯错误是不可能的。
G*****7
发帖数: 1759
204
没说你颠覆了统计的任何东西。
颠覆了我们对于人类智商下限的认识。

【在 T*******I 的大作中提到】
: 你们知道吗?我的整个方法体系中的每一个基本要素都是最简单的方法,也就是说,
: 我以基本统计方法为一个泛函,将它们按照那个分析逻辑组合在一起而构成了一个
: 三分回归分析法。因此,你怎么能说我是来颠覆什么的呢?我岂能用被颠覆的东西
: 来造一个工具然后再颠覆它自己?这是什么nb逻辑?

T*******I
发帖数: 5138
205
你又错了。我确实颠覆了统计学里一些东西,例如最优化,强制连续性等。

【在 G*****7 的大作中提到】
: 没说你颠覆了统计的任何东西。
: 颠覆了我们对于人类智商下限的认识。

A*******s
发帖数: 3942
206
你能不能估计一下,
板上几十个id判断能力和逻辑思维能力同时都很低下的概率是多少?
N多杂志reviewer因为你的思想太超前而拒掉你的文章的概率是多少?
如果假设你的理论是正确的,拿现实来检验,P-value是多少?

【在 T*******I 的大作中提到】
: 就很多人在此的发言看,他们的判断能力和逻辑思维能力是令人忧虑的。
: 在我看来,没有一个良好的判断能力和严谨的逻辑思维能力,要想在统计方法研究
: 中不犯错误是不可能的。

T*******I
发帖数: 5138
207
用统计的行话来说,要想对你的如下问题作出统计回答,需要一个basic的
statistical survey; otherwise I can say nothing.

【在 A*******s 的大作中提到】
: 你能不能估计一下,
: 板上几十个id判断能力和逻辑思维能力同时都很低下的概率是多少?
: N多杂志reviewer因为你的思想太超前而拒掉你的文章的概率是多少?
: 如果假设你的理论是正确的,拿现实来检验,P-value是多少?

T*******I
发帖数: 5138
208
鉴于讨论有些走题了。我决定暂时中止个人就此的发言和讨论,直到有人对前面所有发
言中有关本人提出的理论和方法提出强而有力的批驳和论证。
However, I sincerely thanks for all of you paticipated, 而不论谁说了什么。Every one helped me to recognize myself. This is the most important for me.
Thanks again!
A*******s
发帖数: 3942
209
你不知道啥是observational studies?

【在 T*******I 的大作中提到】
: 用统计的行话来说,要想对你的如下问题作出统计回答,需要一个basic的
: statistical survey; otherwise I can say nothing.

T*******I
发帖数: 5138
210
我不知道的东西很多很多。就目前来看,我主要关注的是分段回归:理论基础和方法。

【在 A*******s 的大作中提到】
: 你不知道啥是observational studies?
相关主题
居然还有人试图和陈大师讨论统计问题临界回归模型的连续性
也从工程的角度给陈老师提个意见吧.陈大师不是民科
好奇问陈老师一个问题网上哪位比较熟悉分段回归的,能否简单介绍一下其基本的方法论?
进入Statistics版参与讨论
A*******s
发帖数: 3942
211
想创新,至少得把前人干了些啥搞清楚吧。

【在 T*******I 的大作中提到】
: 我不知道的东西很多很多。就目前来看,我主要关注的是分段回归:理论基础和方法。
w*********o
发帖数: 89
212
回了这么长啊,good for you
不必激动,只是觉得你不懂数学而已。 不需要把那些名人从坟里面挖出来,再倒腾到
嘴里,挺累的
我认识Soros,但我依然是个穷人。 你认识那个数学家和你懂不懂数学没关系。
与其如此激动,干嘛不说说点你懂的“数学”呢

【在 T*******I 的大作中提到】
: 水泡泡很轻视地问我是谁教出来的。让我告诉你以及这里所有的人。
: 我的老师有很多。本科时教我统计学的老师有好几个,他们是同济医科大学原卫生
: 统计教研室的老师们。他们全都毕业于老同济医学院(也就是后来的武汉医学院、同济
: 医科大学)的卫生系。我认为他们对统计学的理解绝对不比任何一个美国大学的统计学
: 教授差!其中的余松林教授成为了我后来读硕士时的导师。余在国内的前辈中是很有名
: 望的。但是,所有这些人只教了我最基本的东西,但对于我初入统计学却极其重要。令
: 我感到荣幸的是,我最终也成了其中的一员,并在那里服务了大约11年。
: 我在统计学领域的其他老师,应该是佩第、凯特勒、高尔顿、皮尔逊以及戈塞特和
: 费舍尔等(这仅是我自己妄称的,没人会承认),这些人是统计学史上的顶级人物。
: 我的另外的老师就完全不是搞统计的。一个是彭本智、一个是袁建国、另外就是罗

w*********o
发帖数: 89
213
您是我见过最正经的人,比专家都正经,真的

【在 T*******I 的大作中提到】
: 你又错了。我确实颠覆了统计学里一些东西,例如最优化,强制连续性等。
T*******I
发帖数: 5138
214
我早已说过,我基本没有数学背景,读不懂概率论。
相对于整个数学系统,我所拥有的数学知识几乎可以说是零,但不等于零。
正是那些不等于零的、少的可怜的数学技能帮助我完成了我的研究。这就够了。那些在
此问题上用不上的数学知识和技能我暂时是没有必要去学、去掌握的。
如果你依然怀疑,那么,就请你去看我的文章,看看其中存在哪些数学问题?于是,你
就可以帮助纠正。这不是对包括你本人在内的所有人都是好事吗?
正如Dr. Huber在中国的演讲中期待的那样,统计学甚至数学需要一股来自外部的力量
予以推动其整个体系的发展,而这股外部力量是且只能是哲学,因为它是关于一切的学
问,体现了人类最高的智慧,而统计学本身就是它的认识论的一个分支(a
mathematized methodology in epistemology, or a mathematized epistemology)。
很多中国人学到了西方的科学知识和技能,却没有学到西方真真的科学之精神!他们不
知道导致西方科学得以起源和发展的原动力是什么?它究竟在哪里?他们中的大多数秉持
着中国传统的人文和哲学精神,在科学知识面前怀着敬畏的心情、忐忑不安而又充满好
奇地尝试着学习,并小心翼翼地挪动着脚步。而当他们面对真实的世界时,却又因循守
旧式地用由那些知识训练出来的老眼光看问题,并拒绝接受新的思想。

【在 w*********o 的大作中提到】
: 回了这么长啊,good for you
: 不必激动,只是觉得你不懂数学而已。 不需要把那些名人从坟里面挖出来,再倒腾到
: 嘴里,挺累的
: 我认识Soros,但我依然是个穷人。 你认识那个数学家和你懂不懂数学没关系。
: 与其如此激动,干嘛不说说点你懂的“数学”呢

A*******s
发帖数: 3942
215
想必拒掉你文章的所有杂志reviewer都是因循守旧的中国人了,有正宗科学精神的洋大
爷都因为这些可恶的中国reviewer的缘故,与你的创新成果无缘相见。可惜,可叹...

【在 T*******I 的大作中提到】
: 我早已说过,我基本没有数学背景,读不懂概率论。
: 相对于整个数学系统,我所拥有的数学知识几乎可以说是零,但不等于零。
: 正是那些不等于零的、少的可怜的数学技能帮助我完成了我的研究。这就够了。那些在
: 此问题上用不上的数学知识和技能我暂时是没有必要去学、去掌握的。
: 如果你依然怀疑,那么,就请你去看我的文章,看看其中存在哪些数学问题?于是,你
: 就可以帮助纠正。这不是对包括你本人在内的所有人都是好事吗?
: 正如Dr. Huber在中国的演讲中期待的那样,统计学甚至数学需要一股来自外部的力量
: 予以推动其整个体系的发展,而这股外部力量是且只能是哲学,因为它是关于一切的学
: 问,体现了人类最高的智慧,而统计学本身就是它的认识论的一个分支(a
: mathematized methodology in epistemology, or a mathematized epistemology)。

P****D
发帖数: 11146
216
我觉得是拒掉大师文章的所有杂志reviewer都是搞统计的,不是哲学家。

【在 A*******s 的大作中提到】
: 想必拒掉你文章的所有杂志reviewer都是因循守旧的中国人了,有正宗科学精神的洋大
: 爷都因为这些可恶的中国reviewer的缘故,与你的创新成果无缘相见。可惜,可叹...

j********t
发帖数: 12
217
To be frank, I don't think you know statistics or any subject of science
either. The problem you have is that you hardly realize or admit this. Ask
yourself, is your so-called breakthrough in statistics ever recognized by
anyone but yourself? This reminds me of a famous old saying that can't
summerize the situation better here: If one man calls you a donkey, ignore
him. If two men call you a donkey, think about it. If three men call you a
donkey, buy a saddle. My humble suggestion is that you focus on whatever
you have to make a living but dreaming about making groundbreaking
contribution to statistics. To own some noble dream in life is complimentary
, but living in only dreams is just a nightmare. You are right that giants
like Fisher were idiosyncratic in some way, but I assure you that you have
completely gone the wrong way to be anything but a joke.

【在 T*******I 的大作中提到】
: 我早已说过,我基本没有数学背景,读不懂概率论。
: 相对于整个数学系统,我所拥有的数学知识几乎可以说是零,但不等于零。
: 正是那些不等于零的、少的可怜的数学技能帮助我完成了我的研究。这就够了。那些在
: 此问题上用不上的数学知识和技能我暂时是没有必要去学、去掌握的。
: 如果你依然怀疑,那么,就请你去看我的文章,看看其中存在哪些数学问题?于是,你
: 就可以帮助纠正。这不是对包括你本人在内的所有人都是好事吗?
: 正如Dr. Huber在中国的演讲中期待的那样,统计学甚至数学需要一股来自外部的力量
: 予以推动其整个体系的发展,而这股外部力量是且只能是哲学,因为它是关于一切的学
: 问,体现了人类最高的智慧,而统计学本身就是它的认识论的一个分支(a
: mathematized methodology in epistemology, or a mathematized epistemology)。

w*********o
发帖数: 89
218
呵呵,真是太欢乐了
姑且承认或许统计真的需要从哲学而来的力量来推动自身的发展,那也应该是从一个或
者一群哲学
和统计都精通的人。很可惜,你不在这个集合里。
至于你的paper, 呵呵
时间实在有限啊,这年头做个tutor一个小时还挣35呢。 我看了paper还有掉头回来教
你? 还真
是大家同欢乐的黄金时代啊

epistemology)。

【在 T*******I 的大作中提到】
: 我早已说过,我基本没有数学背景,读不懂概率论。
: 相对于整个数学系统,我所拥有的数学知识几乎可以说是零,但不等于零。
: 正是那些不等于零的、少的可怜的数学技能帮助我完成了我的研究。这就够了。那些在
: 此问题上用不上的数学知识和技能我暂时是没有必要去学、去掌握的。
: 如果你依然怀疑,那么,就请你去看我的文章,看看其中存在哪些数学问题?于是,你
: 就可以帮助纠正。这不是对包括你本人在内的所有人都是好事吗?
: 正如Dr. Huber在中国的演讲中期待的那样,统计学甚至数学需要一股来自外部的力量
: 予以推动其整个体系的发展,而这股外部力量是且只能是哲学,因为它是关于一切的学
: 问,体现了人类最高的智慧,而统计学本身就是它的认识论的一个分支(a
: mathematized methodology in epistemology, or a mathematized epistemology)。

S******t
发帖数: 1437
219
我咋没有看到所谓的文章呢?在哪里?
T*******I
发帖数: 5138
220
首先请看以下link,
http://en.wikipedia.org/wiki/Piecewise_regression_analysis
然后到其External link下载文章。
谢谢!

【在 S******t 的大作中提到】
: 我咋没有看到所谓的文章呢?在哪里?
相关主题
统计学的新地平线——陈立功与他的自权重曲线陈大师居然在维基百科上大放厥词
如果你不是孬种数学背景的统计学家,请接受挑战那些挺陈大师的
陈大师的两大硬伤和两大法宝let's settle this once and for all
进入Statistics版参与讨论
h*******e
发帖数: 404
221
太牛了!
现在知道为什么不能拿wiki作reference了。

【在 T*******I 的大作中提到】
: 首先请看以下link,
: http://en.wikipedia.org/wiki/Piecewise_regression_analysis
: 然后到其External link下载文章。
: 谢谢!

l*********s
发帖数: 5409
222
老陈你为啥这么喜欢自虐呢?

【在 T*******I 的大作中提到】
: 我早已说过,我基本没有数学背景,读不懂概率论。
: 相对于整个数学系统,我所拥有的数学知识几乎可以说是零,但不等于零。
: 正是那些不等于零的、少的可怜的数学技能帮助我完成了我的研究。这就够了。那些在
: 此问题上用不上的数学知识和技能我暂时是没有必要去学、去掌握的。
: 如果你依然怀疑,那么,就请你去看我的文章,看看其中存在哪些数学问题?于是,你
: 就可以帮助纠正。这不是对包括你本人在内的所有人都是好事吗?
: 正如Dr. Huber在中国的演讲中期待的那样,统计学甚至数学需要一股来自外部的力量
: 予以推动其整个体系的发展,而这股外部力量是且只能是哲学,因为它是关于一切的学
: 问,体现了人类最高的智慧,而统计学本身就是它的认识论的一个分支(a
: mathematized methodology in epistemology, or a mathematized epistemology)。

S******t
发帖数: 1437
223
倒... 我在google scholar 搜根本搜不到这个标题的文章, 再一看是JSM proceeding
...
l********w
发帖数: 253
224

其实我觉得这是陈老师和其他人争论的核心。他认为他的样本就是全部了,他的model
只要能和他的样本fit得很好就是一个好的model。但事实上统计需要的model是能用在
同类型的数据上的。如果陈老师有两个同类型的样本,他就会发现在第一个样本上fit
得到的model可能和第二个样本fit很差,所以需要cross-validation来估计模型是否
overfit了第一个样本。

【在 G*****7 的大作中提到】
: 你知道什么是overfit么。
:
: 计,
: 一个
: 统计

T*******I
发帖数: 5138
225
下面是ohyoo (kk) 和drburnie在全部讨论中提出的最强烈的质疑,因而也是最具挑战
性的问题。我想我有必要回答他们俩的问题。
1. 为什么不可以假设(assume)Continuity: 回答很简单。这个假设没有概率论支持
,意味着整个方法论没有得到概率论的支持。因此,有必要将那个assumption改为一个
hypothesis,从而使得整个方法论得到概率论的支持。
2. 由于连续性不可假设,因而通过解联立方程组得到临界点的估计的方法就不可行,
从而必须另寻它途。
3. 无论是从统计学本身的角度,还是从方法论被应用的领域的角度,都无法事先确定
临界模型是连续的或不连续的。唯一的途径是从概率的角度对连续性作出推断。
4. 如果smoothness必须要做,则也只能在连续性检验的基础上做。如果检验结果不支
持连续性,则smoothing是不可以的。其实,从统计的角度,如果采用了连续性检验,
则是否进一步从数学上、统计图形上搞出一个smoothy的结果意义已经不大了。
5. 在多维空间里,smoothing是极其困难的。

:决多少实际问题?你理不理解parsimony的概念?现在的方法论全世界都在
:用,你为什么觉得大家要费劲按你的所谓理论推倒重来?

【在 o***o 的大作中提到】
: 你的方法和threshold model有什么区别?有什么优势?这方面有很多的研究.
: 还有,为什么你的方法要叫做“方法论”?
:
: 者想
: ,所
: 各影
: 绩的
: 吗?

h***i
发帖数: 3844
226
来,解释一下5

【在 T*******I 的大作中提到】
: 下面是ohyoo (kk) 和drburnie在全部讨论中提出的最强烈的质疑,因而也是最具挑战
: 性的问题。我想我有必要回答他们俩的问题。
: 1. 为什么不可以假设(assume)Continuity: 回答很简单。这个假设没有概率论支持
: ,意味着整个方法论没有得到概率论的支持。因此,有必要将那个assumption改为一个
: hypothesis,从而使得整个方法论得到概率论的支持。
: 2. 由于连续性不可假设,因而通过解联立方程组得到临界点的估计的方法就不可行,
: 从而必须另寻它途。
: 3. 无论是从统计学本身的角度,还是从方法论被应用的领域的角度,都无法事先确定
: 临界模型是连续的或不连续的。唯一的途径是从概率的角度对连续性作出推断。
: 4. 如果smoothness必须要做,则也只能在连续性检验的基础上做。如果检验结果不支

T*******I
发帖数: 5138
227
Hi, hezhi,
你终于现身了。你曾经和我认真地讨论过一些问题,我也非常的感激。现在,我被鄙被骂
得够呛。中国同胞够厉害啊!个个都毫不留情,痛下杀手。
好在,我是“非凡”的,不会理会那些屁话,它们也伤不到我一根毫毛。
关于5,请原谅在我仅仅是一个直觉。我没有理论。不过,显然,到了4维及以上的空间
里,我们就看不到smooth的图形了,即使一个人声称他的处理结果一定是smooth。当
然,我不能排除能够从数学上搞个证明过程说那个处理是smooth,不过,好像也没人能
够证明说一个算术平均数就是最好的。因此,我怀疑这样的证明是否有效?是否有意义?
逻辑通不通,还请大虾帮助纠偏。呵呵。

【在 h***i 的大作中提到】
: 来,解释一下5
h***i
发帖数: 3844
228
https://www.msu.edu/~zhengshu/research_files/high.pdf
是个大概,有些reference,你可以读读
smoothing 在高维是会出问题。

被骂
义?

【在 T*******I 的大作中提到】
: Hi, hezhi,
: 你终于现身了。你曾经和我认真地讨论过一些问题,我也非常的感激。现在,我被鄙被骂
: 得够呛。中国同胞够厉害啊!个个都毫不留情,痛下杀手。
: 好在,我是“非凡”的,不会理会那些屁话,它们也伤不到我一根毫毛。
: 关于5,请原谅在我仅仅是一个直觉。我没有理论。不过,显然,到了4维及以上的空间
: 里,我们就看不到smooth的图形了,即使一个人声称他的处理结果一定是smooth。当
: 然,我不能排除能够从数学上搞个证明过程说那个处理是smooth,不过,好像也没人能
: 够证明说一个算术平均数就是最好的。因此,我怀疑这样的证明是否有效?是否有意义?
: 逻辑通不通,还请大虾帮助纠偏。呵呵。

T*******I
发帖数: 5138
229
我想我不会去关心或讨论那个问题,因为那原本就不会成为一个需要被讨论的问题。在
统计学里需要被讨论的问题是如何做连续性检验。这才是统计学应有的使命。
如果有人愿意在这个问题上玩玩数学技巧,那是他个人的爱好,与统计学无关。

【在 h***i 的大作中提到】
: https://www.msu.edu/~zhengshu/research_files/high.pdf
: 是个大概,有些reference,你可以读读
: smoothing 在高维是会出问题。
:
: 被骂
: 义?

G*****7
发帖数: 1759
230
再看看http://en.wikipedia.org/wiki/Talk:Piecewise_regression_analysis
热闹

【在 T*******I 的大作中提到】
: 首先请看以下link,
: http://en.wikipedia.org/wiki/Piecewise_regression_analysis
: 然后到其External link下载文章。
: 谢谢!

相关主题
一个统计学的问题,请大家指教Re: 关于肖手术的最新review (转载)
多谢版主解封,并请教“什么是统计学?”Great Confucius
数学家们在统计学领域犯下了几个严重的错误陈来错地方了
进入Statistics版参与讨论
l********w
发帖数: 253
231

。。。。。。

【在 G*****7 的大作中提到】
: 再看看http://en.wikipedia.org/wiki/Talk:Piecewise_regression_analysis
: 热闹

T*******I
发帖数: 5138
232
你知道Simulink是谁吗?我知道,我想,他就是这里的某一位。

【在 G*****7 的大作中提到】
: 再看看http://en.wikipedia.org/wiki/Talk:Piecewise_regression_analysis
: 热闹

d*******o
发帖数: 493
233
我觉得陈老师的想法很好。统计的预测理论都建立在两个基本点: least-square 基础上的
generalized linear model 和 nearest-neighbor的决策模型. least-square的优点是
low variance and high bias. nearest-neighbor 的优点是high variance and low
bias. 您的意思是想把两个结合起来,先segment再linearly fitting, 对吧?想
法很好啊。唯一的缺点就是这样的模型只能解释,不能用来预测,因为over-fitting会造成
同时的high variance and high bias.

【在 T*******I 的大作中提到】
: 下面是ohyoo (kk) 和drburnie在全部讨论中提出的最强烈的质疑,因而也是最具挑战
: 性的问题。我想我有必要回答他们俩的问题。
: 1. 为什么不可以假设(assume)Continuity: 回答很简单。这个假设没有概率论支持
: ,意味着整个方法论没有得到概率论的支持。因此,有必要将那个assumption改为一个
: hypothesis,从而使得整个方法论得到概率论的支持。
: 2. 由于连续性不可假设,因而通过解联立方程组得到临界点的估计的方法就不可行,
: 从而必须另寻它途。
: 3. 无论是从统计学本身的角度,还是从方法论被应用的领域的角度,都无法事先确定
: 临界模型是连续的或不连续的。唯一的途径是从概率的角度对连续性作出推断。
: 4. 如果smoothness必须要做,则也只能在连续性检验的基础上做。如果检验结果不支

T*******I
发帖数: 5138
234
可否请这位同学多用一点文字谈谈over fitting。我在学习AIC时略知一点这个概念,
但不是很透彻,也没有用过实际的例子体验过over fitting的结果。所以,很无知,也
很不感性。而没有感性的体验,就无法上升到理性的思考。
期待着你或者任何一个有兴趣的人在此就这个问题多多赐教。
关于你对分段回归的理解,应该是那样的。也就说,将一个复杂空间的关系通过找到有
意义的临界点对其进行分解,然后用比较简单的模型来分段描述。这应该是一个简单的
符合逻辑的考虑。就我个人的实例体验,分段后总和预测误差一定减小,预测精度则会
提高。由于对整个空间的预测将立足于分段模型及其临界空间的转换,怎么理解你的
“唯一的缺点就是这样的模型只能解释,不能用来预测,因为over-fitting会造成同时
的high variance and high bias. ”呢?

础上的

【在 d*******o 的大作中提到】
: 我觉得陈老师的想法很好。统计的预测理论都建立在两个基本点: least-square 基础上的
: generalized linear model 和 nearest-neighbor的决策模型. least-square的优点是
: low variance and high bias. nearest-neighbor 的优点是high variance and low
: bias. 您的意思是想把两个结合起来,先segment再linearly fitting, 对吧?想
: 法很好啊。唯一的缺点就是这样的模型只能解释,不能用来预测,因为over-fitting会造成
: 同时的high variance and high bias.

d*******o
发帖数: 493
235
打个比方,比如你知道九阳真经很牛,吸星大法也很牛,会一个就很牛了,两个都会就
可以天下无敌
了。但是实际上两个都练的话,就会经脉逆转,走火入魔,还不如不练了。

【在 T*******I 的大作中提到】
: 可否请这位同学多用一点文字谈谈over fitting。我在学习AIC时略知一点这个概念,
: 但不是很透彻,也没有用过实际的例子体验过over fitting的结果。所以,很无知,也
: 很不感性。而没有感性的体验,就无法上升到理性的思考。
: 期待着你或者任何一个有兴趣的人在此就这个问题多多赐教。
: 关于你对分段回归的理解,应该是那样的。也就说,将一个复杂空间的关系通过找到有
: 意义的临界点对其进行分解,然后用比较简单的模型来分段描述。这应该是一个简单的
: 符合逻辑的考虑。就我个人的实例体验,分段后总和预测误差一定减小,预测精度则会
: 提高。由于对整个空间的预测将立足于分段模型及其临界空间的转换,怎么理解你的
: “唯一的缺点就是这样的模型只能解释,不能用来预测,因为over-fitting会造成同时
: 的high variance and high bias. ”呢?

T*******I
发帖数: 5138
236
你很得意啊!捉弄了自己不说,还想向所有人炫耀捉弄了他人。
呵呵,有技术,有心计。好一只中国小丑。佩服!

【在 d*******o 的大作中提到】
: 打个比方,比如你知道九阳真经很牛,吸星大法也很牛,会一个就很牛了,两个都会就
: 可以天下无敌
: 了。但是实际上两个都练的话,就会经脉逆转,走火入魔,还不如不练了。

d*******o
发帖数: 493
237
您就一点幽默感都没有,看骂我骂的像孙子一样,这样大家就没人和您一起玩了。
上头的精算兄不是说了吗,您这模型没有validation和cross-validation. Too much
complexity causes over-fitting. 您的模型就算fits train dataset perfectly,但是
能用吗?像我们这些天天跑模型的马仔,拿着train过以后没有validate的模型跟老板
汇报,不是找
骂吗。
似乎您没有做过模型,只接触过一些AIC, BIC之类的。这样吧,我就跟您指条捷径吧。
SAS里面有个
procedure叫proc glmselect. SAS有个帮助文档,后面有两个例子,您要用sas的话就
跑一下,
您就知道什么叫做validation和cross-validation了。

【在 T*******I 的大作中提到】
: 你很得意啊!捉弄了自己不说,还想向所有人炫耀捉弄了他人。
: 呵呵,有技术,有心计。好一只中国小丑。佩服!

T*******I
发帖数: 5138
238
多谢赐教。我会去体验体验,然后再找机会和大家交流。
关于Cross-validation, 我在前面回答过精算兄,且要求他回答我的问题,并给出自己
的自圆其说。遗憾的是,他逃避了,退却了。那个问题至今还空在那儿期待着有人能给
出合理的答案。所以,你能试一试挑战自己吗?(这个请求不是mandatory).

【在 d*******o 的大作中提到】
: 您就一点幽默感都没有,看骂我骂的像孙子一样,这样大家就没人和您一起玩了。
: 上头的精算兄不是说了吗,您这模型没有validation和cross-validation. Too much
: complexity causes over-fitting. 您的模型就算fits train dataset perfectly,但是
: 能用吗?像我们这些天天跑模型的马仔,拿着train过以后没有validate的模型跟老板
: 汇报,不是找
: 骂吗。
: 似乎您没有做过模型,只接触过一些AIC, BIC之类的。这样吧,我就跟您指条捷径吧。
: SAS里面有个
: procedure叫proc glmselect. SAS有个帮助文档,后面有两个例子,您要用sas的话就
: 跑一下,

l**********9
发帖数: 148
239
zhe tie tai huo le, bu liu ming bu xing.
Fxxking lab without Chinese Input....
P****D
发帖数: 11146
240
http://py.qq.com/web/
上班的有几个有中文输入的?QQ云输入法不错,我一直用它。

【在 l**********9 的大作中提到】
: zhe tie tai huo le, bu liu ming bu xing.
: Fxxking lab without Chinese Input....

相关主题
陈来错地方了也从工程的角度给陈老师提个意见吧.
陈大师, 我很好奇好奇问陈老师一个问题
居然还有人试图和陈大师讨论统计问题临界回归模型的连续性
进入Statistics版参与讨论
l**********9
发帖数: 148
241

哦哦哦,确实好用,thank you~

【在 P****D 的大作中提到】
: http://py.qq.com/web/
: 上班的有几个有中文输入的?QQ云输入法不错,我一直用它。

T*******I
发帖数: 5138
242
仅仅留个名有啥意思?何不来点货真价实的东东?中文、英文都可以。
欢迎并期待着。

【在 l**********9 的大作中提到】
: zhe tie tai huo le, bu liu ming bu xing.
: Fxxking lab without Chinese Input....

A*******s
发帖数: 3942
243
i have a life, man. It's not my responsibility to teach you stat 101. I have
ASKED you to check out what is generalization error. Do your homework
before bullshitting.

【在 T*******I 的大作中提到】
: 多谢赐教。我会去体验体验,然后再找机会和大家交流。
: 关于Cross-validation, 我在前面回答过精算兄,且要求他回答我的问题,并给出自己
: 的自圆其说。遗憾的是,他逃避了,退却了。那个问题至今还空在那儿期待着有人能给
: 出合理的答案。所以,你能试一试挑战自己吗?(这个请求不是mandatory).

w****a
发帖数: 114
244
让我们一起把这个帖子顶起来。。。成为mitbbs的记录
b*****o
发帖数: 482
245
除此之外,我的父亲在其完全退休前身为洪湖二中文科班的历任班主任,明知我的文
科成绩非常出众而在数学基础教育方面存在严重的缺失,却在我高中阶段的文理科选择
上以及大学学校和专业选择上的两次独断专行最终迫使我走入了医学和统计学领域
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
我只能说, 你爸让你学理科真的害了你一辈子,同情ing
P****D
发帖数: 11146
246
最新更新的《我的爸爸》写得真是不错。

【在 w****a 的大作中提到】
: 让我们一起把这个帖子顶起来。。。成为mitbbs的记录
l**********9
发帖数: 148
247
啥时候更新下一章..
w****a
发帖数: 114
248
你这都哪跟哪呀。。。

【在 P****D 的大作中提到】
: 最新更新的《我的爸爸》写得真是不错。
P****D
发帖数: 11146
249
我指的是今天更新的讲他的父母也是他的老师的那一部分。

【在 w****a 的大作中提到】
: 你这都哪跟哪呀。。。
h***i
发帖数: 3844
250
太烂了你,呵呵

【在 w****a 的大作中提到】
: 让我们一起把这个帖子顶起来。。。成为mitbbs的记录
相关主题
陈大师不是民科如果你不是孬种数学背景的统计学家,请接受挑战
网上哪位比较熟悉分段回归的,能否简单介绍一下其基本的方法论?陈大师的两大硬伤和两大法宝
统计学的新地平线——陈立功与他的自权重曲线陈大师居然在维基百科上大放厥词
进入Statistics版参与讨论
w****a
发帖数: 114
251
创个记录挺好的。。我觉得

【在 h***i 的大作中提到】
: 太烂了你,呵呵
l********w
发帖数: 253
252
原来这个帖子首页还有更新啊,实在太佩服陈大师的灌水精神了!
T*******I
发帖数: 5138
253
是的。整个文章的内涵还可能会被更新,因为我保留了一些对于我个人来说非常重要的
部分。它们应当出现在最恰当的地方和时机。因此,这里的这个我不打算再做重大的更
新了,除非个别字词需要调整。

【在 l********w 的大作中提到】
: 原来这个帖子首页还有更新啊,实在太佩服陈大师的灌水精神了!
g********r
发帖数: 8017
254
陈大师的 分段写作 水平还是很不错的。

【在 l********w 的大作中提到】
: 原来这个帖子首页还有更新啊,实在太佩服陈大师的灌水精神了!
l**d
发帖数: 472
255
你们也真他妈太闲了。
T*******I
发帖数: 5138
256
janestreet在作了这个答复后跑到wikipedia我写的那个article里发了一个要求删除该
文的proposal。为了给历史留下一点证据,我认为有必要回这个贴子。人们将由此可以
看到某些中国学者对待网上非正式的学术讨论时秉持的是一种什么样的作风和态度。
在没有回答他的这个评论前,在没有把他/她与在wiki上发删文proposal的那个
janestreet对上号之前,我在wiki的discussion判断出他/她是一个中国人,并挑战了他。
遗憾的是,他/她不再在那里作出回应。今天重读大家的评论,才将他/她与那里的那个
对上号。故此。
原贴在page 11的第215楼。相应内容和link也转贴到了wiki上相应的discussion.

【在 j********t 的大作中提到】
: To be frank, I don't think you know statistics or any subject of science
: either. The problem you have is that you hardly realize or admit this. Ask
: yourself, is your so-called breakthrough in statistics ever recognized by
: anyone but yourself? This reminds me of a famous old saying that can't
: summerize the situation better here: If one man calls you a donkey, ignore
: him. If two men call you a donkey, think about it. If three men call you a
: donkey, buy a saddle. My humble suggestion is that you focus on whatever
: you have to make a living but dreaming about making groundbreaking
: contribution to statistics. To own some noble dream in life is complimentary
: , but living in only dreams is just a nightmare. You are right that giants

d******e
发帖数: 7844
257
陈大师又出现了。先别着急攻击别人,哈哈。
先来解释解释你的Model的Complexity和Prediction的能力吧。
单纯追求解释训练数据,高阶的Polynomial Regression或者Kernel Regression都可以
非常好的fit数据,几乎0 residual。呵呵,但在独立的测试数据上做Prediction就知道
了,Prediction性能很差。说明Model只能解释已有的数据。
大师来说说你的PRA在Prediction方面性能何如啊?呵呵

了他。
.103.]

【在 T*******I 的大作中提到】
: janestreet在作了这个答复后跑到wikipedia我写的那个article里发了一个要求删除该
: 文的proposal。为了给历史留下一点证据,我认为有必要回这个贴子。人们将由此可以
: 看到某些中国学者对待网上非正式的学术讨论时秉持的是一种什么样的作风和态度。
: 在没有回答他的这个评论前,在没有把他/她与在wiki上发删文proposal的那个
: janestreet对上号之前,我在wiki的discussion判断出他/她是一个中国人,并挑战了他。
: 遗憾的是,他/她不再在那里作出回应。今天重读大家的评论,才将他/她与那里的那个
: 对上号。故此。
: 原贴在page 11的第215楼。相应内容和link也转贴到了wiki上相应的discussion.

T*******I
发帖数: 5138
258
我的老师群体中被遗忘了一个非常重要的群体,他们就是同济医科大学工会爱乐小组的全
体成员。为此我不得不作出修改。请见谅。
其实,各位在此的发言和讨论也使我受益良多,并使得很多思想得以萌发。因此,无论
谁在此对我说过什么话,我绝对不会介意,不会“往心里去”。
尽管人人都会有烦恼甚至痛苦,但生活是实在且应该积极的,不过,我似乎不得不永远
地活在自己的梦中,因为我的命运早就被注定了——原来我是一个双鱼人。这是直到今
年二月我才被告知的。在此之前,我的同学、朋友和同事都说,陈立功是个好做梦的人
,而我的几个网络名称也竟然不约而同地与“梦”有关,例如:because of dream,
life is beautiful, 随机与梦想,等。难道这真的是巧合吗?我不竟为此反复问过自
己好几次,而答案却始终难寻难证。
Anyway, 但愿梦想成真,也愿每个人拥有并实现自己的梦想,因为,一旦人类失去了梦
想,人类本身乃至整个宇宙世界的后果将不堪设想;一个人若没有了梦想,他/她的生
命也将失去光亮;而一个人若到了像我这样的年龄还能保持和拥有梦想,那么,我只能
说,那是一个奇迹。是的,那确实是一个奇迹。因此,我将永远不会放弃自己的梦想,
因为那是执著的源泉。

视地问我是谁教出来的。让我告诉他/她以及这里所有的人。

【在 T*******I 的大作中提到】
: janestreet在作了这个答复后跑到wikipedia我写的那个article里发了一个要求删除该
: 文的proposal。为了给历史留下一点证据,我认为有必要回这个贴子。人们将由此可以
: 看到某些中国学者对待网上非正式的学术讨论时秉持的是一种什么样的作风和态度。
: 在没有回答他的这个评论前,在没有把他/她与在wiki上发删文proposal的那个
: janestreet对上号之前,我在wiki的discussion判断出他/她是一个中国人,并挑战了他。
: 遗憾的是,他/她不再在那里作出回应。今天重读大家的评论,才将他/她与那里的那个
: 对上号。故此。
: 原贴在page 11的第215楼。相应内容和link也转贴到了wiki上相应的discussion.

A*******s
发帖数: 3942
259
“由于我试图提出的解决方案引入了随机权重测量,所以,我试图找到在这个领域作出
过开创性工作的先辈们。然而,我暂时失败了。我只能从一篇发表于1824年的关于天文
学观察的文章里发现在那之前就已经有人在使用加权均数了。加权统计量是统计学历史
上一个伟大的发现。它在我们对世界的认识中引入了可变“重要性”的概念,从而使得
基于此上的估计更加稳定和可靠。看来,我暂时只能以此无名氏为师。”
你这个加权是怎么加权的?统计学里面无数方法都有weighted的处理方法。我建议你要
是想做研究的话,1.得先学好英语;2.得先会用google发现前人做了啥。3.老老实实从
probability,math statistics,linear theory从头学起,你这数学水平就别想修啥
analysis和measure theory了。
至于piecewise regression,这种用additive local models代替一般的global linear
regression models,来接近真实的nonliear model的思想,早就被人深耕细作了几十
年了。不好说你的东西100%是错的,但是就算有对的,那也肯定不是啥新东西。要是说
有啥新东西的话,估计是错的太离谱了,前人都想不到。

的全

【在 T*******I 的大作中提到】
: 我的老师群体中被遗忘了一个非常重要的群体,他们就是同济医科大学工会爱乐小组的全
: 体成员。为此我不得不作出修改。请见谅。
: 其实,各位在此的发言和讨论也使我受益良多,并使得很多思想得以萌发。因此,无论
: 谁在此对我说过什么话,我绝对不会介意,不会“往心里去”。
: 尽管人人都会有烦恼甚至痛苦,但生活是实在且应该积极的,不过,我似乎不得不永远
: 地活在自己的梦中,因为我的命运早就被注定了——原来我是一个双鱼人。这是直到今
: 年二月我才被告知的。在此之前,我的同学、朋友和同事都说,陈立功是个好做梦的人
: ,而我的几个网络名称也竟然不约而同地与“梦”有关,例如:because of dream,
: life is beautiful, 随机与梦想,等。难道这真的是巧合吗?我不竟为此反复问过自
: 己好几次,而答案却始终难寻难证。

T*******I
发帖数: 5138
260
至少,关于continuity test的思想是全新的、三分搜索以同步估计两个临界点的程序
设计是新的,还有其它,特别是关于临界点的加权估计方法。
我所构造的权重变量是由各分段模型的合并residuals对全空间的fullwise模型的
residuals
的相对差(即可测范围为0 ~ 1)。这是前无古人的。这个权重准确地定义了被搜索的
临界点的性质,即它是一个关于空间内决定临界关系发生变异的临界点的加权期望估计
。如果你仔细地了解了文章全部的思想和逻辑,就会发现不可能有比这个更好的了。

linear

【在 A*******s 的大作中提到】
: “由于我试图提出的解决方案引入了随机权重测量,所以,我试图找到在这个领域作出
: 过开创性工作的先辈们。然而,我暂时失败了。我只能从一篇发表于1824年的关于天文
: 学观察的文章里发现在那之前就已经有人在使用加权均数了。加权统计量是统计学历史
: 上一个伟大的发现。它在我们对世界的认识中引入了可变“重要性”的概念,从而使得
: 基于此上的估计更加稳定和可靠。看来,我暂时只能以此无名氏为师。”
: 你这个加权是怎么加权的?统计学里面无数方法都有weighted的处理方法。我建议你要
: 是想做研究的话,1.得先学好英语;2.得先会用google发现前人做了啥。3.老老实实从
: probability,math statistics,linear theory从头学起,你这数学水平就别想修啥
: analysis和measure theory了。
: 至于piecewise regression,这种用additive local models代替一般的global linear

相关主题
那些挺陈大师的多谢版主解封,并请教“什么是统计学?”
let's settle this once and for all数学家们在统计学领域犯下了几个严重的错误
一个统计学的问题,请大家指教Re: 关于肖手术的最新review (转载)
进入Statistics版参与讨论
a*****3
发帖数: 601
261
陈老师:
建议平时多发发paper灌灌水,在业界建立起一定地位后逐渐sell自己那些理论,不可
一蹴而就。就像刘晓波拿诺奖,要经历一个漫长的过程。
d******e
发帖数: 7844
262
陈老师为啥不回答我关于PRA的prediction能力的问题啊?

【在 T*******I 的大作中提到】
: 至少,关于continuity test的思想是全新的、三分搜索以同步估计两个临界点的程序
: 设计是新的,还有其它,特别是关于临界点的加权估计方法。
: 我所构造的权重变量是由各分段模型的合并residuals对全空间的fullwise模型的
: residuals
: 的相对差(即可测范围为0 ~ 1)。这是前无古人的。这个权重准确地定义了被搜索的
: 临界点的性质,即它是一个关于空间内决定临界关系发生变异的临界点的加权期望估计
: 。如果你仔细地了解了文章全部的思想和逻辑,就会发现不可能有比这个更好的了。
:
: linear

a*****3
发帖数: 601
263
啥是pra? 我刚挖了个坑,关于customer segmentation/profiling.有兴趣发个言。

【在 d******e 的大作中提到】
: 陈老师为啥不回答我关于PRA的prediction能力的问题啊?
h***i
发帖数: 3844
264
Piecewise Regression Analysis,hehe

【在 a*****3 的大作中提到】
: 啥是pra? 我刚挖了个坑,关于customer segmentation/profiling.有兴趣发个言。
a*****3
发帖数: 601
265
是这样。谢了。其实陈老师搞那一套只要能自圆其说就可以了;不一定非要预测。没有
应用( 或是暂时找不到应用)的理论见多了。

【在 h***i 的大作中提到】
: Piecewise Regression Analysis,hehe
h***i
发帖数: 3844
266
可以make一套公理系统,then 推出一大堆定理引理。
把前人彻底推翻,或者部分推翻,比如科莫个懦夫那套公理系统干掉,另外搞一套,如
果能logically 推出一大堆东西,还是很interesting

【在 a*****3 的大作中提到】
: 是这样。谢了。其实陈老师搞那一套只要能自圆其说就可以了;不一定非要预测。没有
: 应用( 或是暂时找不到应用)的理论见多了。

a*****3
发帖数: 601
267
陈老师的初衷肯定也不是推翻统计的基石。他就是说前人用解方程组的方法不对,因为
数学是deterministic;统计是randomness;自己构造了一套算法,可惜目前找不到应用
,被人猛批。
其实到数学图书馆随便伶一篇journal你看有啥应用?证明1+1有啥应用?没应用的理论
见多了。
陈老师多发paper是王道,地位起来了;说话就有分量了。

如: 果能logically 推出一大堆东西,还是很interesting

【在 h***i 的大作中提到】
: 可以make一套公理系统,then 推出一大堆定理引理。
: 把前人彻底推翻,或者部分推翻,比如科莫个懦夫那套公理系统干掉,另外搞一套,如
: 果能logically 推出一大堆东西,还是很interesting

h***i
发帖数: 3844
268
觉得review那里他通不过,theoretic的东西他不够deep, application没有优势, pa
per没有sell point.

【在 a*****3 的大作中提到】
: 陈老师的初衷肯定也不是推翻统计的基石。他就是说前人用解方程组的方法不对,因为
: 数学是deterministic;统计是randomness;自己构造了一套算法,可惜目前找不到应用
: ,被人猛批。
: 其实到数学图书馆随便伶一篇journal你看有啥应用?证明1+1有啥应用?没应用的理论
: 见多了。
: 陈老师多发paper是王道,地位起来了;说话就有分量了。
:
: 如: 果能logically 推出一大堆东西,还是很interesting

A*******s
发帖数: 3942
269
你这个weighted之后的estimate,是unbiased的么?如果是unbiased的,是BLUE么?如
果是biased的,那么prediction error variance会减少么?有没有证明?

【在 T*******I 的大作中提到】
: 至少,关于continuity test的思想是全新的、三分搜索以同步估计两个临界点的程序
: 设计是新的,还有其它,特别是关于临界点的加权估计方法。
: 我所构造的权重变量是由各分段模型的合并residuals对全空间的fullwise模型的
: residuals
: 的相对差(即可测范围为0 ~ 1)。这是前无古人的。这个权重准确地定义了被搜索的
: 临界点的性质,即它是一个关于空间内决定临界关系发生变异的临界点的加权期望估计
: 。如果你仔细地了解了文章全部的思想和逻辑,就会发现不可能有比这个更好的了。
:
: linear

a*****3
发帖数: 601
270
再为陈老师支一招career path: 陈老师既然师从大师,科班出身,能坚持思考十多年
,那就姑且屈尊在主流杂志上每年灌几篇文章,想必总不是难事。
等到被主流社会jsm接受以后,树立起江湖地位,再慢慢抛出自己的pra方法论,著书立
说,毁人不倦;在招收几个phd student. 比如drburnie,让其专门研究PRA在生活中的
实际应用,研究不出来不让毕业。
如果‘精算师’来报考陈老师的phd,毕业论文题目就叫
“关于weighted之后的estimate,是unbiased的么?如果是unbiased的,是BLUE么?如
果是biased的,那么prediction error variance会减少么”
整不出来,不让毕业。

如: 果是biased的,那么prediction error variance会减少么?有没有证明?

【在 A*******s 的大作中提到】
: 你这个weighted之后的estimate,是unbiased的么?如果是unbiased的,是BLUE么?如
: 果是biased的,那么prediction error variance会减少么?有没有证明?

相关主题
Re: 关于肖手术的最新review (转载)陈大师, 我很好奇
Great Confucius居然还有人试图和陈大师讨论统计问题
陈来错地方了也从工程的角度给陈老师提个意见吧.
进入Statistics版参与讨论
A*******s
发帖数: 3942
271
我好奇看了一下陈老师发的帖子。发现陈老师是穿越的呀,一个半月之前还看不明白PR
的论文,现在突然摇身一变说颠覆了前人理论了。
发信人: TNEGIETNI (lovewisdom), 信区: Statistics
标 题: 网上哪位比较熟悉分段回归的,能否简单介绍一下其基本的方法论?
发信站: BBS 未名空间站 (Thu Aug 19 23:17:03 2010, 美东)
我最近在看一些相关文献,发现似乎有早期的经典流派和后期的Bayesian流派之分。然
而,无论哪一派我都看不懂,尤其是看不懂它们的基本分析逻辑,因此也就无法明白它
们的数学算法。
注:分段回归的英文术语很多,例如,segmented regression,piecewise regression
, change-point regression, switching regression, shifting regression, partly
regression,multi-phase regression, spline,等等。而关于临界点的术语也很多
,诸如,segmenting point, critical point, threshold, changing-poing, change-
point, switching point, shifting point, knot, 等等。不同的学者使用不同的术语
,但实际上他们所提出的问题的性质和内涵基本一致。
我个人认为这是统计学中一个很重要的领域。任何观点、解释和评论都欢迎来此交流,
不胜感激。

【在 a*****3 的大作中提到】
: 再为陈老师支一招career path: 陈老师既然师从大师,科班出身,能坚持思考十多年
: ,那就姑且屈尊在主流杂志上每年灌几篇文章,想必总不是难事。
: 等到被主流社会jsm接受以后,树立起江湖地位,再慢慢抛出自己的pra方法论,著书立
: 说,毁人不倦;在招收几个phd student. 比如drburnie,让其专门研究PRA在生活中的
: 实际应用,研究不出来不让毕业。
: 如果‘精算师’来报考陈老师的phd,毕业论文题目就叫
: “关于weighted之后的estimate,是unbiased的么?如果是unbiased的,是BLUE么?如
: 果是biased的,那么prediction error variance会减少么”
: 整不出来,不让毕业。
:

j********t
发帖数: 12
272
Do you really believe that you are worth my time? Why should I even bother
to read your nonsense writing? I proposed your writing to be removed from
wiki since it is far from meeting the standard of wiki, nothing personal
here. By the way, you are really funny by pretending being a victim whose
geniune idea is suppressed by some dictatorship, it is amusing to see your
keep talking about my being Chinese and how Chinese is good at killing
someone's ideas. Do you really believe that you have an "idea" worth killing
? So far no one but you has taken it seriously, what can I make of by doing
so ...
Would you let me know your purpose of posting your article in wiki? My
understanding is that wiki, unlike a public forum (say, mitbbs) is not a
place that you post whatever you have thought of. Anything there should have
already exerted some influence in some area. You can't just say, gee, I
have this wonderful idea and should post this on wiki. This will have a
detrimental effect on those who are using the website. They will just get
confused and refuse to rely on it anymore. For example, anyone who tries to
read your writing there will at best dismiss it. Here is a quick glimpse
over what you wrote:
"Distribution: a distribution is a result of a measuring action on a scale
space."
I honestly don't know what you wanted to convey here. To say the least, this
is hardly an English sentence at all, let alone that this has nothing to do
with what we normally know as distribution in statistics or science.
Anybody reading this will naturally respond with a "what a ***" in mind.
Don't you say again that you challenged me by asking me to help you improve
the writing. We already advised you to learn something seriously before you
bullshit here or anywhere else. But clearly, you never listened. Also don't
you say that your idea is too ahead of time to be appreciated by us. If you
do believe what you did is groudbreaking. Other than being speechless, only
two words for you: good luck.

了他。
.103.]

【在 T*******I 的大作中提到】
: janestreet在作了这个答复后跑到wikipedia我写的那个article里发了一个要求删除该
: 文的proposal。为了给历史留下一点证据,我认为有必要回这个贴子。人们将由此可以
: 看到某些中国学者对待网上非正式的学术讨论时秉持的是一种什么样的作风和态度。
: 在没有回答他的这个评论前,在没有把他/她与在wiki上发删文proposal的那个
: janestreet对上号之前,我在wiki的discussion判断出他/她是一个中国人,并挑战了他。
: 遗憾的是,他/她不再在那里作出回应。今天重读大家的评论,才将他/她与那里的那个
: 对上号。故此。
: 原贴在page 11的第215楼。相应内容和link也转贴到了wiki上相应的discussion.

d******e
发帖数: 7844
273
真能写

killing
doing

【在 j********t 的大作中提到】
: Do you really believe that you are worth my time? Why should I even bother
: to read your nonsense writing? I proposed your writing to be removed from
: wiki since it is far from meeting the standard of wiki, nothing personal
: here. By the way, you are really funny by pretending being a victim whose
: geniune idea is suppressed by some dictatorship, it is amusing to see your
: keep talking about my being Chinese and how Chinese is good at killing
: someone's ideas. Do you really believe that you have an "idea" worth killing
: ? So far no one but you has taken it seriously, what can I make of by doing
: so ...
: Would you let me know your purpose of posting your article in wiki? My

h***i
发帖数: 3844
274
我也觉得

【在 d******e 的大作中提到】
: 真能写
:
: killing
: doing

T*******I
发帖数: 5138
275
Hi, every friend,
非常感激你们持续地倾注你们的热情和关注。我这几天可能处于一种癫狂的状态。好在,
终于走了出来。
我所使用的概念系统今天中午前后总算基本完成了。它们就在那个wiki网页里。是的,
那里是一个特别的地方,本不应该由我来这样做。但实在没办法,没人能够担此大任。
于是,我不得不化名行事。
我在系统里引入了尺度空间(scale space)的概念。这是13年前思考分段回归问题时就
已经形成了的概念。尺度空间就是当前概率论系统中的“样本空间”。我认为这是一个
严重的概念抽象错误。但是,它对概率论的理论形成影响不大,却人们在引用这些概念
思考统计学的一些问题时容易引起混淆和冲突。是到了必须被纠正的时候了。
样本空间只能是一个样本本身。
引入这个概念后,理解其它方面就易如反掌。
另外引入的概念是被测空间(measured space),它就是样本空间,也就概率空间。当
然,此时的概率空间定义在样本空间与尺度空间作为一个整体的的空间上。没有脱离尺
度空间样本空间存在,反之亦然。
我把可测空间还给了总体空间。那是一个可测但不可直接被概率化的空间。
我还引入了可连续空间以便与连续空间相区别。这两个空间是不一样的。有了可连续空
间后,理解空间分割以及分段回归就非常简单。若有疑惑,可以前往查考。
还有很多新奇的概念以及建立在这些概念基础上的新思想。这是一个大胆的尝试,即试
图将概率论中那些令非数学背景的人感到晦涩难懂的概念予以哲学化和简单化处理。从
而,任何一个人小学教育程度的人就可以看懂。
我想说的是,我绝对不是要推翻什么。柯尔莫戈诺夫是个非常伟大的数学家。他的思想
远远超越了他同时代的同行们,在统计实践活动还处于非常幼稚的阶段,他就以极其敏
锐的眼光发现了一些普通人没有看到东西。我正是在读了严士健根据他的理论编写的
《概率论基础》中的基本概念部分后才开始思考分段回归问题的。这些基本概念给了我
巨大的帮助。我无法想象,如果没有那几个基本概念,我将怎样开始自己的思考。我相
信我将没有可能性。因此,我要说,他太伟大了。其实,我就概念的调整所作出的一点
点努力只不过是在他的启发下继续他的思路而已。当然,我也引入了一些新的概念,从
而丰富了概率论的概念系统。
真的好累好累。没有搞过理论思考的人无法想象其中的艰难和痛苦。
关于我的方法论解释和预测效果,那是不容置疑的。绝对是唯一的解决方案。以此方法
建立起来的分段模型就是一个样本空间(不是柯的那个)上的期望模型,恰如人们用一
个完全样本计算无偏估计的样本均数一样。难道大家对一个样本均数还会持怀疑态度
吗?岂不是吃饱了撑的?
当然,我的概念系统能否与现行概念系统完好地结合,说实话,我不知道。我仅是从我
自己的理性和逻辑出发定义那些概念,且尚未提供简洁的数学表达,因为我还不会使用
wiki的数学公式编辑器。因此,欢迎大家前往批评斧正。每位有意参与的,可以在那里
的discussion或这里留下你的评论和建议。
我打算休息几天,顺便听听大家的意见。然后将自己正在写的关于统计学基础的文章完
成。但愿我能干完自己的这件事。
正在干这件事的过程中看到了刘晓波获诺奖的消息。借此机会让我们一起向他表示敬意和
祝贺!
Have a nice weekend.
P****D
发帖数: 11146
276
你对精算太坏了,这明明是三个题目。精算做一个,drburnie做一个,还得给后来人留
一个吧。

【在 a*****3 的大作中提到】
: 再为陈老师支一招career path: 陈老师既然师从大师,科班出身,能坚持思考十多年
: ,那就姑且屈尊在主流杂志上每年灌几篇文章,想必总不是难事。
: 等到被主流社会jsm接受以后,树立起江湖地位,再慢慢抛出自己的pra方法论,著书立
: 说,毁人不倦;在招收几个phd student. 比如drburnie,让其专门研究PRA在生活中的
: 实际应用,研究不出来不让毕业。
: 如果‘精算师’来报考陈老师的phd,毕业论文题目就叫
: “关于weighted之后的estimate,是unbiased的么?如果是unbiased的,是BLUE么?如
: 果是biased的,那么prediction error variance会减少么”
: 整不出来,不让毕业。
:

a*****3
发帖数: 601
277
听说贱妾同学是pharm D? 那就让伊写写陈氏回归vs传统回归在制药领域之应用。

留: 一个吧。

【在 P****D 的大作中提到】
: 你对精算太坏了,这明明是三个题目。精算做一个,drburnie做一个,还得给后来人留
: 一个吧。

w*********o
发帖数: 89
278
回了这么长,感动ing
看来我随便问个本科教育就搔到了陈老师的痒处哦, 那么这个本科教育问题是不是陈
老师心中永远
的痛呢?

轻视地问我是谁教出来的。让我告诉他/她以及这里所有的人。
学的
老师有好几个,他们是同济医科大学公共卫生学院原卫生统计与社会医学教研室的老师
们,其中有
周有尚教授、梁浩材教授、余松林教授、刘筱娴教授、董时富教授、王增珍教授等以及
其它几位年
轻的讲师。他们全都毕业于早期的中南同济医学院的卫生系和中期的武汉医学院卫生系
以及晚期的
同济医科大学公共卫生学院。我认为他们对统计学的理解绝对不比任何一个美国大学的
统计学教授
差!其中的余松林教授成为了我后来读硕士时的导师。余教授在国内的前辈中是很有名
望: 的。他
在二十世纪80年代早期就通过自己的艰苦努力争取到了公派来美并在NIH的NCI机构里从
事医学统
计学的研究和应用。在中国刚刚开始面向世界开放并依然处于非常困难的时期,他借用
卫生统计这
个领域不遗余力地引入国外先进的分析方法,由此赢得了国内同行的高度尊敬。我也一
直非常敬重
他,他教给我的东西使我终身受益匪浅。当然,这些老师只教了我最基本的东西,但对
于我初入统
计学却极其重要。令我感到荣幸的是,我以及我的太太陈咏梅女士最终也都成了其中的
一员,我们
俩在那里服务了大约11年。
、佩
第、格朗特、凯特勒、高尔顿、皮尔逊、戈塞特和费舍尔以及尼曼等(这仅是我自己妄
称的,没人
会承认),这些人是统计学史上的顶级人物。他们中的每一个都开创了一个时代,并最
终奠定了现
有的完整的统计思维的逻辑体系,其后的一切方法论的发展均(应)遵循这个逻辑系统。
家真
真的的鼻祖。不仅如此,由于统计学在现代乃至未来科学研究领域中的通用方法论地位
,他也因此
而应该被尊称为“现代乃至未来科学之父”。他理应享有上述这两个尊号。[Oct. 6]
根据罗素对
其哲学体系的简单综述,培根在认识论领域中的哲学观点是,我们应当把所考察的、共
有一定性质
的东西全都列出来,不仅如此,还要把缺乏这种性质的东西以及虽有这种性质但程度不
同的东西也
列出来,从而有希望发现这种性质的特点;如果这种列表法确能完全彻底,我们就必然
达: 到了探
索的终点;在实践中我们还必须满足于一张部分性的列表,然后据此大胆猜测。这就是
从大量的同
类个别事实中抽象出一般结论的归纳推理方法。这就是培根认为的科学发现的“新工具
”,它唯一而
简单地依赖分类法,以为只要通过在大量观察基础上的充分精细化,就能为每样东西在
分类架上找
到一个确定的适当位置。培根的哲学思想促成了大不列颠经验主义哲学体系的诞生,激
发了达尔文
遵从这一简单的哲学思想开始自己周游世界并进行地球生态系统考察的兴趣和行动,并
因此而提出
了自己著名的生物进化论,而达尔文的进化论直接导致了高尔顿提出�: 喙睾突
毓榉治龅幕舅枷
牒驮妓惴ǎ庖凰惴ňざ返母慕蟮靡远ㄐ椭两瘛S纱丝杉橹饕逭苎
Ъ颐窃诖蟛涣械吡焱辽
系恼苎剿鞫杂诤罄吹耐臣蒲а芯坎酥苯忧抑卮蟮挠跋臁U饩褪俏裁赐臣蒲Я煊
虻脑缙诳凑呒负
醵嫉诖蟛涣械吡焱辽系恼嬲嬖颉=鼋雠喔钤嫉乃枷刖妥阋员蝗衔呛罄匆磺
型臣品椒ㄑУ淖钤
嫉穆呒惴ā�
我的
老师。原因是,1998年三月底的某一天,我在武汉大学数学系聆听过陈院士根据Peter
J.
Huber于1997年在中国科学院数理统计研究所作的关于统计学的历史、现状和未来的演
讲所作的演
讲,基本上是Dr. Huber的演讲的中文转述。我在他讲完后请求上台讲了自己的新思想
。事后我们
还进行了一场两人间大约10分钟的对话和讨论。他没有反对我的新思想,而是鼓励我好
好地做下
去。由于他的演讲是基于Dr. Huber的演讲,所以,我更愿意以Dr. Huber为师。

【在 T*******I 的大作中提到】
: Hi, every friend,
: 非常感激你们持续地倾注你们的热情和关注。我这几天可能处于一种癫狂的状态。好在,
: 终于走了出来。
: 我所使用的概念系统今天中午前后总算基本完成了。它们就在那个wiki网页里。是的,
: 那里是一个特别的地方,本不应该由我来这样做。但实在没办法,没人能够担此大任。
: 于是,我不得不化名行事。
: 我在系统里引入了尺度空间(scale space)的概念。这是13年前思考分段回归问题时就
: 已经形成了的概念。尺度空间就是当前概率论系统中的“样本空间”。我认为这是一个
: 严重的概念抽象错误。但是,它对概率论的理论形成影响不大,却人们在引用这些概念
: 思考统计学的一些问题时容易引起混淆和冲突。是到了必须被纠正的时候了。

T*******I
发帖数: 5138
279
"那么这个本科教育问题是不是陈老师心中永远的痛呢?"
No. I always enjoyed my 本科教育, although I was often absence. My
statistical education background is not just in the 本科教育, but mainly in
postgraduate as well as in several-year practics, and the latter is much
much important to help me understanding what Statistics is, how it works and
how we should do. A background only with an education is not enough, you
must have enough chances to practics from a proposal, design ... to a report
, or from the beginning to the end.
BTW, my paper on the basic concepts and the fundamentals of Statistics was
finished and submitted to a journal yesterday night. I am looking forward to
be given a feedback ASAP. However I don't know if it will be accepted since
everything is random to everyone.
Thanks a lot for all of you.

【在 w*********o 的大作中提到】
: 回了这么长,感动ing
: 看来我随便问个本科教育就搔到了陈老师的痒处哦, 那么这个本科教育问题是不是陈
: 老师心中永远
: 的痛呢?
:
: 轻视地问我是谁教出来的。让我告诉他/她以及这里所有的人。
: 学的
: 老师有好几个,他们是同济医科大学公共卫生学院原卫生统计与社会医学教研室的老师
: 们,其中有
: 周有尚教授、梁浩材教授、余松林教授、刘筱娴教授、董时富教授、王增珍教授等以及

k****4
发帖数: 86
280
你们都是吃饱了撑的,统计对于大师只不过是副业,或表面上的主业。看他真正吃哪碗
饭的就知道了。

【在 w*********o 的大作中提到】
: 回了这么长,感动ing
: 看来我随便问个本科教育就搔到了陈老师的痒处哦, 那么这个本科教育问题是不是陈
: 老师心中永远
: 的痛呢?
:
: 轻视地问我是谁教出来的。让我告诉他/她以及这里所有的人。
: 学的
: 老师有好几个,他们是同济医科大学公共卫生学院原卫生统计与社会医学教研室的老师
: 们,其中有
: 周有尚教授、梁浩材教授、余松林教授、刘筱娴教授、董时富教授、王增珍教授等以及

相关主题
好奇问陈老师一个问题网上哪位比较熟悉分段回归的,能否简单介绍一下其基本的方法论?
临界回归模型的连续性统计学的新地平线——陈立功与他的自权重曲线
陈大师不是民科如果你不是孬种数学背景的统计学家,请接受挑战
进入Statistics版参与讨论
T*******I
发帖数: 5138
281
荷芝的这个评论有欠水准。
我的理论性既很深(对于没有认真读过的人来说),又非常浅(即使对于任何一个非数
学背景的人来说,只要他/她认真读了那篇paper);应用更不用说,非常有价值。
它不能被发表的真正原因在于我提出的理论颠覆了很多现行方法的理论基础,从而导致
很多方法论必须被重建。这是很多人不愿意看到的结果。
借此机会我想告诉大家,统计学历史上伟大的一天即将(确切地说,在我个人看是“已
经”)诞生了。真的毫不夸张。

【在 h***i 的大作中提到】
: 觉得review那里他通不过,theoretic的东西他不够deep, application没有优势, pa
: per没有sell point.

d******e
发帖数: 7844
282
陈大师真不愧是民科中的战斗机啊

【在 T*******I 的大作中提到】
: 荷芝的这个评论有欠水准。
: 我的理论性既很深(对于没有认真读过的人来说),又非常浅(即使对于任何一个非数
: 学背景的人来说,只要他/她认真读了那篇paper);应用更不用说,非常有价值。
: 它不能被发表的真正原因在于我提出的理论颠覆了很多现行方法的理论基础,从而导致
: 很多方法论必须被重建。这是很多人不愿意看到的结果。
: 借此机会我想告诉大家,统计学历史上伟大的一天即将(确切地说,在我个人看是“已
: 经”)诞生了。真的毫不夸张。

A*******s
发帖数: 3942
283

"这是很多人不愿意看到的结果。"
i don't think so. i think only Chinese don't like your theory. Instead, i
believe most white people who receive scientific training and God's blessing
are able to appreciate it. ASK THEM TO SUCK YOU UP.

【在 T*******I 的大作中提到】
: 荷芝的这个评论有欠水准。
: 我的理论性既很深(对于没有认真读过的人来说),又非常浅(即使对于任何一个非数
: 学背景的人来说,只要他/她认真读了那篇paper);应用更不用说,非常有价值。
: 它不能被发表的真正原因在于我提出的理论颠覆了很多现行方法的理论基础,从而导致
: 很多方法论必须被重建。这是很多人不愿意看到的结果。
: 借此机会我想告诉大家,统计学历史上伟大的一天即将(确切地说,在我个人看是“已
: 经”)诞生了。真的毫不夸张。

P****D
发帖数: 11146
284
你啥时候换个头像?我一看到你头像就想给你娃擦嘴,擦不到怪心痒痒的,强迫症了。

blessing

【在 A*******s 的大作中提到】
:
: "这是很多人不愿意看到的结果。"
: i don't think so. i think only Chinese don't like your theory. Instead, i
: believe most white people who receive scientific training and God's blessing
: are able to appreciate it. ASK THEM TO SUCK YOU UP.

s********p
发帖数: 637
285
me 2!

【在 P****D 的大作中提到】
: 你啥时候换个头像?我一看到你头像就想给你娃擦嘴,擦不到怪心痒痒的,强迫症了。
:
: blessing

A*******s
发帖数: 3942
286
hah hah....
i will replace it with a much messier one

【在 s********p 的大作中提到】
: me 2!
l*********s
发帖数: 5409
287
^__^

【在 P****D 的大作中提到】
: 你啥时候换个头像?我一看到你头像就想给你娃擦嘴,擦不到怪心痒痒的,强迫症了。
:
: blessing

a*****3
发帖数: 601
288
这个头像怎么样? 能不能也给擦下嘴?



【在 P****D 的大作中提到】
: 你啥时候换个头像?我一看到你头像就想给你娃擦嘴,擦不到怪心痒痒的,强迫症了。
:
: blessing

s********p
发帖数: 637
289
你的是女孩?很可爱啊!

【在 A*******s 的大作中提到】
: hah hah....
: i will replace it with a much messier one

s********p
发帖数: 637
290
。。。

【在 a*****3 的大作中提到】
: 这个头像怎么样? 能不能也给擦下嘴?
:
: 。

相关主题
陈大师的两大硬伤和两大法宝let's settle this once and for all
陈大师居然在维基百科上大放厥词一个统计学的问题,请大家指教
那些挺陈大师的多谢版主解封,并请教“什么是统计学?”
进入Statistics版参与讨论
A*******s
发帖数: 3942
291
换了这张,抓狂不?

【在 P****D 的大作中提到】
: 你啥时候换个头像?我一看到你头像就想给你娃擦嘴,擦不到怪心痒痒的,强迫症了。
:
: blessing

A*******s
发帖数: 3942
292
这张有没有点masculity了?

【在 s********p 的大作中提到】
: 你的是女孩?很可爱啊!
s********p
发帖数: 637
293
en, 这张不错!

【在 A*******s 的大作中提到】
: 这张有没有点masculity了?
P****D
发帖数: 11146
294
这张糊在嘴上的那些是固体,反而不抓狂了。上次那张不知道吃的是粥还是牛奶,看着
就要往下滴往下流的样子,擦不到抓狂不已。
静态照片而能让观众感受到如此动感,算不算是大师等级了?

【在 A*******s 的大作中提到】
: 换了这张,抓狂不?
o****o
发帖数: 8077
295
搞张你家mm正面非吃食的照片吧

【在 A*******s 的大作中提到】
: 这张有没有点masculity了?
A*******s
发帖数: 3942
296
你们这个classification model要改善啊
俺家“mm”是带把儿的好不好

【在 o****o 的大作中提到】
: 搞张你家mm正面非吃食的照片吧
a*****3
发帖数: 601
297
早就觉得图像主角是男的,手应该是女人的右手 - 想了想没敢说 - 知道我眼神儿不好。

【在 A*******s 的大作中提到】
: 你们这个classification model要改善啊
: 俺家“mm”是带把儿的好不好

a*****3
发帖数: 601
298
能有这效果? 我怎么没觉着。

着: 就要往下滴往下流的样子,擦不到抓狂不已。

【在 P****D 的大作中提到】
: 这张糊在嘴上的那些是固体,反而不抓狂了。上次那张不知道吃的是粥还是牛奶,看着
: 就要往下滴往下流的样子,擦不到抓狂不已。
: 静态照片而能让观众感受到如此动感,算不算是大师等级了?

P****D
发帖数: 11146
299
没觉得是你的幸运。我看着特别抓狂。

【在 a*****3 的大作中提到】
: 能有这效果? 我怎么没觉着。
:
: 着: 就要往下滴往下流的样子,擦不到抓狂不已。

P****D
发帖数: 11146
300
有很长一段时间,我以为你本人也是mm。

【在 A*******s 的大作中提到】
: 你们这个classification model要改善啊
: 俺家“mm”是带把儿的好不好

相关主题
数学家们在统计学领域犯下了几个严重的错误陈来错地方了
Re: 关于肖手术的最新review (转载)陈大师, 我很好奇
Great Confucius居然还有人试图和陈大师讨论统计问题
进入Statistics版参与讨论
l*********s
发帖数: 5409
301

估计都是逗你儿子玩呢,这么帅的小孩,怎么可能是女娃娃呢

【在 A*******s 的大作中提到】
: 你们这个classification model要改善啊
: 俺家“mm”是带把儿的好不好

1 (共1页)
进入Statistics版参与讨论
相关主题
那些挺陈大师的陈大师, 我很好奇
let's settle this once and for all居然还有人试图和陈大师讨论统计问题
一个统计学的问题,请大家指教也从工程的角度给陈老师提个意见吧.
多谢版主解封,并请教“什么是统计学?”好奇问陈老师一个问题
数学家们在统计学领域犯下了几个严重的错误临界回归模型的连续性
Re: 关于肖手术的最新review (转载)陈大师不是民科
Great Confucius网上哪位比较熟悉分段回归的,能否简单介绍一下其基本的方法论?
陈来错地方了统计学的新地平线——陈立功与他的自权重曲线
相关话题的讨论汇总
话题: 统计学话题: 统计话题: 数学话题: 模型话题: validation