由买买提看人间百态

topics

全部话题 - 话题: regression
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
d******e
发帖数: 7844
1
regression是Model.
EM是一种优化和参数估计的算法,呵呵。
一回事就怪了
K****n
发帖数: 5970
2
弱问linear regression不是求逆矩阵么,迭代是哪一步来着?
s*i
发帖数: 388
3
data像这样:
X = (store, zipcode), Y = popularity.
e.g.
(walmart, 10010), popular.
(safeway, 90100), not popular.
(walmart, 10600), popular.
....
etc
try to build a logistic regression model on this dataset.
w****n
发帖数: 266
4
来自主题: CS版 - regression analysis
现在有组数据, 200多个变量, 想做回归分析, 请教attribute selection 和
regression algorithm,有什么参考书可以看看,google了一阵没有头绪。
w****n
发帖数: 266
5
来自主题: CS版 - regression analysis
trainingset 10万sample,200个attribute
regression 的LSE 有哪些具体的算法呢? 就像 classification里的kNN, random
forest类的
feature selection呢? 跟classification的一样?
w****n
发帖数: 266
6
来自主题: CS版 - regression analysis
现在有组数据, 200多个变量, 想做回归分析, 请教attribute selection 和
regression algorithm,有什么参考书可以看看,google了一阵没有头绪。
w****n
发帖数: 266
7
来自主题: CS版 - regression analysis
trainingset 10万sample,200个attribute
regression 的LSE 有哪些具体的算法呢? 就像 classification里的kNN, random
forest类的
feature selection呢? 跟classification的一样?
d*****u
发帖数: 17243
8
来自主题: CS版 - regression analysis
那还好,维度不算特别高
feature selection并没有公认最好的办法
有的就是轮着在training data上试验,看哪个不好就抛弃哪个
为了省时间,也可以用一些greedy的方法
有的则是找feature之间的corrrelation
correaltion大的feature能提供的信息少,可以抛弃
任何regression其实是一个loss function加上一个regularization term
loss function取决于你选定的模型的计算结果跟实际结果的差异
regularization term则是你对模型参数的限制
LSE就是预测结果与实际结果之差的平方和
回归的目的就是要最小化这个LSE的值
这些公式都是现成的,一搜就有
w****n
发帖数: 266
9
来自主题: CS版 - regression analysis
请问有没有详细的资料推荐一下, 手头的data mining书主要讲classification和其他
的, regression没提。
d*****u
发帖数: 17243
10
来自主题: CS版 - regression analysis
那还好,维度不算特别高
feature selection并没有公认最好的办法
有的就是轮着在training data上试验,看哪个不好就抛弃哪个
为了省时间,也可以用一些greedy的方法
有的则是找feature之间的corrrelation
correaltion大的feature能提供的信息少,可以抛弃
任何regression其实是一个loss function加上一个regularization term
loss function取决于你选定的模型的计算结果跟实际结果的差异
regularization term则是你对模型参数的限制
LSE就是预测结果与实际结果之差的平方和
回归的目的就是要最小化这个LSE的值
这些公式都是现成的,一搜就有
w****n
发帖数: 266
11
来自主题: CS版 - regression analysis
请问有没有详细的资料推荐一下, 手头的data mining书主要讲classification和其他
的, regression没提。
l*******s
发帖数: 1258
12
来自主题: CS版 - regression analysis
试试 SMO regression
然后换不同的kernel function
b******x
发帖数: 826
13
来自主题: CS版 - regression analysis
Partial least squares, reduced rank regression, lasso/elastic net
you can find those from Hastie et al's Element of Statistical Learning
nips 2012, Fukumizu has a new paper on kernel dimension reduction and
feature selection
s*********g
发帖数: 2350
14
如果可以,demo code 是什么?需要知道所有regression 的统计量: beta, R^2, p-
value
如果没有这个function. Colt 中怎么求逆矩阵?
谢谢。
OE
发帖数: 369
15
最近在Java里用multithreading把logistic regression on 3 billion records作出来
了,原始数据大概1个T, 在 8-core 的 server 上用时不到一个小时。 想在简历上吹
吹,有没有大牛给点建议。
s********s
发帖数: 3945
16
来自主题: Programming版 - stats output of regress in matlab
For the function
[b,bint,r,rint,stats] = regress(y,X)
where stats = [r2 F prob s2];
My question is what the definition of s2 is. In matlab web, "s2" is defined
as the square of the root mean square error (RMSE) value. So it should be
the same as MSE (mean square error), right?
Thanks for your correction.
p*******y
发帖数: 133
17
Hi
I am trying to create a excel sheet to do weighted linear regression. This
sheet is intended to be shared with other ppl as a template.
I used user defined function downloaded from http://www.adamslim.com/ModellingGuides/ModellingGuidesWLR.htm. However, when I copy the excel sheet to other drive or other computer, it always report missing link and the function stopped working properly.
Can somebody help me with it?
THanks.
w**********y
发帖数: 1691
18
likelihood
A personal subjective suggestion: simply devide your log likelihood by the
number of your data, then you will have the sense of the goodness of fit.
Mean error
training error and true (predictive) error
-I didn't know how people utilized "cross validation" with 'holdout' data,
until I worked in an insurance company. Theoratically, what they did is not
that perfect.
AIC, BIC
There is no big difference for model evaluation in theory between linear and
non-linear regression. Just harder
t*****3
发帖数: 878
19
【 以下文字转载自 Statistics 讨论区 】
发信人: temp123 (ttt), 信区: Statistics
标 题: 什么SAS命令可以执行multivariate regression???
发信站: BBS 未名空间站 (Thu Dec 18 12:46:39 2008)
而且,可以知道P-VALUE??
n******d
发帖数: 18
20
来自主题: Computation版 - SAS hierarchical regression
有没有人用SAS做过 hierarchical regression?
model 是这样的:
1. M=bX+u
2. b=cZ+v
其中 M, X, Z 是以知的变量,u,v 是error, b,c 是需要的参数。
D*****r
发帖数: 183
21
【 以下文字转载自 CompSci 讨论区 】
【 原文由 Dreaner 所发表 】
急用,或者别的SVM incremental regression
包也行。谢谢
N*****k
发帖数: 72
22
来自主题: Computation版 - [转载] Question about Regression
【 以下文字转载自 Statistics 讨论区 】
【 原文由 Network 所发表 】
俺们不是学数学的
有个处理数据,regression的问题过来请教各位哥哥姐姐
有一个现成的公式用来逼近,只有一个量未知
然后用MMSE(Minimum Mean Square Error)加上实验采集的一组数据来逼近未知量
现在需要在不同的仪器上收集数据(逼近公式中有一个简单的仪器参数,不同仪器略微不同)
每一个一起最后得到的结果都不相同,
问有没有算法能够将不同仪器得到的数据合并,最后得到一个最优的未知量
多谢
m*********s
发帖数: 20
23
来自主题: Computation版 - A problem in Logistic regression
I run a logistic regression with 4 groups of population. The SAS gave me 3
intercepts with several expected parameters for independent variables like
this:
Parameter DF Estimate Chi-Square Pr > ChiSq

Intercept1 1 -1.2821 0.2213 0.2189
Intercept2 1 -6.4327 0.2768 0.6587
Intercept3 1 -5.3247 8.2312 0.0085
CS1 1 23.
g******n
发帖数: 19
24
【 以下文字转载自 Statistics 讨论区 】
发信人: greensun (爱上了自己的尾巴), 信区: Statistics
标 题: 求源代码:多元非线性回归(multidimen nonlinear regression)
发信站: BBS 未名空间站 (Tue Jan 27 21:16:41 2009)
我的函数是y=1/(1+a*x1) * 1/(1+b*x2)
已知数据点x1(1...m) x2(1...m) y(1..m)
拟和系数 a ,b
我只在Numerical recipes 上找到一元的非线性回归算法(Levenberg–Marquardt
algorithm), 不知道那位肯指点一下二元的算法?fortran/c/c++ 代码都可以
谢谢//
h*********c
发帖数: 78
25
小m刚开始学习genetic algorithm,现在的project就是一个很简单的寻找最优回归函
数的问题,涉及到三个变量,老板推荐尝试symbolic regression,可是没有找到比较容
易上手的tutorial,不知道板上有没有牛人这方面比较在行,推荐一些入门的教材或者
tutorial?不胜感激!~~~
i*****o
发帖数: 42
26
来自主题: Economics版 - Question about Panel data regression
我在做panel data regression的时候加了一个很显著的independent
variable,但是R^2只有很小的改变,为什么?
其他的independent variable的的estimate和t-stat也没有大的变化
应该不是multicollearity的问题吧
是不是因为我的是fixed effect model,里面用了很多time series
dummy , cross sectional dummy,因为regressors太多了,所以加一个即
使自己很显著的变量R^2变化也不会大?
请指教,多谢!
e********I
发帖数: 693
27
☆─────────────────────────────────────☆
reshaping (0818283848) 于 (Tue May 13 16:43:39 2008) 提到:
发信人: reshaping (0818283848), 信区: Statistics
标 题: 初级probit regression问题请教
发信站: BBS 未名空间站 (Tue May 13 15:44:49 2008), 转信
如果DV里的1太多0太少,estimate结果会受到什么样的影响?
谢谢
☆─────────────────────────────────────☆
mmandroy (xiaoqing) 于 (Tue May 13 23:42:07 2008) 提到:
large variance.

☆─────────────────────────────────────☆
reshaping (0818283848) 于 (Tue May 13 23:43:13 2008) 提到:
就是比较不容易得到significance是么?
l********s
发帖数: 430
28
你说koenker不会推regression么?我看了他的书觉得他研究挺广了
F****r
发帖数: 345
29
来自主题: Economics版 - 关于regression的问题
My understanding is you need to run a regression of A on B to find the
relationship between A and B.
Think about this: the stock price of Microsoft (A) probably will affect
market index (Z); the stock price of Coca-Cola (B) will also affect market
index (Z). Yet the stock price of Microsoft and Coca-Cola are unlikely
correlated.
Or think it this way: you may decompose Z into two parts, Z1 and Z2. Z1 is
correlated with A; Z2 is correlated with B. If Z1 and Z2 have no overlap (in
information), A a
J*****n
发帖数: 4859
30
来自主题: Economics版 - question about regression in plm
I am running the panel regression through plm and get following errors:
Error in plm.fit(formula, data, model, effect, random.method, inst.method) :
empty model
What does this error mean?
b******s
发帖数: 325
31
新手急需要帮助解释下REGRESSION COEFFICIENT.谢谢帮忙先!!!
Model:
Dependent var: Delta Y (which is the outcome change between baseline and a
follow-up measurement point)
Indepdent vars: baseline score category 1, baseline score category 2 (NOTE:
category 3 is the omitted category), plus a bunch of "state" dummies (VA, IN
, MD with MS as the ommited category) and a "treatment model" dummy (where 1
= diversion; 0, transition).
QUESTION 1:
So the constant is interpreted as "the average outcome change for population... 阅读全帖
a*****8
发帖数: 261
32
来自主题: EE版 - 什么是regression test
准备面试ASIC design,
请教大虾,什么是ASIC里regression test??
多谢
a*****8
发帖数: 261
33
来自主题: EE版 - 什么是regression test
谢谢答复。这么说,regression test 其实很简单了。
如果面试,会问什么问题呢?
先谢了
a********0
发帖数: 48
34
来自主题: Mathematics版 - 跪求polynomial regression
C(t)=a+bt+ct^2
dC/dt=b+2ct, at t=0, (dC/dt)i=b.
dC/dt=kC^2
ln(-dC/dt)=ln(k)+2ln(C)
ln(-dC/dt)i=ln(k)+2ln(C)i
Use polynomial regression analysis (Excel),
1, determine best b’s (with units and errors) for each concentration.
2, hence determine best k’s (with units and errors) for each concentration
T/min C1/M C2/M
0 1.000E-03 2.000E-03
1 9.933E-04 1.958E-03
2 9.791E-04 1.940E-03
3 9.616E-04 1.897E-03
4 9.603E-04 1.838E-03
5 9.459E-04 1.817E-03
6 9.492E-
g******n
发帖数: 19
35
【 以下文字转载自 Statistics 讨论区 】
发信人: greensun (爱上了自己的尾巴), 信区: Statistics
标 题: 求源代码:多元非线性回归(multidimen nonlinear regression)
发信站: BBS 未名空间站 (Tue Jan 27 21:16:41 2009)
我的函数是y=1/(1+a*x1) * 1/(1+b*x2)
已知数据点x1(1...m) x2(1...m) y(1..m)
拟和系数 a ,b
我只在Numerical recipes 上找到一元的非线性回归算法(Levenberg–Marquardt
algorithm), 不知道那位肯指点一下二元的算法?fortran/c/c++ 代码都可以
谢谢//
m*****e
发帖数: 692
36
来自主题: Mathematics版 - piecewise linear regression
问题:如果要对一维数据做piecewise linear regression但是不知道结点位置和分段
,请问最好的算法是什么,在节点连续或者不连续的情况下。。。谢了~
B****n
发帖数: 11290
37
You can check any book about nonlinear regression. The formula about 95%CI
interval for coefficients is commonly used.
J*y
发帖数: 271
38
来自主题: Mathematics版 - 问一个Linear regression的弱问题
Linear regression line 是通过 minimizes the sum of the SQUARE of the
vertical distances from the points to the line.
为什么不是那条 Sum of the vertical distances 最小的线?
谢谢
f**e
发帖数: 350
39
来自主题: Mathematics版 - 问一个Linear regression的弱问题
Linear regression by default uses least sqaures.
If you use the second criterion, this is called the least absolute deviation
estimator, which is more difficult to minimize.
J*y
发帖数: 271
40
来自主题: Mathematics版 - 问一个Linear regression的弱问题
谢谢。也就是说为了计算容易一点。
其实minimize sum of squared distances 的同时,也 minimize sum of distances.
我可不可以说regression line 就是那条sum of vertical distances from points to
fitted line is the smallest.

deviation
b***t
发帖数: 59
41
F-test的wiki里面有一段讲到了Regression problems,但是没有给出参考文献。
谁知道哪本书或者文献里有相关信息吗?书的话最好是有电子书我可以直接看。
文献的话有pdf文档最好了,或者给我期刊,年份,作者,页码也行。
B****n
发帖数: 11290
42
If you use matlab, the function nlinfit can fit nonlinear regression model
using least squares that allows restrictions for the parameters.
B****n
发帖数: 11290
43
If you use matlab, the function nlinfit can fit nonlinear regression model
using least squares that allows restrictions for the parameters.
r******s
发帖数: 2155
44
1. Assigning equal value or or unequal value to these two behavioral intention
is arbitrary. Theoretically, maybe one is stronger than other. Yet it is not
possible to quantify the difference.
2. From a methodological perspective, I suggest you dummy code them and do
multiple-logistic regression. Then results is much more interpretable and
methodologically sound.

variable





但是,如果我把愿意游行作为1,愿意罢工作为2,相加之后,我发现原来显著的好多inde

工以不同的权重,可是为什么这么一做原来显著的变量现在都不显著了呢?我是用spss
f********c
发帖数: 147
45
来自主题: PoliticalScience版 - 请教个logit model和logistic regression的问题。
logit model和logistic regression是不是指的同一个东西啊?? 如果不是的,区别在
那儿呢,能否请大侠给个参考文献? 非常感谢!!
B*********h
发帖数: 800
46
☆─────────────────────────────────────☆
maglion (da木头) 于 (Mon Mar 5 19:48:55 2007) 提到:
When M.A.E is preferred over M.S.E.? How to optimize the former, since it's
not 2nd derivable?
☆─────────────────────────────────────☆
maglion (da木头) 于 (Mon Mar 5 19:50:05 2007) 提到:
I was asked this. I can't even find the answer in my graduate-level linear
regression book. Any high-hand can share knowledge?

s
☆─────────────────────────────────────☆
pseudo (small man) 于 (Mon Mar 5 20:19:19 200
l****y
发帖数: 92
47
下学期有两门统计课可以选择,regression analysis和time series哪门课对quant的工
作帮助大?
t*****3
发帖数: 878
48
【 以下文字转载自 Statistics 讨论区 】
发信人: temp123 (ttt), 信区: Statistics
标 题: 什么SAS命令可以执行multivariate regression???
发信站: BBS 未名空间站 (Thu Dec 18 12:46:39 2008)
而且,可以知道P-VALUE??
b***k
发帖数: 2673
49
☆─────────────────────────────────────☆
realoption (Options) 于 (Thu May 28 01:30:22 2009) 提到:
如果给定上了百个相关变量,如何选择出来最有影响力的变量啊,多少变量的
multivariate regression是比较合适的,如何来确定啊?
请推荐一本从头到尾讲如何做econometrics 模型而且比较清楚的书或者文章,曾经系
统学过econometrics,但是从来没有用它做过任何东西
☆─────────────────────────────────────☆
daj (肉丝炒饭--小吵肉fan) 于 (Thu May 28 01:47:59 2009) 提到:
principle component analysis?

☆─────────────────────────────────────☆
AOL (朝闻道 夕可死矣) 于 (Thu May 28 01:51:04 2009) 提到:
感觉好像是典型PCA
经系
☆────────────────
i*****r
发帖数: 1302
50
哎...其实我的想法是想抛开这些学术书本上的东西,这些东西谁都知道,想从更实际应
用的地方出发.比如regression,某些vairable在某段时间内有预测能力的,但可能从某
点开始作用就慢慢下降,也许不久又会上升.当你意识到的时候,比如tstats,rsquare变
小的时候,已经发生了太晚了.我就在想能不能有什么办法能early detect模型的变化,
能够及时换走variable或者干脆放弃使用
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)