c*******r 发帖数: 323 | 1 比如expedia, 有hotel在不同的城市和国家,用户从第三方网站链接过来后不一定book
,要估算这个conversion rate (booking/clicks). 现在有很多不同hotel 的数据,有
的只有几个click,有的有几千个,如果做linear regress rate = city + country +
start rating ...... city会有几百几千个lavel, 这个怎么处理?
然后有model后怎么判断model好坏?apply to validation data的话,算 sum (
predicted - actual)^2? 不同record不同权重怎么处理 (有的hotel 几个click,有的
几千个)? |
s*********e 发帖数: 1051 | 2 首先rate就不该用linearregression
其次,你的城市是随机效应还是固定效应。
book
+
【在 c*******r 的大作中提到】 : 比如expedia, 有hotel在不同的城市和国家,用户从第三方网站链接过来后不一定book : ,要估算这个conversion rate (booking/clicks). 现在有很多不同hotel 的数据,有 : 的只有几个click,有的有几千个,如果做linear regress rate = city + country + : start rating ...... city会有几百几千个lavel, 这个怎么处理? : 然后有model后怎么判断model好坏?apply to validation data的话,算 sum ( : predicted - actual)^2? 不同record不同权重怎么处理 (有的hotel 几个click,有的 : 几千个)?
|
c*******r 发帖数: 323 | 3 rate应该用什么model?
城市是随机效应还是固定效应是什么意思?暂时不确定城市对rate有没有影响
【在 s*********e 的大作中提到】 : 首先rate就不该用linearregression : 其次,你的城市是随机效应还是固定效应。 : : book : +
|
h***i 发帖数: 3844 | 4 你该找本书读读。
【在 c*******r 的大作中提到】 : rate应该用什么model? : 城市是随机效应还是固定效应是什么意思?暂时不确定城市对rate有没有影响
|
m******u 发帖数: 277 | 5 # of booking / # of trials
It sounds like you can apply logistic regression. :) |
d********i 发帖数: 193 | |
c*******r 发帖数: 323 | 7 logistic regression 应该把所有case单独列出来,Y不是rate,是yes or no把?
【在 m******u 的大作中提到】 : # of booking / # of trials : It sounds like you can apply logistic regression. :)
|
c*******r 发帖数: 323 | 8 good point. 但是conversion rate 不一定是poisson distribution. 可以是0和1之间
任何值,和上面列的因素有关。感觉研究每天有多少click的话这个model更合适?我再
看看,可能你说的对
用不同regression做Model之后,如何检验那个model就好呢?就用validation data
set?
thanks a lot
【在 d********i 的大作中提到】 : poisson regression
|
c*0 发帖数: 154 | 9 random effects fixed effects
【在 c*******r 的大作中提到】 : rate应该用什么model? : 城市是随机效应还是固定效应是什么意思?暂时不确定城市对rate有没有影响
|