c**2 发帖数: 99 | 1 投了一家类似consultancy的公司,电话面试,给了这样一个场景:
一个物流配送中心,根据客户(固定的)要求,每天安排发送货物,想根据历史数据,
知道每天什么时
候发货请求最多。
我第一次面试,又是英语,磕磕绊绊的很草率的说用cumulative logit model,比如把
时间分成白
天、晚上、凌晨(8am-4pm,4pm-12am,12am-8am),把days in a week分成begining (
Mon-
Tue), middle (Wed-Thu), and Weekend (Fri-Sun),把配送中心和各个客户的距离也
categorize一下成近、中、远。然后用cumulative logit模型预测在每个cell里的订单
数量是少
还是多。。。
电话对面的老印很奇怪,听完以后也没多说什么,就直接开始新话题了。
我想问问我的回答对吗?cumulative logit模型可以么?
文科转行读统计,好多地方都不明白,请大家轻拍我。。。 |
c**2 发帖数: 99 | 2 忘了说了,不是把所有的数据都拿过来分析,是抽一小部分数据
【在 c**2 的大作中提到】 : 投了一家类似consultancy的公司,电话面试,给了这样一个场景: : 一个物流配送中心,根据客户(固定的)要求,每天安排发送货物,想根据历史数据, : 知道每天什么时 : 候发货请求最多。 : 我第一次面试,又是英语,磕磕绊绊的很草率的说用cumulative logit model,比如把 : 时间分成白 : 天、晚上、凌晨(8am-4pm,4pm-12am,12am-8am),把days in a week分成begining ( : Mon- : Tue), middle (Wed-Thu), and Weekend (Fri-Sun),把配送中心和各个客户的距离也 : categorize一下成近、中、远。然后用cumulative logit模型预测在每个cell里的订单
|
k*******a 发帖数: 772 | 3 我觉得可以fit一个时间的2次模型 y=ax^2+bx+c
然后找到 maximum response |
c*****1 发帖数: 131 | 4 文科生这样很不错了。俺只知道根据历史数据,按时间做个FREQ统计,算算哪个小时出
货量最多,想不到去做预测模型的说。
【在 c**2 的大作中提到】 : 投了一家类似consultancy的公司,电话面试,给了这样一个场景: : 一个物流配送中心,根据客户(固定的)要求,每天安排发送货物,想根据历史数据, : 知道每天什么时 : 候发货请求最多。 : 我第一次面试,又是英语,磕磕绊绊的很草率的说用cumulative logit model,比如把 : 时间分成白 : 天、晚上、凌晨(8am-4pm,4pm-12am,12am-8am),把days in a week分成begining ( : Mon- : Tue), middle (Wed-Thu), and Weekend (Fri-Sun),把配送中心和各个客户的距离也 : categorize一下成近、中、远。然后用cumulative logit模型预测在每个cell里的订单
|
c**2 发帖数: 99 | 5 谢谢指点!这个没想到啊。。。
当时确实想到用time series,但是他说数据是随机抽取出来的让我分析,也就是说可
能上一个订单是
1号上午,第二个订单是5号下午,第三个又是5号晚上,那样的话在时间上不是equally
-interval
的。time series只学过一个学期,就知道ARMA model,不知道怎么分析这种数据了。
请问你说的这个模型里面,x是time么?这样的模型叫什么名字?我好上网搜一下再了解
了解。
【在 k*******a 的大作中提到】 : 我觉得可以fit一个时间的2次模型 y=ax^2+bx+c : 然后找到 maximum response
|
c**2 发帖数: 99 | 6 呵呵,可是招人的老印不care我是文科还是理科啊。你说的办法其实最
straightforward。
找工作以来在这个版上学习,看到的最多的就是logistic,所以立刻就想到它了。但是
合不合理啊,还
请你详细说说
【在 c*****1 的大作中提到】 : 文科生这样很不错了。俺只知道根据历史数据,按时间做个FREQ统计,算算哪个小时出 : 货量最多,想不到去做预测模型的说。
|
k*******a 发帖数: 772 | 7 我瞎说的,呵呵
如果这个这个时间就分成3断的话, 我觉得那可以用 one factor anova analysis做两
辆比较
啊,或者把日期加进去做block design,至于interval是不是不一样,问题不大,大不
了都除一个
interval变成rate,再比较
我那个方程不是time series模型,就是普通的linear regression,不过时间的是连续
变量
equally
【在 c**2 的大作中提到】 : 谢谢指点!这个没想到啊。。。 : 当时确实想到用time series,但是他说数据是随机抽取出来的让我分析,也就是说可 : 能上一个订单是 : 1号上午,第二个订单是5号下午,第三个又是5号晚上,那样的话在时间上不是equally : -interval : 的。time series只学过一个学期,就知道ARMA model,不知道怎么分析这种数据了。 : 请问你说的这个模型里面,x是time么?这样的模型叫什么名字?我好上网搜一下再了解 : 了解。
|
c**2 发帖数: 99 | 8 学习了,谢谢!
【在 k*******a 的大作中提到】 : 我瞎说的,呵呵 : 如果这个这个时间就分成3断的话, 我觉得那可以用 one factor anova analysis做两 : 辆比较 : 啊,或者把日期加进去做block design,至于interval是不是不一样,问题不大,大不 : 了都除一个 : interval变成rate,再比较 : 我那个方程不是time series模型,就是普通的linear regression,不过时间的是连续 : 变量 : : equally
|
F****n 发帖数: 3271 | 9 That's not cumulative model. That's multinomial model
【在 c**2 的大作中提到】 : 投了一家类似consultancy的公司,电话面试,给了这样一个场景: : 一个物流配送中心,根据客户(固定的)要求,每天安排发送货物,想根据历史数据, : 知道每天什么时 : 候发货请求最多。 : 我第一次面试,又是英语,磕磕绊绊的很草率的说用cumulative logit model,比如把 : 时间分成白 : 天、晚上、凌晨(8am-4pm,4pm-12am,12am-8am),把days in a week分成begining ( : Mon- : Tue), middle (Wed-Thu), and Weekend (Fri-Sun),把配送中心和各个客户的距离也 : categorize一下成近、中、远。然后用cumulative logit模型预测在每个cell里的订单
|
c**2 发帖数: 99 | 10 刚才仔细想了一下,确实不是cumulative logit,谢谢!
应该是一个3*3*3的table,对吧,time*day*distance
那就是用一般的logistic model就可以了,是吧?
唉,面试感觉不好,但是如果能把这个问题弄明白,也算是有点收获了。
【在 F****n 的大作中提到】 : That's not cumulative model. That's multinomial model
|
|
|
k*******a 发帖数: 772 | 11 这个题目和logistic没有啥关系吧
如果是lgoistic,那么你的random variable是什么?model没法写啊
【在 c**2 的大作中提到】 : 刚才仔细想了一下,确实不是cumulative logit,谢谢! : 应该是一个3*3*3的table,对吧,time*day*distance : 那就是用一般的logistic model就可以了,是吧? : 唉,面试感觉不好,但是如果能把这个问题弄明白,也算是有点收获了。
|
d*******1 发帖数: 293 | 12 这个其实就是一个比较的问题. 计算一下每个时间段的每天平均量,再用ANOVA比较以下
就可以了. |
i***y 发帖数: 130 | 13 一看lz就知道是完全没有工作经验只会乱套模型的人,我很老实兼不客气的告诉你别人
是不会buy你那套的,下面
的答案其实是最好
建模不是你想的那么简单的,连具体数据是什么有什么变量都不清楚谈什么建模呢
【在 c*****1 的大作中提到】 : 文科生这样很不错了。俺只知道根据历史数据,按时间做个FREQ统计,算算哪个小时出 : 货量最多,想不到去做预测模型的说。
|
s*****l 发帖数: 321 | 14 这个要model么?
【在 c**2 的大作中提到】 : 投了一家类似consultancy的公司,电话面试,给了这样一个场景: : 一个物流配送中心,根据客户(固定的)要求,每天安排发送货物,想根据历史数据, : 知道每天什么时 : 候发货请求最多。 : 我第一次面试,又是英语,磕磕绊绊的很草率的说用cumulative logit model,比如把 : 时间分成白 : 天、晚上、凌晨(8am-4pm,4pm-12am,12am-8am),把days in a week分成begining ( : Mon- : Tue), middle (Wed-Thu), and Weekend (Fri-Sun),把配送中心和各个客户的距离也 : categorize一下成近、中、远。然后用cumulative logit模型预测在每个cell里的订单
|
c**2 发帖数: 99 | 15 姐姐/妹妹说的很犀利,也很对,能不能再请教一下:
data如果是一个随机抽取一年中的若干天,然后我得出来一个结论:比如周四周五送货
需求最大,要安
排额外的人手,这样的结论只对我sample里的这些天有效吧,那有没有办法Inference
呢?
谢谢了,诚心求教。只是想弄明白问题
【在 i***y 的大作中提到】 : 一看lz就知道是完全没有工作经验只会乱套模型的人,我很老实兼不客气的告诉你别人 : 是不会buy你那套的,下面 : 的答案其实是最好 : 建模不是你想的那么简单的,连具体数据是什么有什么变量都不清楚谈什么建模呢
|
h*e 发帖数: 10233 | 16 不得不说,Frequency是最直观的了。我们在工作中也经常碰到这样的问题,基本上就
是看看hourly 和 week of day的frequency distribution.
【在 c*****1 的大作中提到】 : 文科生这样很不错了。俺只知道根据历史数据,按时间做个FREQ统计,算算哪个小时出 : 货量最多,想不到去做预测模型的说。
|