c***g 发帖数: 472 | 1 即将第一轮电话面试, Demand Generation team, 有谁面试过这个group么?
另外网上看到一个题目, 没有看到合适的解答, 请问有谁帮忙提示一下, 谢谢了
基本题目是这样的, 就是找用户最多的3连击, 好像还有一个类似的题目的, 不记得了.
1. 很长的log file记录了用户访问amazon.com的过程,两列分别为 userID 和
pageName.
log从上倒下按照点击发生的时间顺序。找出最popular的3连击。
eg:
zhang welcome
Li Hello
Wang welcome
Li books
Wang Hello
zhang books
Li shopping cart
Li checkout
zhang shopping cart
Wang camera
zhang checkout | k***e 发帖数: 556 | 2 it was discussed on this board before
try to search for it
i know there are a lot ...
good luck!
了.
【在 c***g 的大作中提到】 : 即将第一轮电话面试, Demand Generation team, 有谁面试过这个group么? : 另外网上看到一个题目, 没有看到合适的解答, 请问有谁帮忙提示一下, 谢谢了 : 基本题目是这样的, 就是找用户最多的3连击, 好像还有一个类似的题目的, 不记得了. : 1. 很长的log file记录了用户访问amazon.com的过程,两列分别为 userID 和 : pageName. : log从上倒下按照点击发生的时间顺序。找出最popular的3连击。 : eg: : zhang welcome : Li Hello : Wang welcome
| m******9 发帖数: 968 | | k***e 发帖数: 556 | 4 xixi. i see my post inside
【在 m******9 的大作中提到】 : check this out: : http://www.mitbbs.com/article_t/JobHunting/31487345.html
| b********w 发帖数: 110 | 5 这道题目我第二面的时候也问过,
两次hash,第一次hash 人名, 然后chain pages
第二次,每个chain,依次取三个,再hash
在第二个hash table 里面返回最大值。
interviewer 还算满意,但是又问我,可能有一个用户click的次数可能大大多余
其他的,譬如1000此,按我的方法就要998个triplet用来hash, 怎样优化。我说
可以用distributed hash table, 他说其实不是,好像是优先考虑最新的click,但是
他没有说很详细。
| s**9 发帖数: 207 | 6 是不是就存最近的三个,来一个新的,扔掉一个最老的,再对这个triplet计数
【在 b********w 的大作中提到】 : 这道题目我第二面的时候也问过, : 两次hash,第一次hash 人名, 然后chain pages : 第二次,每个chain,依次取三个,再hash : 在第二个hash table 里面返回最大值。 : interviewer 还算满意,但是又问我,可能有一个用户click的次数可能大大多余 : 其他的,譬如1000此,按我的方法就要998个triplet用来hash, 怎样优化。我说 : 可以用distributed hash table, 他说其实不是,好像是优先考虑最新的click,但是 : 他没有说很详细。 :
|
|