由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - dropbox一道题
相关主题
丢盒子(D**ox)面筋G家店面design题目
Bloomberg 电面Y家新鲜面经
hash_map 的遍历问题我发现我竟然学会了12种tree traversal的办法
谁有那个 nested hashmap iteration 的讨论阿?请问怎样写没有parent pointer的BST iterator?
请教个面经里的设计题L家的高频题merge k sorted arrays giving iterators求讨论!
谁来解释下hashtable的iterator是怎么实现的reverse an array
FB设计题求教。Google电面
老年马工赶快去 fb请教一个新鲜算法面试题
相关话题的讨论汇总
话题: photoid话题: 道题话题: dropbox话题: log话题: 访问
进入JobHunting版参与讨论
1 (共1页)
f*********l
发帖数: 46
1
给出一堆log, 里面有photo id和访问时间, 还有一个iterator, 能够按照photoId
和访问时间iterate, 问如何输出top m的访问photo
followup: 如何存储这些log, 来支持方便的retrieve 这些信息.
哪位大神能给个思路吗?谢谢!
t**r
发帖数: 3428
2
先遍历一遍存成哈希表 再用heap?
存在内存或缓存里 Id : list of acces time
H*****s
发帖数: 9
3
如果iterator可以按photoid排序,那一个heap就可以,
否则用hashmap存photoid和count
如果单机内存不够放整个hashmap,可以考虑用distributed memory cache,比如
memcache或者redis.
存数据的时候最好用photoid shard到不同的小文件中,这样计算的时候不需要存整个
photoid的空间,可以把计算top m的工作distribute到多台机器上计算,最后merge。
也可以用mapreduce
g*****u
发帖数: 298
4
log是已经写好的,还是还在不停写,要给出当前top m?
不管怎么样,都得知道每个photo的frequency,然后根据frequency做partial sort取
top m。楼主,这题是不是这意思呢?各位聪明的小白兔们说说看。

【在 f*********l 的大作中提到】
: 给出一堆log, 里面有photo id和访问时间, 还有一个iterator, 能够按照photoId
: 和访问时间iterate, 问如何输出top m的访问photo
: followup: 如何存储这些log, 来支持方便的retrieve 这些信息.
: 哪位大神能给个思路吗?谢谢!

f*********l
发帖数: 46
5
不太清楚,我也是从网上看的这道题目。应该是给定的一堆log,stream的情况也可以
讨论一下哈

【在 g*****u 的大作中提到】
: log是已经写好的,还是还在不停写,要给出当前top m?
: 不管怎么样,都得知道每个photo的frequency,然后根据frequency做partial sort取
: top m。楼主,这题是不是这意思呢?各位聪明的小白兔们说说看。

1 (共1页)
进入JobHunting版参与讨论
相关主题
请教一个新鲜算法面试题请教个面经里的设计题
解法讨论:(给定一个array和一个target,找出是否存在两个数之和为target)谁来解释下hashtable的iterator是怎么实现的
拓扑排序FB设计题求教。
求原题, 就是一个嵌套HashMap, 可能很深,实现iterator打印老年马工赶快去 fb
丢盒子(D**ox)面筋G家店面design题目
Bloomberg 电面Y家新鲜面经
hash_map 的遍历问题我发现我竟然学会了12种tree traversal的办法
谁有那个 nested hashmap iteration 的讨论阿?请问怎样写没有parent pointer的BST iterator?
相关话题的讨论汇总
话题: photoid话题: 道题话题: dropbox话题: log话题: 访问