百度面试题，any idea? - Programming版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Programming版 - 百度面试题，any idea?

相关主题
● [合集] 讨论一道很简单的题...	● 四道C++面试题
● 贡献一下：本版上搜集的 Google 面试题 (转载)	● [合集] 整理了一些面试题和解答，请大家指点
● 问一道面试题	● [合集] C语言面试题, 如何得到一个字符串长度? (不许遍历)
● 问一下：怎么算复杂度？	● 请教算法题
● Interview questions about hash function	● std::map 为什么没有排序呢
● 哪位大侠给说说何时用 merge sort, 何时用 quick sort，何时	● 分别用LinkedList和HashMap构建字典树(Compact Trie)怎么做
● 构建一个快速查询字典（数据结构题）？	● INTEGER搜索求建议
● 请问各位工作的人，算法复杂度分析在工作中用的着吗？	● 有什么教程分析Java常见面试题的复杂度的？

相关话题的讨论汇总
话题: hash话题: db话题: space话题: any话题: 面试题

进入Programming版参与讨论

1

(共1页)

N***m 发帖数: 4460	1 大量的URL字符串，如何从中去除重复的，优化时间空间复杂度。我只想到了最笨的办法。
D*******a 发帖数: 3688	2 hash 【在 N***m 的大作中提到】 : 大量的URL字符串，如何从中去除重复的，优化时间空间复杂度。 : 我只想到了最笨的办法。
g*********s 发帖数: 1782	3 trie 【在 D*******a 的大作中提到】 : hash
g*****g 发帖数: 34805	4 Practically, people will put it in DB, using a b-tree index. And in the scale of 10s of millions, use DB segment. 【在 N***m 的大作中提到】 : 大量的URL字符串，如何从中去除重复的，优化时间空间复杂度。 : 我只想到了最笨的办法。
c*****t 发帖数: 1879	5 用 DB 的最根本问题是，importing 很痛苦。没必要。query 倒是简单。前面说的 hash 就不错。文件太大的话，可以用 hash 先 partition 一下。再把同一 hash 里的 sort / unique 搞定。这题有点 Map/Reduce 的意思。完全可以平行计算。【在 g*****g 的大作中提到】 : Practically, people will put it in DB, using a b-tree index. : And in the scale of 10s of millions, use DB segment.
D*******a 发帖数: 3688	6 db里面的deduplication实际上也是用hash。【在 c*****t 的大作中提到】 : 用 DB 的最根本问题是，importing 很痛苦。没必要。query 倒是简单。 : 前面说的 hash 就不错。文件太大的话，可以用 hash 先 partition 一下。 : 再把同一 hash 里的 sort / unique 搞定。 : 这题有点 Map/Reduce 的意思。完全可以平行计算。
l********f 发帖数: 149	7 With Hash, the complexity will be O(n) and will take O(n) space as well. O(n) space maybe too much, is there any better way?
l********f 发帖数: 149	8 Sorting is O(nlgn) but with zero space. 【在 l********f 的大作中提到】 : With Hash, the complexity will be O(n) and will take O(n) space as well. : O(n) space maybe too much, is there any better way?

1

(共1页)

进入Programming版参与讨论

相关主题
● 有什么教程分析Java常见面试题的复杂度的？	● Interview questions about hash function
● 请构造个数据结构，满足：	● 哪位大侠给说说何时用 merge sort, 何时用 quick sort，何时
● 一道Microsoft的面试题	● 构建一个快速查询字典（数据结构题）？
● 算法问题求教：字符串比较	● 请问各位工作的人，算法复杂度分析在工作中用的着吗？
● [合集] 讨论一道很简单的题...	● 四道C++面试题
● 贡献一下：本版上搜集的 Google 面试题 (转载)	● [合集] 整理了一些面试题和解答，请大家指点
● 问一道面试题	● [合集] C语言面试题, 如何得到一个字符串长度? (不许遍历)
● 问一下：怎么算复杂度？	● 请教算法题

相关话题的讨论汇总
话题: hash话题: db话题: space话题: any话题: 面试题

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)