由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - M家一道题
相关主题
问一道crack tech interview里面的题算法面试题
32MB 内存如何 sort 1GB datathread-safe blockingqueue
1G内存读10G文件菜鸟 贴一个 leetcode LRU Cache -- java代码,并求解疑惑。
google, vmware 面经请教一道, leetcode题.
征解几道large scale的数字题LRU cache 超时, 大家帮忙看看
问个CareerCup上external sort的题amazon第一轮电话要注意些什么
那个 google hint words 的老题An Old Question -- Top N Occurance Frequance
超大young矩阵查找问个google面试题(3)
相关话题的讨论汇总
话题: disk话题: sorted话题: computer话题: 数据话题: 101
进入JobHunting版参与讨论
1 (共1页)
t********y
发帖数: 14
1
有100台computer。每一台computer的disk capacity 是 1TB 并且满了,里面的数据是
sorted。computer 和 computer 之间的也是sorted (just like a 2D array sorted
by both row and column) 现在加一台新的computer,1TB disk。 要求把数据平均放
在这101台computer中, 并且数据仍sorted within each disk and between each
disk. 如何在disk之间copy 数据可minimize network traffic. (move data within a
disk is every low cost can be ignored.)
j*****y
发帖数: 1071
2
computer 和 computer之间也是 sorted, 意思是说一台机器上的所有数据都要比另
外一台机器上的任意数据要小吧?

sorted
a

【在 t********y 的大作中提到】
: 有100台computer。每一台computer的disk capacity 是 1TB 并且满了,里面的数据是
: sorted。computer 和 computer 之间的也是sorted (just like a 2D array sorted
: by both row and column) 现在加一台新的computer,1TB disk。 要求把数据平均放
: 在这101台computer中, 并且数据仍sorted within each disk and between each
: disk. 如何在disk之间copy 数据可minimize network traffic. (move data within a
: disk is every low cost can be ignored.)

t********y
发帖数: 14
3
yes.

【在 j*****y 的大作中提到】
: computer 和 computer之间也是 sorted, 意思是说一台机器上的所有数据都要比另
: 外一台机器上的任意数据要小吧?
:
: sorted
: a

j*****y
发帖数: 1071
4
感觉新加的机器应该排在中间

【在 t********y 的大作中提到】
: yes.
b*****u
发帖数: 648
5
make sense,
(1+2+...+50)*2 < (1+...+100)

【在 j*****y 的大作中提到】
: 感觉新加的机器应该排在中间
f*****e
发帖数: 2992
6
用O(N)也可以。
f*****e
发帖数: 2992
7
第101th machine to 1-101 slice。

【在 f*****e 的大作中提到】
: 用O(N)也可以。
w**********o
发帖数: 140
8
这个和k- sorted linkedlist 有差吗?
http://blog.sina.com.cn/s/blog_b9285de20101hg43.html
c********t
发帖数: 5706
9
求详细解释。
我和楼上几位想的一样,把101th 放在中间,然后所有的machine都往中间移数据

【在 f*****e 的大作中提到】
: 第101th machine to 1-101 slice。
f*****e
发帖数: 2992
10
我也这么想的。

【在 c********t 的大作中提到】
: 求详细解释。
: 我和楼上几位想的一样,把101th 放在中间,然后所有的machine都往中间移数据

b****g
发帖数: 192
11
我也是这么想的,但是还是感觉这么做比较原始,不知道有没有更好的方法

【在 f*****e 的大作中提到】
: 我也这么想的。
w**********o
发帖数: 140
12
抛个砖头吧,别笑话我啊。
我把101th放在最后。
比如说,1T可以分成10disks,假设每个电脑都有10disks。
Total disks(before): 100*10= 1000 disks,分100份,
Total disks(After) : 1000+1*10 = 1010disks, 分101份
1000/101 = 9.9 d
101给100要9.9d, 100给99要9.9d, ....2给1要9.9d.
因为101给100要的同时,100也给99要,以此类推,2跟1要。
假如disk copy的速度都是一摸一样的话, 应该可以达到linear
我猜测的优化,可以优化 每个TB里面拥有disk的数目, 比如1000Disks/T。
PS: 可以把最新的,放在100位置,让原来的100变成101.
谢谢各位。
1 (共1页)
进入JobHunting版参与讨论
相关主题
问个google面试题(3)征解几道large scale的数字题
A家一面问个CareerCup上external sort的题
EA 面筋那个 google hint words 的老题
Some coding problems from Amazon超大young矩阵查找
问一道crack tech interview里面的题算法面试题
32MB 内存如何 sort 1GB datathread-safe blockingqueue
1G内存读10G文件菜鸟 贴一个 leetcode LRU Cache -- java代码,并求解疑惑。
google, vmware 面经请教一道, leetcode题.
相关话题的讨论汇总
话题: disk话题: sorted话题: computer话题: 数据话题: 101