t***q 发帖数: 418 | 1 有这样一个问题,有一组约63000个id,发出100 million个请求,有的id发出的请求个数
多,有的id发出的请求个数少,这么多id的请求个数有一个分布,分布的histogram,是
skew to the right的.现在另有200 million个请求,是另一组id发出的.但assume 这组
id的请求个数的分布,和先前那63000个id的请求个数的分布一样.现要从这200 million
个请求里抽样,问至少要抽多少请求后,所得到的对应的id覆盖了这200 million个请求
所对应的所有id的50%.多谢!春节愉快! |
|