Expected value 和 std难题求教 - Quant版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Quant版 - Expected value 和 std难题求教

相关主题
● 【Probability Problem】一道面试题	● 这个公式是怎么得出的？
● 问一个简单的概率问题: 球和罐子	● 两个标准正太分布的乘积是什么分布？有什么特别的名称吗？
● 【Probability】一个题目	● 来说说某公司的大数据架构
● 我也能问个概率题吗	● [合集] a random variable question
● 一个面试题	● [合集] Call/Put的Gamma和Vega是在S=K时取到最大值吗？
● Conditional Independence的问题	● 一个问题请教大家 (转载)
● 问个题	● Trader Assistant 面试问题请教
● Jane Street 失败面经	● 面试题一道，不会。请高人指教

相关话题的讨论汇总
话题: 10话题: 数据流话题: expected话题: value话题: 概率

进入Quant版参与讨论

1

(共1页)

l*******e 发帖数: 17	1 准备面试的时候，看面经发现一道以前的概率题，完全不知道怎么做。现在求助版上的大神。题目如下： 1．基本问题。一个数据流包含4个整数，每个整数随机分布在1到10之间，两端都包括，每个数的概率是一样的（即都是十分之一），这个数据流会被一个函数处理，这个函数会保留这个数据流里面最大的两个数，并且返回这两个最大数的乘积。假设这个函数会处理很多这样的数据流，请问这个函数返回的乘积的expected value和 std 是多少？举几个例子：第一个数据流包含8,4,9,2。最大的两个数是8和9，返回72. 第二个数据流包含10,2,5,10，最大两个数是10,10, 返回 100. 。。。。。。以此类推先说说我的思路。如果这个题不是问乘积，而是问最大值的expected value，就变得比较简单。要算最大值的expected value, 可以用下面的方法。假设最大值是k,那么k是最大值的概率为(k^4-(k-1)^4)/10^4。也就是说要k是最大值，这个数据流里面的每个数都只能取1至k,总共有k^4取法。但是还要去除某些不包含k的组合，这些组合有（k-1）^4种，而总的组合方式有10^4种。两者相除就是上面的答案。 K可以取1至10里面的任意值，所以expected value 就是 10（10^4-9^4）/10^4 +9（9^4-8^4）/10^4+……。我算了下，答案是8.4667。我同时写了个程序模拟了下，模拟的值也和这个大难吻合。所以我觉得这个计算方法应该是正确的。但是要算最大乘积的expected value,我现在还没想到好的方法。有几个思路但是都还觉得有缺陷。我写了个程序模拟了下，答案应该是56.96-57之间。但是用统计的方法不知道怎么做。希望版上的大神能够提供下思路或者解法。 2. Follow up：如果这个数据流的长度是T,而现在要计算最大的N个数的expected value和std，又应该如何计算呢？
a*******e 发帖数: 253	2 我觉得能否把各种情况的概率都算出来，譬如最大两个数都是10的概率，最大两个数是 10和9的概率，分别都算出来，然后算mean和std不就可以了么 std 【在 l*******e 的大作中提到】 : 准备面试的时候，看面经发现一道以前的概率题，完全不知道怎么做。现在求助版上的 : 大神。 : 题目如下： : 1．基本问题。一个数据流包含4个整数，每个整数随机分布在1到10之间，两端都 : 包括，每个数的概率是一样的（即都是十分之一），这个数据流会被一个函数处理， : 这个函数会保留这个数据流里面最大的两个数，并且返回这两个最大数的乘积。假设 : 这个函数会处理很多这样的数据流，请问这个函数返回的乘积的expected value和 std : 是多少？ : 举几个例子： : 第一个数据流包含8,4,9,2。最大的两个数是8和9，返回72.
l*******e 发帖数: 17	3 我也是这么想的，但是具体来实现有点小瑕疵，比如最大两个是（10,10）的话，另外两个可以是1到10的任何数，然后是要考虑各种排列。如果最大两个是（10,9）的话，另外两个数可以是1到9的任何数，然后考虑排列。现在我纠结的就是具体每个情况的排列怎么算（本人非统计和数学出身，所以功底比较差）。而且这个做法要解决follow up的问题会比较头疼。假如数据流的长度是8，要算最大4个数的乘积的expected value 的话，用这个办法可能比较麻烦。【在 a*******e 的大作中提到】 : 我觉得能否把各种情况的概率都算出来，譬如最大两个数都是10的概率，最大两个数是 : 10和9的概率，分别都算出来，然后算mean和std不就可以了么 : : std
a*******e 发帖数: 253	4 4个数里面最大两个数都是10的概率我是这么算的：只有一个10的概率是(49^3)/(10^4),没有10的概率是(9^4)/(10^4),然后所求概率为1 减去前面两个概率之和。其他组合以此类推。。求版上大神们指正。 value 【在 l******e 的大作中提到】 : 我也是这么想的，但是具体来实现有点小瑕疵，比如最大两个是（10,10）的话，另外 : 两个可以是1到10的任何数，然后是要考虑各种排列。如果最大两个是（10,9）的话， : 另外两个数可以是1到9的任何数，然后考虑排列。现在我纠结的就是具体每个情况的排 : 列怎么算（本人非统计和数学出身，所以功底比较差）。而且这个做法要解决follow : up的问题会比较头疼。假如数据流的长度是8，要算最大4个数的乘积的expected value : 的话，用这个办法可能比较麻烦。
l*******e 发帖数: 17	5 1 我想的也差不多，但是具体到其他组合这个算法可能要改一下。举个例子，假设最大的两个数是（8,7），那么剩下的两个数只能是1到7中间选，每个数的可能性是7，所以两个数就是7^2。然后要算在这种情况下的总排列数，可能的情况有（8,7,7,7,），（8,7,7,6），（8，7,1,2)......等等。要算这个组合的概率的话，底数当然是10^4，但是怎么算正确的排列数呢？敢问 apollolee (皮皮狗)兄台，要是（8,7）的情况，这里的概率应该怎么算呢？另外一种可能的组合是（7,7），我觉得（ 7,7）和（8,7）的算法也应该不一样？【在 a******e 的大作中提到】 : 4个数里面最大两个数都是10的概率我是这么算的： : 只有一个10的概率是(49^3)/(10^4),没有10的概率是(9^4)/(10^4),然后所求概率为1 : 减去前面两个概率之和。其他组合以此类推。。 : 求版上大神们指正。 : : value
b********3 发帖数: 13	6 直接算？次序统计量的联合分布： P（ X_(1)，X_(2) = （i，j）,i>=j）=( C(4,2)2! (1/10) * (1/10)( j/10 ) ( j/10）） mean就是 \Sigma P(X_(1)，X_(2) = （i，j）,i>=j)(ij), 求和是在i>=j, 1<=i<= 10,1<=j<=10 var就是先算 \Sigma P(X_(1)，X_(2) = （i，j）,i>=j)(ij)^2 再减 mean^2 一般情况的话用次序统计量的联合分布得肯定得编程算了期待大神们的解法
l*******e 发帖数: 17	7 ( 我写的程序大概结构就是这样的，唯一觉得不太能拿的准的地方就是这里 P（ X_(1)，X_(2) = （i，j）,i>=j）=( C(4,2)2! (1/10) * (1/10)( j/10 ) (j /10））。这貌似是个很基本的排列组合问题，但是我这块基础太差了。。。。。。【在 b*******3 的大作中提到】 : 直接算？ : 次序统计量的联合分布： : P（ X_(1)，X_(2) = （i，j）,i>=j）=( C(4,2)2!* (1/10) * (1/10)( j/10 ) ( : j/10）） : mean就是 \Sigma P(X_(1)，X_(2) = （i，j）,i>=j)(ij), 求和是在i>=j, 1<=i<= : 10,1<=j<=10 : var就是先算 \Sigma P(X_(1)，X_(2) = （i，j）,i>=j)(ij)^2 再减 mean^2 : 一般情况的话用次序统计量的联合分布得肯定得编程算了 : 期待大神们的解法
l*******e 发帖数: 17	8 ( bigswing23 兄台能解释下: P（ X_(1)，X_(2) = （i，j）,i>=j）=( C(4,2)2! (1/ 10) * (1/10)( j/10 ) (j/10））是怎么得到的吗？我考虑了几个例子，假设最大的两个数是（8,7）或者（7,7），这个算概率的方法貌似不正确。也许是我理解不正确？？【在 b*******3 的大作中提到】 : 直接算？ : 次序统计量的联合分布： : P（ X_(1)，X_(2) = （i，j）,i>=j）=( C(4,2)2!* (1/10) * (1/10)( j/10 ) ( : j/10）） : mean就是 \Sigma P(X_(1)，X_(2) = （i，j）,i>=j)(ij), 求和是在i>=j, 1<=i<= : 10,1<=j<=10 : var就是先算 \Sigma P(X_(1)，X_(2) = （i，j）,i>=j)(ij)^2 再减 mean^2 : 一般情况的话用次序统计量的联合分布得肯定得编程算了 : 期待大神们的解法
c**********e 发帖数: 534	9 Can't type Chinese. First note that for i.i.d {X_1,X_2,...,X_n} with c.d.f F, the c.d.f. of max{ X_1,...,X_n} is F^n. Then condition on the value of the largest one.
b********3 发帖数: 13	10 确实错了原来的想法：一个数取i:1/10,一个数取j:1/10, 剩下的俩数在 1-j之间 j/10, 我原来的答案这样是认为C(4,2)2!种取法是错的，多算了直接数手算感觉算不出来有数字可以相互相等的情况会mess up。换一种想法：P(i,K,T):= 数据流长度是T（T个样本）,数据在1-K之间均匀取，最大值为i的概率。则 P（ X_(1)，X_(2) = （i，j）,i>=j） = P（ X_(2) = j\|X_(1) = i）P(X_(1) = i) P(X_(1) = i) = P(i,K,T) P（ X_(2) = j\|X_(1) = i） = P(j,i,T-1) 这样一般情况貌似也能算？ 1/ 【在 l******e 的大作中提到】 : : ( : bigswing23 兄台能解释下: P（ X_(1)，X_(2) = （i，j）,i>=j）=( C(4,2)2!* (1/ : 10) * (1/10)( j/10 ) (j/10））是怎么得到的吗？我考虑了几个例子，假设最大的 : 两个数是（8,7）或者（7,7），这个算概率的方法貌似不正确。也许是我理解不正确？ : ？

1

(共1页)

进入Quant版参与讨论

相关主题
● 面试题一道，不会。请高人指教	● 一个面试题
● a math problem	● Conditional Independence的问题
● 关于American put数值方法的一点困惑	● 问个题
● 谁来介绍一下美国的商业银行创造信用（贷款额）受到什么限制？	● Jane Street 失败面经
● 【Probability Problem】一道面试题	● 这个公式是怎么得出的？
● 问一个简单的概率问题: 球和罐子	● 两个标准正太分布的乘积是什么分布？有什么特别的名称吗？
● 【Probability】一个题目	● 来说说某公司的大数据架构
● 我也能问个概率题吗	● [合集] a random variable question

相关话题的讨论汇总
话题: 10话题: 数据流话题: expected话题: value话题: 概率

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)