爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑
$ q! K+ v- x7 D6 C  ^% e4 K: Z4 U; E7 _/ y0 u0 r) O
其实是个概率问题。
; U. E9 d- I6 ~/ v7 t7 d- @那本CLRS算法导论中,第 5-2 练习题。- u+ E+ V2 Y9 ?- O$ ~8 E% s7 Q9 {
在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。- ]- Z1 k' E) o2 u) O9 [6 z; X
问题就是这个人的表述1 C6 j5 Y" `. P3 \
https://math.stackexchange.com/q ... orithm-running-time9 j2 U. Q5 ~3 w1 e8 Q

0 U& s" |1 B1 V/ Y0 M; Z) C按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)! d) m; A! `2 K$ r# }0 Y/ @8 d

# }5 s8 v1 v( y- R/ e" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x".
/ z( C9 L( b* W8 E7 j' g" N; E- t* d( v, ]2 v8 r3 d
没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。
5 f. F$ {' h! S0 I& f0 q/ l* m/ N/ ]
老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑
6 A6 o5 L+ j# l9 x, |
* I: t3 x( i. I6 g# ^您对答案的理解似乎有误。
2 S6 `$ e; |1 `2 \- d随机变量X是测试过的元素的数目0 W1 W! U2 l- `$ }6 Z, I
而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。# d/ [* V. @( i5 v4 j$ @! x! W$ ^
所以才有E(x)=sum(E(Xi))。
( Z  @  z  A2 T2 l8 u/ z/ ^+ w" y而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
7 e2 l5 a% {" y" ?& N# J您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:6 ^9 X% }' V- }+ ?& }. w0 K/ G# Y

6 X8 `, b, ]" i8 n6 N0 D7 F2 w" mE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
$ k. S/ F6 A! \5 }
! U+ x9 M7 n1 U/ r. M, }4 w然后从头开始:; Q+ A+ S6 X* {- e) E) q
E(k|k)=1
) o9 V8 J) [" l% ~! mE(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)
4 C& [$ c* l- q7 \3 DE(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)
! ]5 b  @5 B  g( l4 K! c4 rFinally, we can easily get E(k|n)=(n+1)/(k+1)8 O  K2 p! @2 H4 E3 b$ R

, l7 N1 y* l& `' [9 Q8 @原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32
+ q% [8 M! M7 @: |7 Q, x您对答案的理解似乎有误。" |( n7 {2 L2 F2 @$ W, E
随机变量X是测试过的元素的数目7 Q9 M6 s2 y" @* o
而随机变量Xi是另一组随机变量,每一个都是个ind ...

8 Z- `" ]; O6 i  o, |明白了。
" X' ^6 o8 g, U9 @, [0 t5 ^: K+ n' ?是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)
) W( X% \( @# s& Y* T多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:448 U# u' T' @6 S
这个题目可以用递归的方法解决:
& u9 I, o5 ~1 g& H8 ~6 V8 C6 [5 c5 N: T5 m( y0 N
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
( K9 P) F: f- q+ @

2 H+ r$ v5 O) j% O递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07/ D1 P4 ^# t2 w5 C! l* L/ `
递归法也是可以的。
2 z6 a& ]6 ]2 e  ]5 m" Z4 n% u7 k
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑
$ o% l3 \+ _; L, z8 j
老福 发表于 2022-3-26 12:01
8 f/ i2 c  H1 N' z! I2 s其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...
% t7 n" S( j3 j' E$ B/ V0 @* e; A
7 M3 T: Q0 V0 D9 q# ?' c+ @
我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。
0 Y+ c# c0 ]/ E6 x$ W9 \6 V否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。
  a% |0 D" o( Z1 j: ~- s- ^
8 [. l7 D4 H) V而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。8 v# v0 ]* |( m8 g
所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。. c& t) B" ^& w7 ?) b% R& V1 @

6 ^8 p) I, X; T/ uLet S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}.
; s4 \4 `4 l9 `  [4 v
( ?* x1 b8 {( S/ s* A2 T( ]0 _For w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.
3 M% @7 ?5 q. @9 }" ~2 a0 C, }4 g1 h1 M; Q
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).9 s; k9 v& \3 w: q. k8 @, ]

" O1 y' N9 G, x& C/ F# C. \2 GThere are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).- ]# }8 q5 c6 X
5 W" W( Y$ s  R; I* P
理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://aswetalk.net/bbs/) Powered by Discuz! X3.2