爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑
4 z# D. I$ P9 G, g( p$ J2 n* X' ^3 h2 h
其实是个概率问题。6 G- N3 @0 R: f) L4 _
那本CLRS算法导论中,第 5-2 练习题。$ g  |6 `* b, b- p! r
在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。/ b* L* c( @" N- B
问题就是这个人的表述* R, h  z2 e8 U* C. R3 S6 L
https://math.stackexchange.com/q ... orithm-running-time  f$ j9 ?( M$ e" r' v0 }/ d( K9 q

+ |6 X3 s7 Z) m按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)
+ |5 p4 m$ @' {( A
6 Z" i+ Q) _( a) f% R" N, c" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x".
8 _) _% ~3 z& f: I% D2 H/ ^3 a* G% p* e& d  q5 Z  S
没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。! y( z% f% ]' J- B2 i; A

& }3 C5 N9 A' _8 U3 v0 k. _老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑 , s" q, W. v, \" m8 J1 ?
. `7 h: d- m, W
您对答案的理解似乎有误。
) m4 P' f; h' o! u随机变量X是测试过的元素的数目
2 [/ K8 O* A% q# J8 u7 A1 z' x而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。: [9 Z, z7 H3 K0 }9 h. B; m
所以才有E(x)=sum(E(Xi))。
; X' W$ j5 L+ v& s! W8 E1 @8 h+ }而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
+ Y6 j: J5 ~( B( c+ B您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:
# Q% E3 p. z0 e8 V' y% Z6 G, M: n4 u9 \; F6 I3 e' I
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)5 ?$ h+ r& G1 s* ^
# M/ s; v# A) N9 s
然后从头开始:
! ]( f2 h& t2 A+ o7 jE(k|k)=1# _( |$ y' Q: J% l  h
E(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)  D: D/ P1 ^: r; [; Z9 E
E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)- _2 L- G1 l' {- t/ D, _
Finally, we can easily get E(k|n)=(n+1)/(k+1)( B2 X! X8 w. l8 q

6 m# q( b4 v( w$ |+ j6 [9 j- V原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32
- N7 T7 y1 t) `您对答案的理解似乎有误。
' b4 S2 x+ o" |; Q! W随机变量X是测试过的元素的数目, E; i- v* Z+ f( ?- c4 |
而随机变量Xi是另一组随机变量,每一个都是个ind ...
6 r7 K4 W4 I5 y5 I$ m5 n
明白了。6 N( F, M) k7 x- g" B6 y
是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)3 O+ D; N8 x$ _  Z) }
多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44- M/ u2 K) K! K
这个题目可以用递归的方法解决:( G9 I& T9 u1 p  I
& b) P, c# F* Z4 i
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)

8 e! c$ W5 T. d  Z
2 w; ~* d7 n# n' s7 y递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
, ?9 }8 o" N- N+ F* s* b9 v. ^递归法也是可以的。

* Y6 I2 c+ S' ^1 C0 v  P其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑
) V/ v+ F8 v! b0 V& B* w  \
老福 发表于 2022-3-26 12:01. ?7 ~8 t! c2 U- G
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...
6 w$ ]3 B& k5 k0 ?4 j* B

2 E% h$ S' t% i我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。1 Z+ G+ H/ a* e6 e
否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。% s, Z9 V4 Y$ |" I: E/ m2 ]
2 y2 P( m; l+ d( M
而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。
- W" h& X# h, q9 q8 I9 H* r  V所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
; I9 ]! [- m9 U6 U
$ W6 _1 k0 \4 vLet S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}.
: ~% m" y% Y: F9 {/ o9 j
) e6 s1 k  n1 t( C. ?# }0 I5 IFor w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.# p( h- t+ x2 f- N" v* S$ Y  P# ^
0 }3 r9 Y. O4 Q5 ~- Y
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).
& D& e& B& @# a& Q$ Y. R* b  o- C" n/ \% `  m; D7 q# E* U0 C( ]
There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).
- o- S8 b, [  @% J
9 ?7 W2 D$ E0 U% [/ r理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://aswetalk.net/bbs/) Powered by Discuz! X3.2