爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑
* c/ a: g+ Q8 X* G) p- M
, W/ k; j- V3 c- {  B0 o$ {! d8 }其实是个概率问题。
) M. N: M0 k/ H2 ^( m那本CLRS算法导论中,第 5-2 练习题。
' k: f6 ?6 h- m在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。% C7 }8 Z8 U$ S: i( q
问题就是这个人的表述5 ?  _2 d6 J, H1 @1 `
https://math.stackexchange.com/q ... orithm-running-time5 Z% H5 G( J- n$ A6 A9 x

) B5 d0 B0 ?8 ~; s) k按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)+ D, M' S$ a' Y2 u

: V4 r0 D- K* o8 j" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x". ; y) [$ Y4 ?! r6 i( Q
  j3 _; q5 @- f
没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。
  r! j& `4 K" l. k( K, o& G& j7 ^4 x: C. l
老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑
+ r/ F3 A! g- G' f9 S
! y% y$ T; f, f2 s: U您对答案的理解似乎有误。7 k2 j" \. z2 l. H4 r& t' ^0 O
随机变量X是测试过的元素的数目4 p" Z" g2 g+ }; f% R: P
而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。
1 o' w  b1 K" ~( N; L% \- r2 X所以才有E(x)=sum(E(Xi))。
' |% M- Z( q- X' e# \- N- F! |而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)- t" f0 ?' |3 Z3 N/ {/ b+ V
您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:' [& |8 y9 S8 ^6 L5 G  ]/ i

. `$ U  ?3 j: K. g: h0 J* ~E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)/ u5 ?9 D1 O8 ?0 R

, P  |3 Q2 r& ^# k4 o然后从头开始:
% ?8 O. x9 I, I$ r1 F+ G8 EE(k|k)=1
5 F/ M1 K$ }; G, XE(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)3 c6 c1 f0 z) ]' I3 U6 Z( _' D! a
E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)
$ q9 j5 C5 Q- K$ J& QFinally, we can easily get E(k|n)=(n+1)/(k+1)+ ]' ?7 N4 [$ L& L# ], f- o

% _" N: J1 ?8 N3 E; n0 X) }原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32; ^# o+ R1 M' e. @2 l
您对答案的理解似乎有误。9 O9 o6 [. e: d/ a+ N6 J9 X
随机变量X是测试过的元素的数目
- f  ~0 q% e2 ]8 I- J- j而随机变量Xi是另一组随机变量,每一个都是个ind ...

' E% g  S3 }, X1 ]7 F# u" e明白了。! ^. o, E7 b2 ]$ D9 h2 a( z
是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)
0 N; T; L, x) b; ^! A多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44
  d2 C9 z5 y% r2 Q$ A0 t这个题目可以用递归的方法解决:# V; M7 Y3 ~  O8 a

- m1 z5 X+ m* eE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
" G: F7 I: P+ j  a( C9 I

( c5 ^- E9 E- L) G- m4 u递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
+ j5 L0 m' C  ~3 U$ w递归法也是可以的。
" l; U* w0 _* @
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑
( ^0 ?( Z) f+ x1 ?% r! s
老福 发表于 2022-3-26 12:01
8 ?: h5 J2 T; o3 S8 M9 ?6 ]% U1 ^其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...

9 z" K0 ], W, _# y' o- X- K( j% o: ]. M6 h0 M* }& Y4 H. E
我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。/ p& U! [0 {! t1 O5 J/ e& X
否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。
3 X$ b) K5 B% m6 F$ T" K) v8 L1 C: ?5 |' d. x% C
而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。% K7 D2 U: g$ v! \' @
所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
5 ]# }5 w( d, Z: L0 P( ]# l$ K& i1 R: n" M0 q. K8 c* \
Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}.
* X7 }  d9 b" O7 a* R& ?* ]6 t2 p
For w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.8 |3 }& Q4 |# |. A4 ]5 k$ ?3 G
( ]3 v  a3 d0 W4 Z( ~0 e
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).
; c! c1 U+ s; O$ I( l9 [9 k2 E9 I  @1 F/ G0 S; r3 U# a
There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).
3 K, |1 T3 u" ~! U+ G8 l- D9 D  X+ P. H, d3 l
理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://aswetalk.net/bbs/) Powered by Discuz! X3.2