爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑
6 H" H+ T$ L# A
9 `0 P. S! o# L/ }8 |" ]4 |0 B2 \其实是个概率问题。* ?9 w* l* ~) d8 n9 F
那本CLRS算法导论中,第 5-2 练习题。
2 _$ Y9 l( m# r. ?$ m在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。
6 y( k) l, \! d$ g8 n# z2 z问题就是这个人的表述
0 H6 |+ @5 q8 d" T1 ?https://math.stackexchange.com/q ... orithm-running-time
# ^4 h. X2 }- L( _5 W
" {5 W+ V8 Z  m按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)
7 H# q& C; b- E# H
- D' [/ F5 Q/ w' {" _# q4 f: e$ P" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x".
. w7 y7 }- d$ d# q3 L- P8 Q/ R. Q3 t1 E8 m
没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。
% p' y  q) q" ~
& T$ Z' w1 Q/ P5 Z  u' s老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑
# t& o/ K4 B7 q6 s9 u* d! s7 U8 |6 H8 u6 \
您对答案的理解似乎有误。
& D: G1 A1 x% y( |* P% A/ q& B随机变量X是测试过的元素的数目
0 Z* Q; @1 [5 T2 Z& z# j而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。* Y% N. O8 y  H3 t: S6 w3 d
所以才有E(x)=sum(E(Xi))。
7 b. H! |; j4 V' k0 v1 D7 G而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
$ D& k5 O: Q: v. M- N  [) x# t您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:' {) v/ _/ S2 m' L6 \9 N

! f. E; T1 J9 GE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
+ j! H. O2 c1 v0 v; ~0 h9 P% q7 k& o, Z7 t/ d
然后从头开始:
" P: A$ P7 k6 J" p( nE(k|k)=1% r, s% _( Q- h' O3 v, S
E(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)
3 u# U% g& `6 mE(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)0 P& T% C; d: f2 s3 d6 m
Finally, we can easily get E(k|n)=(n+1)/(k+1)8 {/ Y7 f- P6 R
3 y" G& _& ]! `0 E+ ^, Q
原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32
' P  ]. @0 A1 V( X, a4 e; {% K4 q3 N您对答案的理解似乎有误。
% B9 P7 `+ t' t7 L8 b1 O- }随机变量X是测试过的元素的数目
  H  x0 t2 h4 }  \+ y5 i$ t0 q而随机变量Xi是另一组随机变量,每一个都是个ind ...

( V, P! c0 O$ J* D5 n% m7 ~明白了。& l2 X  {, V. n) K# J, D
是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)
" Y6 N0 U; O0 w/ v& z多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44
, J! p+ Z0 }0 _. P8 e5 v( |这个题目可以用递归的方法解决:% T) j4 }; F2 h% y5 ~+ E5 x& q

& o/ {/ Y: K" a1 m/ U# T/ D1 DE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)

3 F2 w! A% Z0 ]; N! S& f# k* z% l( x& }6 W! c( X6 ^! p" I6 T0 M
递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07# l! k$ E; _4 ?0 a7 P; v
递归法也是可以的。

: c6 E- x/ ?" n8 D& w( s3 W其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑 # J* q4 t; Z2 v4 }" x- r2 D
老福 发表于 2022-3-26 12:01
. y3 y2 Y8 s% S+ K6 d6 D; O* `其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...
, Y0 B' K- o0 u* G$ ]
# e5 z. {: {! q: z2 l9 q5 A
我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。, V3 [: X! }) I, Z5 n: r
否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。
, q4 @6 h+ I& A2 F5 s0 A0 y: O! I9 k0 m& z$ D4 ?3 T5 Q  Z
而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。
. h/ E1 v" Z. Q" z" g1 G所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
/ R0 W! a8 Z8 n* J: K7 g3 ?- Y" e  W- i- b1 R
Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}.
/ S: }$ \; E6 x9 m4 y; s( H! w
9 x+ l6 n5 U$ E7 }$ F( rFor w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.' R% d* H. ]1 \$ E9 J* p" Z5 ?- ~
/ M. o4 W& Q5 F% c. {, r+ I
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).  b$ F* Z# Y* }

1 C) \4 {9 Y3 q" M5 B) kThere are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).0 O+ j3 L" @& I$ O& L, |+ M& n3 ]

  k% s: }+ Q. `' k$ H" v理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://aswetalk.net/bbs/) Powered by Discuz! X3.2