爱吱声

标题: 此间大牛多，请教算法高手一个问题 [打印本页]

作者: 雷达 时间: 2022-3-26 08:43
标题: 此间大牛多，请教算法高手一个问题
本帖最后由雷达于 2022-3-26 08:54 编辑

其实是个概率问题。
那本CLRS算法导论中，第 5-2 练习题。
在 n 长的数列中有 k 个相同的 x 值，用顺序算法搜第一个 x 。
问题就是这个人的表述
https://math.stackexchange.com/q ... orithm-running-time

按照答案，从头开始，之前没有出现过 x 的前提下，每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)

" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x".
! O1 y4 x5 c7 [! @5 U/ K% l7 j2 t/ f: @6 V# d) J
没看懂，这个 P(Xi)=1/(k+1) 怎么来的？按直觉，这个概率应该和 n 有关，假设 n = 10000, k = 5 的情况和 n = 10, k = 5 的情况比较，概率应该不一样才对吧。
; m9 u7 I8 w4 w; g( a5 |" R9 Z& `+ k+ N1 B# V. ]
老了，脑子水掉了，希望有高手解释清楚一点。多谢。
作者: 数值分析 时间: 2022-3-26 10:32
本帖最后由数值分析于 2022-3-26 10:56 编辑
" D; e- _1 i$ [& P
; f- _) D- ~( J, n, ^# Y% p+ b您对答案的理解似乎有误。
2 g$ U. O! b  G- y* C8 p8 k8 R随机变量X是测试过的元素的数目
- B- ?4 N7 s5 Q而随机变量Xi是另一组随机变量，每一个都是个indicator，取值是0或者1，含义为第i个元素是否被测试过，而不是该元素是否等于欲查找的值。
0 H/ _4 q3 D- p) j6 h- ]! ?所以才有E(x)=sum(E(Xi))。
$ F, V( N- N) ~+ J而如果 A[ i ]!= x，那么k个x值元素将整个数组分为了k+1个区间，而我们检查了这个元素，所以这个元素必须位于第一个区间，所以概率是1/(k+1)5 z9 m8 j" d6 x; {8 B  Y4 \- Y
您再想想？
作者: 老福 时间: 2022-3-26 10:44
这个题目可以用递归的方法解决：7 i. L6 f( l8 a% y

/ L7 I% r( L$ Z% OE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
/ U8 }$ S: _+ [& m0 Y; Q% i$ F: n6 R4 ]) v- l! ]. a5 i
然后从头开始：
' x  S! k- H# Q8 U' E. t4 bE(k|k)=1
8 P- Y- l4 }. M3 ME(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)" O0 Z6 R" u& c1 t2 y! G
E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)( }! _0 m; n- ?3 n$ Y
Finally, we can easily get E(k|n)=(n+1)/(k+1)8 ?, G& m9 h1 G; _& T

0 Y$ p3 q/ x+ V. }7 b原文的解法有点绕，还没想明白。
作者: 雷达 时间: 2022-3-26 11:00

数值分析发表于 2022-3-26 10:326 x, R# C- a5 x7 ?
您对答案的理解似乎有误。
- u" K! h, T& G( ~2 Q随机变量X是测试过的元素的数目2 t# {( @0 Q8 f; x
而随机变量Xi是另一组随机变量，每一个都是个ind ...

, g" u7 Y$ d9 z: {2 C明白了。2 v0 M. o) |" \. w* a* g+ @
是指的某非x元素在所有x之前的概率，实际上有 k+1 种可能的位置关系，所以在所有x之前就是 1/(k+1)
0 Q; J3 U% q8 f+ u多谢
作者: 雷达 时间: 2022-3-26 11:07

老福发表于 2022-3-26 10:440 G9 L9 m0 s6 s5 o/ |
这个题目可以用递归的方法解决：" `* k! |3 I' i% A; G: j$ U+ [

7 B: Y' V% k" a0 rE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
5 c2 J1 f8 {% x) E
( N3 m) e( s" S0 }
递归法也是可以的。
作者: 老福 时间: 2022-3-26 12:01

雷达发表于 2022-3-26 11:07( R4 F1 P, ?: l* Y" C' `
递归法也是可以的。
7 V0 x8 {1 n0 X1 v# R  ?! Z
其实原文的解释似是而非，试想i=1的情形，对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/（k+1）。
作者: 数值分析 时间: 2022-3-26 14:46
本帖最后由数值分析于 2022-3-26 14:51 编辑
& o' ^' \) b1 c. E
老福发表于 2022-3-26 12:01
& b. H1 a" }$ l# [其实原文的解释似是而非，试想i=1的情形，对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/（ ...
, F/ _, M$ \( z6 m. y: Z

. a: g8 Z5 k5 O* S, p, S$ ?/ f% M我觉得这个答案的作者其实是吧下标i作为元素的编号，而不是位置。$ ?3 L. U/ U2 k3 y5 m3 j! E
否则没法按元素是否等于x来分类，因为某一个位置是否等于x本身就是个随机事件。
3 j! L. W4 g% R7 q0 U3 J* ?1 a8 ^9 Z  Z; c
而这个答案的作者其实是把每一个元素编了号，然后再考虑这个元素在数组中的位置的。故此对应于某一个元素，其是否等于x是个确定的事件，所以元素可以分为两类讨论，等于x的和不等于x的。
6 o  o% Q' @" \1 @5 E+ @$ N8 h所以A[ i ]这个写法有点误导，这里这个A并不是要做搜索的那个数组，而是所有元素的列表。
作者: 老福 时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒，终于想明白了。下面试着用同一思路但不同的语言叙述一下，作为总结。
4 [- i7 Q" [3 y1 d% H, z  f; k5 }' X
  Q1 U8 ?+ R6 T. {! b8 Y: _Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}. 1 e9 P0 h9 ^  k, z
, W4 [& N1 u( Z! P5 n( p
For w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.8 u) G. O* H/ g. A  `6 R

, P& d- G# H% C1 u9 IFor w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).6 A! m6 e/ ?* H: I' v

" v4 ^6 N; c, l- w- n' YThere are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).
6 j3 z* S) X' [9 @; B+ j5 k7 @3 L0 S- j
理解上述解法的一个关键点是对于所有不等于x的element，它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。

欢迎光临爱吱声 (http://aswetalk.net/bbs/) Powered by Discuz! X3.2