爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑
' F4 t) w7 ^8 N6 \  j+ P5 ]  [- b+ Y3 X. j. G* _  n8 @! {" H
其实是个概率问题。5 D: G5 t  i  g' x) W0 i$ k8 E
那本CLRS算法导论中,第 5-2 练习题。
2 g/ W0 s$ F4 t$ K& l在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。  p- d' Q) G% D6 e! N% y- @6 {) T
问题就是这个人的表述- Q  i/ u! H# Z/ {. i8 G4 \( I
https://math.stackexchange.com/q ... orithm-running-time  y4 Y3 F: Z4 @0 L
, l+ c4 U4 }9 q* c
按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)) {& ^! {% ]+ c/ Y/ d

& }+ y4 ~$ l% N: \" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x". # O& `; _5 @6 ]+ v% d
$ ^0 W; Z/ c0 G" v/ T9 d, f
没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。) L) T1 p9 w2 F% G8 {4 `

( u2 C$ h) L0 m" H6 O老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑
+ W3 M! ^% V( {- \5 A
$ O, b( T: a0 `# i您对答案的理解似乎有误。/ y! j1 I3 A1 ?$ v  X* U1 a4 h
随机变量X是测试过的元素的数目
) ^8 p# x8 }( N* f而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。* U. A0 R7 \# x5 D
所以才有E(x)=sum(E(Xi))。
* U* d5 U; H: h3 z& u而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
0 T3 }/ q* k/ A2 Q( e' u% x4 I您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:$ n. u% B: D! Q7 B: C
2 C, f* k5 a; z! d2 F; {
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
: m3 m' T! U: y6 s% J! d$ w* w; k! ?
然后从头开始:" g; y  x! T& x$ A1 c6 @4 f/ Q; e
E(k|k)=1
! K' {& N4 r# a  }8 h# fE(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)
* M; t4 A' ~7 }$ j# i* o6 ^E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)
9 w/ S9 s/ y( L& W' @, }Finally, we can easily get E(k|n)=(n+1)/(k+1)$ `. [# d# \; E
# L  M% B+ S# g) v3 K. T
原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32
4 i2 I8 \+ e7 s: ~/ p8 ^您对答案的理解似乎有误。0 n( o1 x. t  t' u7 B
随机变量X是测试过的元素的数目
: a5 P4 R' g9 i1 `+ [; Z/ X而随机变量Xi是另一组随机变量,每一个都是个ind ...
& L) Y5 q  p9 `/ d( \
明白了。. m8 w% b6 }* m% w& h. C# U+ }
是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)
* o+ S3 W$ H: T+ @) {多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:440 @, y0 ^. m1 d* I9 l4 g+ M5 _
这个题目可以用递归的方法解决:& b' [* m2 ^! s/ |( Z: }

( F- _! S0 }, T' mE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
. G6 W5 z# N4 w  ]
) [, H  j$ `! H2 g+ K; Z/ n
递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
; d. ~4 Y9 N6 [& Q递归法也是可以的。

' ~2 f1 b* k# _- m其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑
5 B. s. A- J% ?8 K5 `8 K5 A' z
老福 发表于 2022-3-26 12:01. P% B# y; L# o6 o/ l+ J6 C1 \
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...
1 a0 ]2 M, L/ w1 u& c+ ^2 u- A
2 z- k& x$ s! g) h9 ~4 w
我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。
7 ^. ?  F" i$ w: ?" c否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。
- z2 L& B7 r5 o0 w) S
/ V8 U, W. Q# `, s9 P- w! U而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。9 f$ i3 v; G; I' F! K
所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
( K& b2 ^' h. R, h- k% a& k
2 {/ R' O8 f& ILet S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}. 5 w: ?, t; L4 R2 m( a
* K( G' G- X3 O/ k. c7 H
For w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k., Q3 ^& `" a- o" R
& q6 x+ z$ w+ t
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).
0 t. d. l; b$ [- Y0 `3 }9 k4 H" M: c+ ~( `# C! n2 W/ a
There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1)." C" V$ O; x) b* z" G
: B- m4 }; o, J1 ?
理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://aswetalk.net/bbs/) Powered by Discuz! X3.2