爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑 9 U+ z' x+ |. O* @" L! X. k. h) F* q" E
" N3 u9 D) ^# x2 S; Z3 b# ~2 W4 w9 \
其实是个概率问题。
, d' x8 a3 g, l9 X+ h: t那本CLRS算法导论中,第 5-2 练习题。! ]% {& ]8 Z- ]" N+ T% q, v
在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。0 J5 u4 d1 Z' h8 {) s+ W  P8 u8 Z
问题就是这个人的表述3 Z' h) V/ {- L) Y! t1 \$ k
https://math.stackexchange.com/q ... orithm-running-time, Y+ H. a. v8 k- h5 w2 F2 Z9 e
/ c. {6 f, N, V8 }' a+ ~* _# C
按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)4 q* b1 i4 r, L$ B8 s

$ s4 |; f3 n) p4 p1 y( Q, c" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x". 9 }, Z$ }  m( i# J  x
5 A: R/ q( J; E  W9 W6 e5 o4 p' u( E( p
没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。
& b, |. R. M4 Q  i% R" b
( S1 S( V. S+ }1 a老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑 3 A4 @& C! \2 d# }9 z

; z  E% q+ q5 n; W6 ]8 P+ I您对答案的理解似乎有误。' I& V- k( @4 {
随机变量X是测试过的元素的数目7 L( m9 {2 y) v5 k+ ?2 E
而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。
, u0 S3 q3 ?. ?% j7 V* _7 X所以才有E(x)=sum(E(Xi))。1 \5 N/ L3 A. K+ R* T
而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)) O' u1 M$ A) ?4 p
您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:
3 Q, y9 F8 `: o8 V  M$ j
$ O8 p# y! v5 o7 B$ M& ^E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
- B% B/ n" `: E* B
9 F- i! Y" o4 k; z然后从头开始:
; @7 Z: `/ K  b+ q3 F; ~. ?0 y! |E(k|k)=1* ^2 L5 L' V! b$ k( V; s/ o
E(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)
3 g. h9 R% P% ^1 m' Z$ f4 s( `9 \E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)# W' K* a9 T% Y6 V. J* Y
Finally, we can easily get E(k|n)=(n+1)/(k+1), Y$ m& T. N- T

/ n: B$ l: p0 T( i) m, h4 c原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32  Y7 y  }% Z1 F, w/ C0 _  t
您对答案的理解似乎有误。/ L2 @, e. k3 O, U5 n
随机变量X是测试过的元素的数目
: E7 {: z3 z5 O7 F1 [4 |) d而随机变量Xi是另一组随机变量,每一个都是个ind ...

+ [8 P$ Z. B& y" g" Y明白了。
) K, I0 n) ^! `- D是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)! a2 }4 E1 Q) H: F8 r# T+ ~
多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44( f) P: a4 A8 ^
这个题目可以用递归的方法解决:
5 s9 `* E! u9 D4 Z1 j
+ \+ ?5 k1 h4 }. V- z8 V2 qE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)

- b, l, ]/ k- w. q" l3 o
. [; @3 E$ \9 D4 e1 b递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
7 N) n/ E5 E, k' o5 K* \2 p递归法也是可以的。

9 K/ p( s% U5 M; d* n9 G+ L/ _其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑 / C. N- U1 s5 M- V1 K
老福 发表于 2022-3-26 12:01
# l: a2 w3 O7 f% T) V# Q0 W其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...

: r1 k3 ^% s0 d  u: z: A! F, W) x8 \7 ]$ b
我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。6 O- n/ m% A4 [. c5 \  m. e0 z
否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。! M- {3 x) [8 n# [
7 O5 s5 u6 o5 @2 W8 y1 j
而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。' I) c- y  ^- x4 B3 W
所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
8 Y, @) M2 }1 X* u- V& |8 ]. C
; @5 E/ p: A& F* j: YLet S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}.
* J8 {# T6 t. j% g
1 N- x' h6 C5 e& Z& [. U8 RFor w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.
) E. Q1 e# _( N( j4 ~5 F8 a# u2 G9 r* r( w, X, L
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).
4 A) s- E% G/ N5 [, H. _0 L, u* e' ^
There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1)./ F! @* o8 V; z) X& U( e/ P1 D
1 `: S! ^1 L) H+ m
理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://aswetalk.net/bbs/) Powered by Discuz! X3.2