爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑 9 j- s" z8 ^! ], B2 ]8 |$ `

1 p6 a' {! r" m其实是个概率问题。
8 C" I1 f/ ~- I6 E那本CLRS算法导论中,第 5-2 练习题。
0 P( H& m% s6 ]- @2 l在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。( `" \! I, [$ [
问题就是这个人的表述
2 |4 g8 X! ^! ]% v* thttps://math.stackexchange.com/q ... orithm-running-time
2 w! [" u: N( Y7 ]9 R, ^  f) h0 I! i6 V) |& ?- u$ L, S& v
按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)" i- b! ^$ j" {. K0 g" q

. s' c; u! v/ e$ g4 j. i6 U; w" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x". 5 R: v# y! N( b1 Q

6 N* W! v8 W6 s没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。
$ a3 L* S$ u3 V- n7 e/ O3 n; t
7 y8 G& A, b* s/ M. y! v: S老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑
# r# m$ o/ N# g8 h- O# R8 T7 z) q( X* x/ F7 e9 _4 c5 D  m0 q: o, U
您对答案的理解似乎有误。3 q9 U' M6 @( o1 _: O0 y- @; l
随机变量X是测试过的元素的数目
* B& l/ o8 g$ o而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。
7 L) B4 Q* x  X; G/ J所以才有E(x)=sum(E(Xi))。1 e( g) O$ y0 ]* i5 W9 F/ v; W
而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
1 _/ d5 @8 J0 c5 Z. h您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:
( V+ @9 M: q) U& P
, b  H' l6 R$ z5 nE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)2 `! o: J. F. o# n2 @
* e$ E5 O( R: y, e  ]( t3 D
然后从头开始:
# z1 i1 h4 A# ~  g% y, GE(k|k)=1
+ J! ~1 Y; E( U) Y3 ?  I& ME(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)
( s+ K: g  K0 M$ i# V9 O4 ~3 {E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)/ q" U* N* M1 y2 a3 x+ D3 A: K
Finally, we can easily get E(k|n)=(n+1)/(k+1)
" J+ N: \; L% O* _9 w: Y
, W( ^$ a7 |# a/ i3 `0 g, Y原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32
0 K4 X% p& n% |( t3 ?您对答案的理解似乎有误。
/ ^  v5 P  p8 E* ]随机变量X是测试过的元素的数目& X" o8 ^7 Z; `+ u
而随机变量Xi是另一组随机变量,每一个都是个ind ...

5 z  [# Y. S, S6 J  I& j5 `8 Z4 w明白了。7 R& K- s+ r1 F2 O0 h
是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)4 ^' G. P" @+ T3 b- D3 x
多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44) A3 f: ^4 X8 n& d
这个题目可以用递归的方法解决:
4 {/ a" r- E2 {( j6 P# [# _4 d! C2 v  \
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
$ P% N; U  n0 S9 p/ b! B  V
! v# f- W3 F& D' R! E- l2 `
递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
4 P) b( C$ O, Q- S( g递归法也是可以的。
& m  q! d) B1 z' f; t
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑
, D6 G/ w- C' L& k
老福 发表于 2022-3-26 12:01% U& P% N4 B' E/ q9 N% j
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...

1 l5 u+ h) s( ]4 }( r$ q
9 d0 P& e2 ]& l3 y5 d& L# x7 {我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。
: r$ g( C. v9 Y) e% w) j否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。
7 c4 }# f% G3 R2 k3 v& A6 D; H' U( n
而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。! j9 @. F, U: X4 c3 W
所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。. P, S! K0 h" ^$ \6 h
9 ?) q' ~$ _4 n, |
Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}. 4 v# E! [& s/ V+ D
9 H) q; H9 O% T6 L! T
For w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.
6 _- J' {: V: g8 S/ M3 c6 K8 Z3 E7 J/ X
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).: O5 w* h# m. \
) g! W- k4 Z4 I8 x. }# I
There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).+ }  M3 |% K; z

, T: s. o0 G( Z理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://aswetalk.net/bbs/) Powered by Discuz! X3.2