爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑
/ F6 L2 J5 S. ~' \! O6 p
" e1 Z3 h  _1 E+ |其实是个概率问题。
7 Z( F' I, r3 a' E  @# p7 q: s( H那本CLRS算法导论中,第 5-2 练习题。2 y; ]2 o0 i+ z3 V
在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。
* k3 v  Z3 d( B问题就是这个人的表述8 O9 @5 g3 e& {9 H8 Z1 E
https://math.stackexchange.com/q ... orithm-running-time
& }+ X+ ?& L6 b, W0 x; K! d3 ~8 S+ j5 n) ^+ `
按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)8 d9 T: s! j8 A9 c/ D

5 B3 X- V7 v* P% h& J" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x". % v& y: U* _9 d9 a- _! x; i; N
) @7 {+ {9 {# A# d
没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。
+ S4 l  B' P0 |$ f; o5 b5 X/ h
/ r) r3 Z9 q: e& h5 ]( H老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑 0 s0 `; I3 H$ r8 D5 r
$ p7 h! w; C' X% V2 K7 s
您对答案的理解似乎有误。4 c) c+ U0 [% z+ B6 f: C
随机变量X是测试过的元素的数目
( U7 t* C# Q" J  G8 L$ M) u7 Y而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。1 R( e- t& o! t% C
所以才有E(x)=sum(E(Xi))。
1 S9 u; {& Q9 d. D0 W( n而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
$ m+ N+ |* k' v  e2 u# n+ ?2 g5 z您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:
' }: x# e: \6 x/ [; q
2 G: \5 O5 |& Z; @9 q  bE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
7 v& J$ e# R. r3 M; Q9 K! E, O
# p! u) O/ ^4 U* o& E0 {( D2 O然后从头开始:
7 R& B; Z0 a- {2 ?E(k|k)=1
* R  M  F1 W  EE(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)- i* ?# ^/ T1 ~% O7 w5 A. s7 U
E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)
4 V: Y7 ]+ r- b/ RFinally, we can easily get E(k|n)=(n+1)/(k+1)/ J6 k# S+ o9 |2 T+ W" y
# p0 X  e& H6 f. P: R3 Z
原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32& n5 F0 n" x" l& x. P
您对答案的理解似乎有误。
7 P. M4 a: E1 ^" l( J随机变量X是测试过的元素的数目. t  q* z7 t! w, s/ Y0 c0 F8 w
而随机变量Xi是另一组随机变量,每一个都是个ind ...
( m+ j3 S; Q! f
明白了。
% h' g( Y3 J$ E! ^% j9 j" `是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)
" g. n  M5 u+ J1 C* k2 b多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:448 y2 N' `7 q" s6 s# I) L5 b
这个题目可以用递归的方法解决:
2 s) Z7 D' a$ l( V- ~5 `3 ]+ u2 P0 p8 C1 _3 m! K0 ]0 E
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
5 J# D, z# P! \: ?& z

$ G/ n# k0 [8 m  A$ p递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
; `+ d* C8 L7 _) n; U递归法也是可以的。
, k4 {  r& d5 I, s2 L5 }
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑
' I! a0 g# \1 @4 I$ c) E0 k
老福 发表于 2022-3-26 12:01
, L0 z/ ^4 z' o) Z" F其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...

8 d- @; O- s# K4 }/ Q( e" d% t) g( b, n! {9 E+ J
我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。9 u- i$ ^. c4 a! n2 b
否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。4 f2 z. T& H7 L6 N( U, Y
" `% ^0 a2 @* `, O3 z" c( Y
而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。5 W9 K' U$ e' z) c. I* J
所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
( e5 ^' p' A* C
# I  c, v, R/ B/ y/ `! JLet S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}. : s# v, [+ p$ k, A
0 l2 K* D$ V- I& r
For w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.
2 R. x& F, o' l' z+ r: q1 u3 [
/ e  g( I" b4 ^- E; w* jFor w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).) c3 v4 s7 w0 O+ ^% \
- \7 ^! Z  ^  L" B6 ^
There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).
+ q  P# {3 k8 _# O" V7 w5 x6 @: Z. B+ I
理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://aswetalk.net/bbs/) Powered by Discuz! X3.2