爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑 5 O# v* F& O/ T
6 b; v( E, f( U' s
其实是个概率问题。! I/ V! J. y, ?, O+ z
那本CLRS算法导论中,第 5-2 练习题。$ ^9 s. p5 y& e/ S" k
在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。# p; y- c" \1 f* K
问题就是这个人的表述7 B4 @9 i' ^1 |) x9 [
https://math.stackexchange.com/q ... orithm-running-time
  @9 I0 Y- m. T  V/ ]  P9 P) @: S# A' X) r4 \7 e
按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1): i$ ?7 {7 [* P! @. p

* R( w3 x3 d' m" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x". 3 d) \5 z7 U% P7 `; K

: \" ?8 Y, q8 {1 U  P没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。* C6 _5 W* {# s, h

' L5 v* Z. _( t) I+ `, Y( N老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑
! u3 C6 Q1 s- x: i, t
3 s  K9 w" O( B6 s您对答案的理解似乎有误。; r) r% d' P2 r3 ^/ V9 d6 n$ ^3 M' Z
随机变量X是测试过的元素的数目
+ I. T$ t6 f! q2 X% }% Z8 v2 J而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。
/ L: k& V4 C2 K所以才有E(x)=sum(E(Xi))。
% [& D& p# F: ~而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)6 f% c* |, N# I% l& O1 t
您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:
' q/ c- x5 y+ q' _# O0 S9 b
4 A' D% M' v8 ~# }E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
0 M) O. a- r2 g# U5 j  }$ O  O) v
然后从头开始:
. y/ N3 c% \' `  _; H/ J/ \9 {E(k|k)=1
  x6 Z9 E8 R+ I$ h/ @. GE(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)9 }' _1 N# A% b% C+ G7 w
E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)! t' `4 C! m9 O- K$ `& G0 R% a
Finally, we can easily get E(k|n)=(n+1)/(k+1)% I; X; ^* w: g6 y7 z  l" s
8 R0 _# Z! X' `* `4 W  f
原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32
% H; x- R& F+ x. E- h' L1 C您对答案的理解似乎有误。% s4 P9 q  }" ]
随机变量X是测试过的元素的数目3 }0 P: u* f5 w, A% z9 A0 w
而随机变量Xi是另一组随机变量,每一个都是个ind ...

6 V/ X# ^: H3 s% g" J明白了。# n" u4 z" B% Z4 t9 D
是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)
8 w; Y3 I, C) |4 V. }/ }' S8 H多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44
# E% y6 N; l" M  {& b) J3 @这个题目可以用递归的方法解决:
! {, ~7 n: D5 X0 f
6 c4 `2 f, ^# f, N# G; O( QE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
1 S3 a# y# o1 C! s: w

2 a6 ~% B5 g9 X6 ~+ S! B递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:075 v) M% {- }: a( o2 R
递归法也是可以的。

  A0 x. @6 r/ S2 a, d8 J其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑 2 q% V  _6 f& `$ _! A. T
老福 发表于 2022-3-26 12:01: T! e" N# X0 t" @! j# c- n- g
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...

4 j' H" V- \* }$ B- x' a$ U* C) S% u* B" Z! O
我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。
6 w8 J2 \, m3 |' M, h* |否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。
* {: c0 r- e! W- P# a3 s: t5 \
( a( D7 m* Q5 n2 N" s/ Y4 I而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。
% m# |6 J; M2 V所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。3 N* d% _* C" r+ w% V
7 i- Y  S, Z- X3 A% ]' I/ ~
Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}. * Q* A/ u0 r( z4 V
9 K9 H7 H$ a4 e0 R$ i" V
For w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.& V; C0 H  H! u6 [) Y/ h
8 J2 p6 h2 J+ z
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).
2 q, t8 A) Z0 h. G  T4 A6 ~/ l  t. j7 L6 y4 V+ K! I
There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).% A- [: S$ _0 \( W
$ l, r9 `& Q" J) u5 ?( P
理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://aswetalk.net/bbs/) Powered by Discuz! X3.2