爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑
0 c7 s; Y+ b0 D
6 f* t3 p. F8 T9 [其实是个概率问题。7 {1 p9 o% F9 ]% O" z
那本CLRS算法导论中,第 5-2 练习题。
" n- ]" V9 V) ^6 w" b在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。" ]  u+ G8 n! V* v2 h
问题就是这个人的表述
2 w# q# ^9 q* ehttps://math.stackexchange.com/q ... orithm-running-time+ t9 C8 o9 C4 ]% K! Z
: z* S/ ?# x, h! x: C. `7 d* }
按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1); t* G! R6 O; u

* u. r9 p, U, n7 q$ L6 }* `7 n8 W" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x". / v1 ^0 _. Q$ t1 k
# d+ W$ w  l7 Z, \7 e& a  p
没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。
5 I* {+ `7 Z- i4 e1 \; f' m  e+ k' v$ _; ~' z( ^" L& z' E
老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑 3 X2 V( n# e) C* }

: Z0 Q* }+ m. k您对答案的理解似乎有误。, G7 L3 \) q2 ]5 I3 @8 B
随机变量X是测试过的元素的数目
0 W9 U& j# u- j+ ~. c3 S而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。6 \2 f# a! E! x  R  o
所以才有E(x)=sum(E(Xi))。+ n* Q6 B, w' C" o; c7 O: G
而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
3 _- r1 f5 s! `" v* z4 I您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:% R# @1 I& _7 p" v
% s; _+ R: Z* P
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
# g2 x$ y: _$ i
0 S( y; r" _7 M" K然后从头开始:
3 O- U# R6 ~. ?! v4 O6 _E(k|k)=1* `& C: [( I% ~# z: [+ Q. h5 l" k
E(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1), \3 {$ {* [# |* G0 Y* ?# S
E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1): c. F% K; D: Q0 l+ ~7 T
Finally, we can easily get E(k|n)=(n+1)/(k+1)0 I- ^9 n; u8 ^' P- g
+ w( s9 C+ d; E/ z7 f
原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:324 }9 H6 r$ V2 z$ j3 k8 X
您对答案的理解似乎有误。; l$ ?6 `; q" T& n/ D! e
随机变量X是测试过的元素的数目: @2 Z- x9 J( h+ U" O1 I
而随机变量Xi是另一组随机变量,每一个都是个ind ...
) A5 [- `2 g  [
明白了。
3 Y' @  {! T' @/ s- I是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)
9 Y' Y. @% g% G: O多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44
$ `+ Z( _- Q; |* I9 E8 C, r这个题目可以用递归的方法解决:# G. ?$ l6 o- t- x  }2 N  z4 c

6 o. y7 b4 p/ qE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)

" f/ |4 z( S9 d/ u' v% j! s1 i. b
4 j3 T7 R: y6 X& v& @  y# L递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
, m* B# y/ y" }# p% Z1 s0 G& {递归法也是可以的。

) j4 n8 P. y* u9 {" Y, \3 K- v其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑
3 a( L7 H6 ~3 b* S& T3 Q
老福 发表于 2022-3-26 12:01/ j7 f) K8 n: Q$ ~; i
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...
" A; Z  _8 O8 I5 e

2 |+ s# O+ J" p! x; K% u" S1 ~  @我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。; J9 K$ H7 M5 a. t8 }
否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。' u( B& S6 _6 `9 b' S0 T3 C
  u- E" g. |( c8 m
而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。/ K5 H, x, _/ _2 m
所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
+ h; G6 G6 O4 T9 |, b6 e+ e! m
, R/ `& h( P9 d& \+ pLet S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}.   V% {& y$ G+ y0 B! b

" K+ F9 R! d% y. O* B  ~  FFor w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.
% ]5 u3 v, `* \- J8 X* `  d9 i* W$ H( e2 i
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).
+ J7 A, g, \) ]
) a8 t  g3 k; U0 w3 n9 A- oThere are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).# }# F3 {: _+ C' x8 N
* \* a) \5 n* w) g
理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://aswetalk.net/bbs/) Powered by Discuz! X3.2