爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑 - [4 J* i& q0 E; I& a; }

% w$ o& w" o- p( z  W5 E其实是个概率问题。
9 l( N" K# R6 q6 v; |那本CLRS算法导论中,第 5-2 练习题。7 o3 S/ Q+ D6 I5 N
在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。
" j  @- F# e3 H* m4 u问题就是这个人的表述
( ^: [: r# b" o0 \" H* xhttps://math.stackexchange.com/q ... orithm-running-time9 S0 l, m& _( [
* s* Z; L5 [# H* }: M& }' C7 U! C& `
按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)
$ U: B2 E3 h: x3 @6 f6 I
5 W2 |( }: _( Z- a: o* j9 ~" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x". , l  E" f( W( E7 S

% Z6 [7 X8 r" E! |- k! j没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。2 `7 `2 q+ W- `* U: l* \- R

4 D0 _5 x3 m$ @6 a老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑
; S; H6 C7 p4 g6 U; R. b0 |- U3 c2 H6 h& Y* ^% W
您对答案的理解似乎有误。
' `" o- r' c& {, x& d随机变量X是测试过的元素的数目
. {% j' d; |  x而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。
1 q- E  c) D) g/ r2 o$ q' o0 O+ X" k所以才有E(x)=sum(E(Xi))。
6 k- \- V6 ], D# b而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)& Y7 o5 l/ ]) S3 }, f$ F3 P3 S
您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:
" A  F2 w6 K9 B2 ]( x
" J: [  N% ?3 v5 {0 H- ^, TE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
+ B1 S! r+ ~9 }; u, [; Z* g% H( ^5 [$ w) J$ b6 N8 L+ l9 g" o% h
然后从头开始:9 A2 q3 v; o6 j
E(k|k)=1
% M1 F, M- n5 e# \* M8 g/ YE(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)
$ s) }3 [) D! V' \) WE(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)
, @- l! p% q: g7 G2 v- V+ UFinally, we can easily get E(k|n)=(n+1)/(k+1)6 U2 J8 n$ B: L6 T* D- d
7 Z8 f: w9 i4 h! _+ K8 W9 a# O
原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32/ v" L0 i) d9 F- _1 v
您对答案的理解似乎有误。
6 E/ j' [2 t# G8 D% i0 E随机变量X是测试过的元素的数目/ C( Q! m$ j- T& k5 I) I+ N
而随机变量Xi是另一组随机变量,每一个都是个ind ...

- j8 ]+ G3 s7 z) h5 n6 g明白了。
* r$ F/ A( \# Y+ e是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)4 e) ?( X. S! g% N
多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44
1 T' _/ [/ s3 v& q这个题目可以用递归的方法解决:9 D8 T' v4 T6 z
, [1 W' q0 w" e" J/ D
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)

8 ]# |, Z9 ]) y
5 Q2 r# c4 ]- f1 ~, e递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:070 C2 i: f9 C- |/ w( ~3 e- h3 o
递归法也是可以的。

* ^$ [; S3 Q3 Z8 ?其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑
. B, X7 B' h/ c% t; s
老福 发表于 2022-3-26 12:01+ e' `# S' B" v
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...
& L6 L3 s. Y0 {
; _+ m" R8 J$ N5 |- f
我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。. ]% a. s. z+ d; N  m& p* P7 m# L
否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。4 W. }6 @5 h& _
! v  t4 H1 _& t( C3 B+ B' ^6 r
而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。
" e# Q# a/ @3 o2 M4 x( e所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
& x% n: U  o. }: l7 X) ~! l. a' T- M, N3 q. i: |* ]
Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}. + Z5 Q- T' r) ?, D! i

  R" b; S5 r2 i' B. cFor w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.6 o+ }9 F1 @9 h' v2 c& n$ \/ T. D$ D
) V: n( |, o8 D& \$ l
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).
/ R+ a6 S% [2 |4 Z1 I# ?  |
- R% O9 |5 g9 ~' o, X9 `2 |* [There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).' V7 q: B+ i% A- Q* L

, {+ K) O+ |0 T% `4 P7 Z" r- {8 T理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://aswetalk.net/bbs/) Powered by Discuz! X3.2