爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑
3 I  y( ]* D$ Q: r, P. o  r. y6 ^  L7 L6 k6 c5 Y# y; p
其实是个概率问题。
3 u. }) B8 U% z& f& `& L1 Q3 O那本CLRS算法导论中,第 5-2 练习题。
: m% Y8 M# C- H在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。
( T1 ^! z+ ~" A2 c问题就是这个人的表述+ V# z4 H: v# c  R
https://math.stackexchange.com/q ... orithm-running-time2 k+ I2 z$ a: ^. s+ v, w
# s9 R, d. l8 h3 {
按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)+ f) o3 r+ `2 j8 ~

. T6 b1 K! j* p/ a* A; C" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x". 8 v5 ?7 \) j2 Q5 n7 W; E

& [; U$ r9 n# x; m. S' r% V没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。+ N3 `+ }5 N: M6 B: W

* L  N( W! _" ~; p老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑
2 p3 p# t# b4 J" M! a
5 x& h5 h& `: ], t! p% ^. B您对答案的理解似乎有误。9 b9 p$ ^# v8 J; a  u! [' |8 X
随机变量X是测试过的元素的数目/ W4 ~$ d/ d$ z1 {3 z& g5 D4 w8 o
而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。0 {5 q* L8 P/ p8 v, Q
所以才有E(x)=sum(E(Xi))。  n; K& ?7 b2 P. m& Z/ I
而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
( J5 s; i5 o5 U# g您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:9 q- S1 D; z9 ^* @1 P" X  b

) R. \5 m% [1 M' ]; OE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
- K! n3 R7 a+ C. p# P6 S# B2 I6 ]$ @1 N2 r* F; C8 {
然后从头开始:
9 F  m# U4 J' \$ I# OE(k|k)=1
7 s  ^1 j6 h# g" q: T, W' G9 |. [E(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)5 s: ]$ P3 O2 m6 |. _' [
E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)
! }& y5 [" x1 ?+ Y- tFinally, we can easily get E(k|n)=(n+1)/(k+1)
8 s. f0 ]2 @+ i) Z& U# y  ]9 |4 S/ m6 U
原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:327 f0 Q: b. U! ^4 o( A0 ]8 V  v5 h
您对答案的理解似乎有误。4 n) a- L& ?; e1 j* G8 z
随机变量X是测试过的元素的数目( v* p1 ?3 t3 P: b+ l  W9 E
而随机变量Xi是另一组随机变量,每一个都是个ind ...
6 L5 L5 H* C0 Y
明白了。
9 v4 D4 V& i$ G是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)
) N7 K1 Z" Y  U多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44' S& J4 k7 k6 ^
这个题目可以用递归的方法解决:# i0 E* w* T# a. v; h9 M

2 E( Y9 |) a4 O  F- o2 ^E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
6 R* O- C3 ?4 |

7 L. \5 Z: k3 p& n$ h, {! m2 d: L" E3 N递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07. ~5 U* E4 w. p! x! E: P8 W
递归法也是可以的。

; @: ^# w: C1 t9 ]( H其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑 ' c! i* D4 Z+ A
老福 发表于 2022-3-26 12:01
% ~. K* Z5 o3 y  ~- ]其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...

( z# R& o' K# i" `$ o
0 t/ ^& u0 ]0 w! e9 ?; ^3 @: J, @我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。
' p1 S' W8 @/ f. l& D. B' h! ^否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。5 J* c( f8 x# r. }% J- y
( q# _: k+ _0 N( }& |
而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。
" e+ A4 w/ v7 E+ I$ L5 u0 n所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
$ ^/ ]& x# O( g
4 z4 ]2 f2 \9 L3 I. ^Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}.
, T6 E6 H! f" d0 o
6 W$ N( G4 M: p# L, P8 g9 A2 MFor w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.. P% W' y5 D, ^6 b9 n( \" R( N

6 ~( \0 i. }) O. O0 jFor w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).; ?' V/ y# R% w8 W6 \
' H( F7 Q9 J! Q
There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1)., I+ L; F; m& T; ~8 \, K

) v3 W( \1 v# c6 O* {理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://aswetalk.net/bbs/) Powered by Discuz! X3.2