设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 5213|回复: 25
打印 上一主题 下一主题

[其他] 再出一道"诡异逆天反直觉"的概率蹄

[复制链接]

该用户从未签到

跳转到指定楼层
楼主
发表于 2014-2-26 21:17:19 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 石头布 于 2014-2-27 03:38 编辑

其实是仁在他的日志里出的题。把具体概率算出来一看,挺有意思的。题目很简单:


假设一个无限长的随机的“0,1”序列,在它的所有长度为3的片段里面,出现010或011的概率哪个大?概率(各?)是多少?

为防歧义,说明一下,对一个长度为N的随机序列而言,采样空间是N-2个长度为3的片段。不是N/3个。

但这个问题有两个情况:

(1), 重叠出现的”目标片段“被记为两次,比如: 01010可算作两个010

(2), 重叠出现的”目标片段“被记为一次,即: 01010 只能算作一个010


第一个用两行就把两种情况下的概率和原因说清楚的,我给22爱媛红包。 (仁就不给了 :) )

评分

参与人数 1爱元 +4 收起 理由
MacArthur + 4

查看全部评分

  • TA的每日心情
    开心
    2019-5-3 12:57
  • 签到天数: 1085 天

    [LV.10]大乘

    沙发
    发表于 2014-2-26 22:03:07 | 只看该作者
    不懂。不懂。不懂。
    (老爱要求十个字以上)
  • TA的每日心情
    奋斗
    2016-4-17 11:56
  • 签到天数: 51 天

    [LV.5]元婴

    板凳
    发表于 2014-2-26 22:45:23 | 只看该作者
    文科生飘过~~~
  • TA的每日心情

    2020-3-6 00:28
  • 签到天数: 564 天

    [LV.9]渡劫

    地板
    发表于 2014-2-26 23:55:42 | 只看该作者
    我给你200爱元,你公布答案吧?

    该用户从未签到

    5#
    发表于 2014-2-27 00:37:52 | 只看该作者
    本帖最后由 寒地散人 于 2014-2-27 00:41 编辑

    不可重叠的011的概率0.25      010的概率0.125
    可重叠的概率相同都为0.125

    该用户从未签到

    6#
    发表于 2014-2-27 00:45:09 | 只看该作者
    本帖最后由 三力思 于 2014-2-27 01:04 编辑

    计算机专业术语,小白退散

    想象一下,读单条磁带机的识别逻辑。 读到第一个0,第一位正确的逻辑旗升起。 接下来是1的话,第二位正确的逻辑旗升起。 处理完第三位逻辑旗后,010和011的区别就出来了。 接下来第四位是什么, 识别010的第一位正确的逻辑旗可以不需要打下,读取数据直接跳到识别到第二位逻辑处理上。识别完011的,第一位正确的逻辑旗就要归零了。这个识别完后是不是逻辑旗归零,确定被识别的次数。 一般来说,5bit的01010不会等同6bit的010010.

    该用户从未签到

    7#
     楼主| 发表于 2014-2-27 01:47:47 | 只看该作者
    寒地散人 发表于 2014-2-27 00:37
    不可重叠的011的概率0.25      010的概率0.125
    可重叠的概率相同都为0.125

    第二行正确。
    0.25 太高了, 实际上不可能高于1/8。
  • TA的每日心情
    慵懒
    2024-2-11 05:49
  • 签到天数: 2231 天

    [LV.Master]无

    8#
    发表于 2014-2-27 02:20:41 | 只看该作者
    概率论还给老师的飘过……

    该用户从未签到

    9#
     楼主| 发表于 2014-2-27 02:31:44 | 只看该作者
    本帖最后由 石头布 于 2014-2-27 02:35 编辑
    三力思 发表于 2014-2-27 00:45
    计算机专业术语,小白退散

    想象一下,读单条磁带机的识别逻辑。 读到第一个0,第一位正确的逻辑旗升起。  ...


    就是说,磁带机认为“01010”是一个“010”, 而不是两个。make sense, 很多实际应用里面,不可重叠的设定较合理。
    那磁带机读出的“010”和“011”的频率是不是有区别呢?

    该用户从未签到

    10#
     楼主| 发表于 2014-2-27 02:41:54 | 只看该作者
    穿着裤衩裸奔 发表于 2014-2-26 23:55
    我给你200爱元,你公布答案吧?


    其实只有一种情况是反直觉的,另一种情况很平常。真说出来你肯定后悔这200块

    该用户从未签到

    11#
    发表于 2014-2-27 02:50:28 | 只看该作者
    石头布 发表于 2014-2-27 02:31
    就是说,磁带机认为“01010”是一个“010”, 而不是两个。make sense, 很多实际应用里面,不可重叠的设 ...

    磁带机可以认为“01010”是两个“010”,看程序员的逻辑处理。 你认为不是,识别逻辑认出010后,下一个字符默认从头开始。 你认为是,设定下一个字符自动跳到第二位识别上。

    该用户从未签到

    12#
    发表于 2014-2-27 03:07:35 | 只看该作者
    这个问题我始终想不明白的是,如果不可以重叠,那么概率1是什么?

    该用户从未签到

    13#
     楼主| 发表于 2014-2-27 03:26:21 | 只看该作者
    本帖最后由 石头布 于 2014-2-27 03:39 编辑
    独角兽 发表于 2014-2-27 03:07
    这个问题我始终想不明白的是,如果不可以重叠,那么概率1是什么?


    很好的问题。可以重叠和不可以重叠,限制的只是对出现的010和011的记数。两种情况下,
    概率1都是“所有的长度为3的片段”,它们当然是重叠的,数量是N-2。

    所谓的”可以重叠“和”不可以重叠“ 这两个情况我这样定义就更清楚些:

    (1), 重叠出现的”目标片段“记为两次,比如: 01010可算作两个010。 (可以重叠)

    (2), 重叠出现的”目标片段“记为一次,即: 01010 只能算作一个010。(不可以重叠)

    ----------------------------------------------
    相应改进了题目的陈述。

    该用户从未签到

    14#
    发表于 2014-2-27 03:39:51 | 只看该作者
    石头布 发表于 2014-2-27 03:26
    很好的问题。可以重叠和不可以重叠,限制的只是对出现的010和011的记数。两种情况下,
    概率1都是“所有的 ...

    所以第一问的概率1/8我没问题;可是第二问,不可以重叠的情况下的概率我想不清楚。或者不应该叫概率吧?应该问计数的比值?假如不可重叠的情况下000的计数为1,那么其他7种各是多少呢?

    该用户从未签到

    15#
     楼主| 发表于 2014-2-27 03:58:15 | 只看该作者
    独角兽 发表于 2014-2-27 03:39
    所以第一问的概率1/8我没问题;可是第二问,不可以重叠的情况下的概率我想不清楚。或者不应该叫概率吧? ...

    还是可以称为概率。如果把因重叠而”飘没“的那些010的概率加入,总概率依然为1.
    不可重叠的情况下000和111的记数是最少的

    点评

    期望值这个我会算,但是不是最直接的办法。所以我还是没完全想明白。。。  发表于 2014-2-27 04:35
    那也可以这样问,长度为N的序列里,010和011的记数的期望值是多少?  发表于 2014-2-27 04:18
    当然,我没有用笔想(就是没有去一个一个的把各种可能性列出来)。我偏执的希望能光用脑袋想明白,但是失败了。  发表于 2014-2-27 04:12
    计数的情况我理解。但是我知道自己从所谓概率的角度是没想通的。。。  发表于 2014-2-27 04:10
  • TA的每日心情
    开心
    2015-12-23 04:08
  • 签到天数: 2 天

    [LV.1]炼气

    16#
    发表于 2014-2-27 04:41:57 | 只看该作者
    本帖最后由 Highway 于 2014-2-27 04:49 编辑

    不知道你说的“足够长”是多长,我取1个亿应该够长了吧?

    Case 1: 重叠出现的”目标片段“被记为两次
    010 sequence appears 12501116 times, rate: 12.501%  (1/8)
    011 sequence appears 12500963 times, rate: 12.501%  (1/8)

    Case 2:不允许重叠出现,也就是找到010或011,跳到下面去
    010 sequence appears 10000444 times, rate: 10.000% (1/10)
    011 sequence appears 12500963 times, rate: 12.501% (1/8)


    评分

    参与人数 1爱元 +6 收起 理由
    到处停留的叶子 + 6 膜拜一下~

    查看全部评分

    该用户从未签到

    17#
     楼主| 发表于 2014-2-27 05:03:54 | 只看该作者
    Highway 发表于 2014-2-27 04:41
    不知道你说的“足够长”是多长,我取1个亿应该够长了吧?

    Case 1: 重叠出现的”目标片段“被记为两次

    给力! 我比较没耐性,没算这么长。
    跟理论预测值是一致的。010 是十分之一。000和111还要更小些。
  • TA的每日心情
    开心
    2015-12-23 04:08
  • 签到天数: 2 天

    [LV.1]炼气

    18#
    发表于 2014-2-27 05:30:12 | 只看该作者
    石头布 发表于 2014-2-27 05:03
    给力! 我比较没耐性,没算这么长。
    跟理论预测值是一致的。010 是十分之一。000和111还要更小些。 ...


    Case 1: 重叠出现的”目标片段“被记为两次
    000 sequence appears 12504409 times, rate: 12.501%  (1/8)
    111 sequence appears 12501683 times, rate: 12.501%  (1/8)

    Case 2:不允许重叠出现,也就是找到000或111,跳到下面去
    000 sequence appears 7143136 times, rate: 7.143136%
    111 sequence appears 7145032 times, rate: 7.145032%

    Anything else you want to know?

    点评

    这个变成分数是多少呀?如果按概率什么的算出来应该是个分数呀?  发表于 2014-2-27 05:49
    已经回答了,我问晚了,呵呵  发表于 2014-2-27 05:47

    该用户从未签到

    19#
     楼主| 发表于 2014-2-27 05:42:08 | 只看该作者
    Highway 发表于 2014-2-27 05:30
    Case 1: 重叠出现的”目标片段“被记为两次
    000 sequence appears 12504409 times, rate: 12.501%  (1/8 ...


    结果很给力!

    实际上,允许重叠的话,八种片段的概率都是1/8。
    不允许重叠的话,
    000 和111 是1/14,
    010 和101 是1/10,
    其他的都是1/8, 当然它们总和不是1,缺口就是因重叠而不被记数的片段的概率。
    对000和111来说,这个”飘没“概率是3/56
    对010和101来说,是1/40

    但是,怎么算出来的呢?

    点评

    qie,日志里没答案。不玩了。。。  发表于 2014-2-27 06:10
    关键是跟我想的还不一样,我去日志里找答案了。。。  发表于 2014-2-27 05:57
    晕,又问晚了。。。  发表于 2014-2-27 05:51

    该用户从未签到

    20#
    发表于 2014-2-27 05:46:55 | 只看该作者
    Highway 发表于 2014-2-27 04:41
    不知道你说的“足够长”是多长,我取1个亿应该够长了吧?

    Case 1: 重叠出现的”目标片段“被记为两次

    膜拜计算机,顺便告诉一下000是多少次?

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2024-4-29 07:58 , Processed in 0.051642 second(s), 25 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表