注册 登录
爱吱声 返回首页

库布其的个人空间 http://aswetalk.net/bbs/?539 [收藏] [复制] [分享] [RSS]

日志

如何估量还没有发生的事情发生的可能性

热度 19已有 1071 次阅读2018-11-17 09:39 |个人分类:杂谈

简单说,你观测一个事情,N次取样了,还没有观测到,那么你可以认为3/N是那个事情会发生的概率,而且这个概率有95%的可信度。
当然,随着N增加,你还是会逼近真相的。

例如,你连续观测100天了,还没有发生地震,你可以认为发生地震的概率是3/100。

不要问我为什么有95%的可信度,我没看懂。

1

膜拜
1

鸡蛋
6

鲜花
2

路过
3

雷人
1

开心
3

感动
1

难过

刚表态过的朋友 (18 人)

发表评论 评论 (14 个评论)

回复 煮酒正熟 2018-11-17 14:43
纠错 --- 例如,你连续观测100天了,还没有发生地震,你可以认为发生地震的概率是3/100

不是概率是3/100, 而是概率小于3/100
回复 煮酒正熟 2018-11-17 14:51
前面的还可以,但最后这段超出了我的数学知识,主要是没学过贝叶斯
Suppose you start with a uniform prior on p. The posterior distribution on p after having seen 0 successes and N failures has a beta(1, N+1) distribution. If you calculate the posterior probability of p being less than 3/N you get an expression that approaches 1 – exp(-3) as N gets large, and 1 – exp(-3) ≈ 0.95.
回复 数值分析 2018-11-18 02:31
煮酒正熟: 前面的还可以,但最后这段超出了我的数学知识,主要是没学过贝叶斯
Suppose you start with a uniform prior on p. The posterior distribution on p after havi ...
贝叶斯派和频率派最根本的区别是是否认为参数是一个随机变量。频率派认为参数(比如这里的地震发生概率)是一个虽然未知,但客观存在的具体数值。而贝叶斯派认为反正参数也是不可能知道的,不如也把他看作是一个随机变量吧。既然参数是个随机变量,就有分布。
于是贝叶斯推断是用(参数的)先验分布加观测数据校正,得到(参数的)后验分布。

具体到这个例子里,他应该是假设地震概率p的先验分布是均匀分布p~U【0,1】。对应与p等于某个具体值p0,观测N次有x次地震发生服从二项分布B(N,p0), 然后知道p服从均匀分布,把B(N,p0)对p0从0积分到1 得到边缘概率,这也就是为什么这里出现了beta分布。

然后从先验和观测数据倒腾后验,
pf(p=p0|X=0)=pb(X=0|p=p0)*pp(p=p0)/pm(X=0) ,pp是先验分布,就是均匀分布,所以这里是1.pm就是我们刚刚求出来的边缘分布,pb是最开始的二项分布,pf是后验分布。
然后就和频率派方法一样了,求后验分布的95%分位数,得到p0约等于3/N(我没具体算,应该差不多吧)
回复 煮酒正熟 2018-11-18 04:31
数值分析: 贝叶斯派和频率派最根本的区别是是否认为参数是一个随机变量。频率派认为参数(比如这里的地震发生概率)是一个虽然未知,但客观存在的具体数值。而贝叶斯派认为 ...
谢谢您的详尽解释。还是因为我高数基础不够,所以只能看懂第一段;第二段麻麻,第三段就不行了
回复 库布其 2018-11-18 06:45
   招来两位行家,甚好
回复 smileREGENT 2018-11-18 14:44
数值分析: 贝叶斯派和频率派最根本的区别是是否认为参数是一个随机变量。频率派认为参数(比如这里的地震发生概率)是一个虽然未知,但客观存在的具体数值。而贝叶斯派认为 ...
直接贝叶斯点估计吧,1/n+2

方便我这种只记公式的
回复 数值分析 2018-11-18 22:30
smileREGENT: 直接贝叶斯点估计吧,1/n+2

方便我这种只记公式的
嗯, 好,我们先不谈区间估计与点估计的区别,就说贝叶斯点估计吧。
比如我问,已知观测了N次,地震过1次,那么再多观测两次,这两次都不地震的概率有多大,你怎么进行点估计?
回复 数值分析 2018-11-18 22:51
(居然不能回复自己的评论,再发个新的吧)
友情提示耗子同学两点:
第一点,根据后验分布进行参数点估计,常见的方法有三种,即选取
1.后验分布的众数(即后验密度最大的点);
2.后验分布的中位数;
3.后验分布的期望(均值);
作为参数的估计值。
顺便说一下,如果先验分布是均匀分布,那么第一种和最大似然估计是一样的,因为贝叶斯估计里的后验分布是:
p(a|X=x) = p(X=x|a)*pp(a)/(integral{p(X=x|a)*pp(a)da})

而似然函数是
L(X=x;a)
后验分布相当与似然函数加权平均(权重是先验分布pp(a)),如果是均匀分布,权重处处为1,和没做一样。最大似然估计是选似然函数最大值,显然方法1是选后验分布最大值,所以如果先验是均匀分布,两者一样。
但显然后验均值(方法3)的均方误差应该是最小的,所以方法3在一定条件下最优。

第二点,嗯,这其实是个陷阱,我先不说吧,喵喵喵。。。
回复 smileREGENT 2018-11-19 13:50
数值分析: (居然不能回复自己的评论,再发个新的吧)
友情提示耗子同学两点:
第一点,根据后验分布进行参数点估计,常见的方法有三种,即选取
1.后验分布的众数(即后验 ...
容俺想想,晚上放学回来重新复习下统计   
回复 smileREGENT 2018-11-19 23:12
数值分析: (居然不能回复自己的评论,再发个新的吧)
友情提示耗子同学两点:
第一点,根据后验分布进行参数点估计,常见的方法有三种,即选取
1.后验分布的众数(即后验 ...
问题想不明白,向您请教,愿闻其详   
回复 数值分析 2018-11-20 00:21
smileREGENT: 问题想不明白,向您请教,愿闻其详         
这个问题的关键是我们要估计的两次不发生地震的概率,(1-p)^2。 但你不能套用公式,把p的估计的值直接带进去作为(1-p)^2估计的值。

如果你用后验的期望做点估计(就是上述方法3,也是你用的那个公式用的方法),那么参数a的估计的平方和参数a^2的估计是不一样的。就像随机变量期望的平方不等于随机变量平方的期望一样。这是这道题的陷阱。

我看到你直接用了二项分布的贝叶斯估计p=(x+1)/(N+2),我猜你应该没有搞清楚这个结果推导的整个思路,故有此问。如果你不清楚这个思路,即使你知道这道题问的是什么((1-p)^2),你也不会用贝叶斯估计算出这个值,只能把p=(x+1)/(N+2)带入这里,得到错误答案。

出这个题就是专门整治只背公式,不了解公式来历的学生(耗子)。喵喵喵。。。
回复 smileREGENT 2018-11-20 12:28
数值分析: 这个问题的关键是我们要估计的两次不发生地震的概率,(1-p)^2。 但你不能套用公式,把p的估计的值直接带进去作为(1-p)^2估计的值。

如果你用后验的期望做点 ...
获益匪浅,等我晚上回来把课本拿出来再好好学学
回复 数值分析 2018-11-20 13:24
smileREGENT: 获益匪浅,等我晚上回来把课本拿出来再好好学学
不过你不是医生么?怎么还有统计推断的课本呢?课外自学么?
回复 smileREGENT 2018-11-20 14:04
数值分析: 不过你不是医生么?怎么还有统计推断的课本呢?课外自学么?
要学医学统计学

facelist doodle 涂鸦板

您需要登录后才可以评论 登录 | 注册

手机版|小黑屋|Archiver|网站错误报告|爱吱声   

GMT+8, 2024-11-22 14:17 , Processed in 0.039812 second(s), 19 queries , Gzip On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

返回顶部