设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
楼主: 晨枫
打印 上一主题 下一主题

[科研心得] 问题:如何从数据里估算普瓦松分布的均值?

[复制链接]
  • TA的每日心情

    昨天 00:11
  • 签到天数: 1654 天

    [LV.Master]无

    楼主
    发表于 2019-2-4 14:56:30 | 显示全部楼层
    本帖最后由 数值分析 于 2019-2-4 15:05 编辑
    ( q! x# x: P. M; b, C; G8 _- z- b" s/ v( Z! r. Y
    你应该不用拟合分布函数吧?你只想知道峰值的位置,然后你又知道(或者说你假设)是泊松分布,所以峰值的位置一定是 x=lambda,(这里lambda不一定是整数),那么剩下的就是从样本里推断lambda了,这是个典型的估计啊. 对于泊松分布,lambda正好是期望,所以一般来用样本均值估计期望。
    # e- C/ L) \$ h0 a* I你给每一个板子从最左边顺序编个号,i=0,1,2,3。。。,然后设每块板子i的对应温度样本值xi,,然后计算sum(i*xi)/n [即累加所有的(板号乘以对应温度)然后除以板数】 (因为你的分布曲线可能和泊松分布差一个常数,所以最后结果得scale一下)不就可以了么?当然,这得假设你的histogram真的得长得像泊松分布分布。
    2 M9 L: w' J) y/ a% P8 k2 a! r

    点评

    给力: 5.0
    给力: 5
      发表于 2019-2-4 22:28
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    昨天 00:11
  • 签到天数: 1654 天

    [LV.Master]无

    沙发
    发表于 2019-2-4 18:34:42 | 显示全部楼层
    数值分析 发表于 2019-2-4 14:56
    0 n/ F+ N$ r2 K- r你应该不用拟合分布函数吧?你只想知道峰值的位置,然后你又知道(或者说你假设)是泊松分布,所以峰值的位 ...
    0 i. @- R( i7 ~* t0 z. z4 w7 K# |
    多解释一句scale那块儿。因为泊松分布曲线下面的面积是1,而你的histogram显然不是,所以你的histogram和泊松分布差一个常数。你求出来的lambda的估计要用你histogram的面积归一一下。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    昨天 00:11
  • 签到天数: 1654 天

    [LV.Master]无

    板凳
    发表于 2019-2-5 00:52:41 | 显示全部楼层
    本帖最后由 数值分析 于 2019-2-5 00:58 编辑
    - T* A+ n2 P2 z8 F8 l
    Dracula 发表于 2019-2-4 22:53
    " E# A3 R! C  H( J$ u! @我曾经想过一个和42楼类似的办法。区别是分母不是板数,而是各个板加在一起的温度的和。如果这条曲线真的 ...
    ' j! E2 N5 {0 _0 `3 f' L
    / |, c* b0 ~& M1 p' N, o
    这个和统计其实关系不大.你可以把他想象成求重心问题.已知一条曲线和x轴围成一个形状,如果这个形状是均匀厚度的匀质材料构成的一块板子,那么这个形状重心的x座标是多少?这个x座标(如果存在的话)就是这个分布的数学期望.这其实就是一个加权平均问题.当然,一个任意形状的重心和最高点的x座标当然不一定一致.不过数学上可以证明,高斯曲线和博松分布曲线围成的图形重心的x座标和最高点的x座标正好一样.和统计没关系.你再想想?

    点评

    给力: 5.0 涨姿势: 5.0
    这真是极好的: 5.0 不能同意更多: 5.0
    给力: 5 涨姿势: 5 这真是极好的: 5 不能同意更多: 5
      发表于 2019-2-5 01:02

    评分

    参与人数 2爱元 +6 收起 理由
    黑洞的颜色 + 4
    tanis + 2 给力

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    昨天 00:11
  • 签到天数: 1654 天

    [LV.Master]无

    地板
    发表于 2019-2-5 00:54:33 | 显示全部楼层
    本帖最后由 数值分析 于 2019-2-5 01:04 编辑 ! N% r6 n4 ?5 P
    晨枫 发表于 2019-2-4 22:38
    + R) H, \, _0 D# s/ ]$ H嗯,我再想想。谢谢。

    ) W) Y( C4 t* [- j' r0 l) h3 ?1 a8 b8 Y
    请见74楼回复.谢谢.3 M; z& Z. g7 z) e

    * A. u% _4 O' r; X  Y3 n任意偏态分布最高点的位置就不能简单的用样本均值来估计了.不过也有办法,如果已知分布函数可以用矩估计或者最大似然估计.
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    昨天 00:11
  • 签到天数: 1654 天

    [LV.Master]无

    5#
    发表于 2019-2-5 01:07:35 | 显示全部楼层
    Dracula 发表于 2019-2-5 01:02* \% C8 z+ x5 b7 q: e8 @: \* t8 c
    这个和零点的选择是有关的。如果把温度类比为具体某块板的sample size的话,统计学的那个解就是以sample  ...

    . o, M! S9 m1 R. a0 x你可以试试,平移没有问题的.你把他想象成求重心问题,曲线平移x,重心也平移x..
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    昨天 00:11
  • 签到天数: 1654 天

    [LV.Master]无

    6#
    发表于 2019-2-5 01:17:28 | 显示全部楼层
    数值分析 发表于 2019-2-5 01:07; B8 f; X- c$ f3 t7 D3 K5 B
    你可以试试,平移没有问题的.你把他想象成求重心问题,曲线平移x,重心也平移x.. ...

    " K3 a: _" s8 [1 W# I* f% f8 D3 G6 ~integral f(x)* x*dx=lambda右平移a个单位,则新重心位置integral f(x-a)*x*dx. 设t=x-a, integral f(t)* (t+a)*d(t+a)=integral f(t)* (t+a)* dt=integral f(t)* t* dt+integral f(t)* a* dt=lambda+a (因为integral f(t)*a *dt=a*integral f(t)* dt=a,而 integral f(t)* t* dt=lambda)$ h, U- s1 V8 P
    形状右平移a个单位,重心也右平移a个单位
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    昨天 00:11
  • 签到天数: 1654 天

    [LV.Master]无

    7#
    发表于 2019-2-5 01:20:32 | 显示全部楼层
    数值分析 发表于 2019-2-5 01:17; G5 e# c% J3 J/ s
    integral f(x)* x*dx=lambda右平移a个单位,则新重心位置integral f(x-a)*x*dx. 设t=x-a, integral f(t)*  ...
    $ u# ~0 E1 ?- S
    当然,前提是integral f(x)* dx=1,所以我跟晨风说要归一,否则确实不灵.
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    昨天 00:11
  • 签到天数: 1654 天

    [LV.Master]无

    8#
    发表于 2019-2-5 01:41:04 | 显示全部楼层
    Dracula 发表于 2019-2-5 01:37) _) a0 ~2 I7 _$ }) w9 t- @
    曲线下面的面积等于1,这个条件肯定不满足。因为这本来就不是个概率论的问题。0 g$ H$ R* t9 V, L. {+ p% v0 F  O
    8 ?7 j- C9 P8 i! ^) t/ y2 R
    那个公式是sum(xi * yi)  ...
    # z$ X/ K7 ^5 Z8 O! _$ C# }
    所以我和晨风说要归一么.用histogram 面积归一以后,没问题.这实际是个加权平均问题,加权平均要求所以权重加起来和是1.即integral f(x)* dx=1,现在权重是温度,加起来肯定不是1.但只要除以总面积,(这里就是总温度),就还是满足这个关系的.不影响结果.晨风只关心最高点出现的位置,而不关心最高点是多少,这是关键.
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    昨天 00:11
  • 签到天数: 1654 天

    [LV.Master]无

    9#
    发表于 2019-2-5 01:51:47 | 显示全部楼层
    晨枫 发表于 2019-2-5 01:49' M* r7 ^+ U, q) `3 a4 T5 h
    话说,如果选“爱坛最学术贴”,这个贴有没有希望当选?我肯定投一票!, O- U& Q$ @4 E) x
    & c0 ?' N. O! z, J
    多谢各位老大帮忙、指点。正在用 ...

    - u* }# Z5 G2 s/ p! Q3 E% p
    / `5 W) X7 o# e( H6 O& @如果不灵就是你那个偏态曲线和博松分布曲线实际上并不像,即重心和最高点不重合.不过有的修.如果到那一步咱们再谈怎么修.
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    昨天 00:11
  • 签到天数: 1654 天

    [LV.Master]无

    10#
    发表于 2019-2-5 01:54:37 | 显示全部楼层
    晨枫 发表于 2019-2-5 01:49; D' P" H7 W' A( T1 ]* K1 y
    话说,如果选“爱坛最学术贴”,这个贴有没有希望当选?我肯定投一票!
    # [/ \/ V9 R: S/ I  G  v
    2 u  g, g$ |8 a  }$ E* z多谢各位老大帮忙、指点。正在用 ...
    " I) v& e4 i: D, _) M
    不过不管灵不灵,晨大可以帮我验证这样一个事儿,即把整个曲线平移n个单位,用同样的算法算完,结果应该是老结果平移n个单位.这个不管是不是博松,只要面积归一一定都灵.
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    昨天 00:11
  • 签到天数: 1654 天

    [LV.Master]无

    11#
    发表于 2019-2-5 02:23:02 | 显示全部楼层
    本帖最后由 数值分析 于 2019-2-5 02:25 编辑
    1 l: `, R5 u* a( U+ Z3 X
    holycow 发表于 2019-2-5 02:15% B) i/ n5 e2 ]5 o* R
    伯爵的意思是说,总温度凭什么以零摄氏度做原点?如果零度不是原点,则和原点的相对温度差之和完全是主观 ...

    / w! N, _1 ?5 g. F' E* q: j4 \  n+ U
    这个答案很简单,因为用零度才像泊松分布,如果上下平移的话,重心还是存在的,只是和最高点不再重合.你可以试想一下把泊松分布加上一,然后重新归一,也能得一个新的分布,这个分布也有期望,但期望很可能就不是最高点了. 不过单峰分布,只要不是骨骼轻奇(偏度skewness特别大),基本上最高点和重心差不太远.
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    昨天 00:11
  • 签到天数: 1654 天

    [LV.Master]无

    12#
    发表于 2019-2-5 02:32:14 | 显示全部楼层
    holycow 发表于 2019-2-5 02:15
    7 k3 \/ X# c6 C3 s+ m5 B伯爵的意思是说,总温度凭什么以零摄氏度做原点?如果零度不是原点,则和原点的相对温度差之和完全是主观 ...
    * l) C5 d- T! Z! S: K8 p
    顺便说一下,如果是对称的单峰分布的话,就没有这个问题,随便上下平移,只要归一就可以.
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    昨天 00:11
  • 签到天数: 1654 天

    [LV.Master]无

    13#
    发表于 2019-2-5 08:47:33 | 显示全部楼层
    本帖最后由 数值分析 于 2019-2-5 09:07 编辑 / f* K  W0 E/ F/ }5 B
    holycow 发表于 2019-2-5 02:42+ Q" q, ]* c2 Q# D* g5 Z# u# E
    1. 极值出在哪里,只要估计出lambda即可7 h; i6 Z8 s5 h9 o
    2. Lambda的估计需要依赖于归一
    9 K7 m+ ^& u* @; q/ D5 J3. 归一的分母是可以主观确定的  ...
    ; G$ o4 Q/ J$ }8 F% s4 ^
    4 p" h, ]" r, Y
    如果是对称的单峰分布的话,期望存在的时候,期望和峰度Kurtosis(也就是你说的陡峭程度)无关,一定在众数Mode,即峰值的地方.唯一的例外是积分不收敛,即期望不存在(比如柯西分布,这时候没有重心).对于不对称的单峰分布,唯一能影响期望的是偏度Skewness.
    - s/ x6 o( g' l' R; p' H$ {: n$ T8 H
    这很直观,您再想想?

    点评

    手误了.多谢.改过来了.  发表于 2019-2-5 09:07
    后面应该是“不对称的单峰分布”吧?对称就没有skewness了。  发表于 2019-2-5 09:04
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    昨天 00:11
  • 签到天数: 1654 天

    [LV.Master]无

    14#
    发表于 2019-2-5 08:49:26 | 显示全部楼层
    tanis 发表于 2019-2-5 03:26+ G- Z! t$ w. t& Y' q* E
    冒昧的问一句,你搞过竞赛么~ # @6 {/ B  R! _% X# r  G. Y
    8 {0 q+ r0 i; j4 b: F
    思维方式挺像的~
    " t" m% K$ N. d/ J1 A
    我希望我搞过.可以当年没赶上机会.
    ; y9 E4 v  g, ?
    # T( w9 K4 f8 f0 t不谦虚一下啊,我一直觉得我要是搞竞赛的话能有点小成绩的...呵呵...
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    昨天 00:11
  • 签到天数: 1654 天

    [LV.Master]无

    15#
    发表于 2019-2-5 08:54:08 | 显示全部楼层
    Dracula 发表于 2019-2-5 03:43
    0 I8 C0 _/ G* k' G$ K+ u. v问题就是这个0度在哪儿你并不知道。至于曲线下的面积必须是1这一点,只要各个点同乘或同除一个数就都可以 ...

    . J3 R: O2 j! \5 O嗯...这个问题其实有点像"人择原理",不好表达清楚.
    + l/ T6 Q1 {6 i$ L这一切讨论的开始都是晨司机觉得这个曲线像泊送分布曲线.只有这个"0度"的位置合适,温度曲线才长得像泊松分布.如果你上下平移一下,他就不像泊送分布了.我不知道我说明白了没有...
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    昨天 00:11
  • 签到天数: 1654 天

    [LV.Master]无

    16#
    发表于 2019-2-5 09:01:03 | 显示全部楼层
    holycow 发表于 2019-2-5 08:56
    4 ~2 S! ]" D$ J0 z你是对的,有影响的是分布的skewness. 所以归根结底还是晨司机在零度原点图上扫了一眼,觉得看上去像是泊 ...
    - M- h2 x; S7 ?1 z! l1 H8 I% b
    对,我们可以管这个叫"晨择原理".这是这个讨论的出发点.
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2024-5-15 00:30 , Processed in 0.043150 second(s), 19 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表