设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
楼主: 晨枫
打印 上一主题 下一主题

[科研心得] 问题:如何从数据里估算普瓦松分布的均值?

[复制链接]
  • TA的每日心情
    开心
    16 小时前
  • 签到天数: 1664 天

    [LV.Master]无

    楼主
    发表于 2019-2-4 14:56:30 | 显示全部楼层
    本帖最后由 数值分析 于 2019-2-4 15:05 编辑 * A+ q9 Y. Y' r+ S
    " S# }: g& Z# ]8 p9 J! M
    你应该不用拟合分布函数吧?你只想知道峰值的位置,然后你又知道(或者说你假设)是泊松分布,所以峰值的位置一定是 x=lambda,(这里lambda不一定是整数),那么剩下的就是从样本里推断lambda了,这是个典型的估计啊. 对于泊松分布,lambda正好是期望,所以一般来用样本均值估计期望。
    5 {& X) I; O& d& I2 L8 P3 @, o' i你给每一个板子从最左边顺序编个号,i=0,1,2,3。。。,然后设每块板子i的对应温度样本值xi,,然后计算sum(i*xi)/n [即累加所有的(板号乘以对应温度)然后除以板数】 (因为你的分布曲线可能和泊松分布差一个常数,所以最后结果得scale一下)不就可以了么?当然,这得假设你的histogram真的得长得像泊松分布分布。( B9 T$ G1 @5 t0 `
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    16 小时前
  • 签到天数: 1664 天

    [LV.Master]无

    沙发
    发表于 2019-2-4 18:34:42 | 显示全部楼层
    数值分析 发表于 2019-2-4 14:56) ~. U2 @; j  {8 @3 Y
    你应该不用拟合分布函数吧?你只想知道峰值的位置,然后你又知道(或者说你假设)是泊松分布,所以峰值的位 ...
      y3 n: d8 A4 ?8 l. D; Z5 i' z& }$ e7 ~
    多解释一句scale那块儿。因为泊松分布曲线下面的面积是1,而你的histogram显然不是,所以你的histogram和泊松分布差一个常数。你求出来的lambda的估计要用你histogram的面积归一一下。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    16 小时前
  • 签到天数: 1664 天

    [LV.Master]无

    板凳
    发表于 2019-2-5 00:52:41 | 显示全部楼层
    本帖最后由 数值分析 于 2019-2-5 00:58 编辑
    1 o2 {. L% Z8 b* k" K# Q1 _
    Dracula 发表于 2019-2-4 22:53* v, Z+ W3 A6 ?& d! d
    我曾经想过一个和42楼类似的办法。区别是分母不是板数,而是各个板加在一起的温度的和。如果这条曲线真的 ...
      S, Z& ^7 T; _  {& U2 o

    6 r% ]) b+ m2 D% z这个和统计其实关系不大.你可以把他想象成求重心问题.已知一条曲线和x轴围成一个形状,如果这个形状是均匀厚度的匀质材料构成的一块板子,那么这个形状重心的x座标是多少?这个x座标(如果存在的话)就是这个分布的数学期望.这其实就是一个加权平均问题.当然,一个任意形状的重心和最高点的x座标当然不一定一致.不过数学上可以证明,高斯曲线和博松分布曲线围成的图形重心的x座标和最高点的x座标正好一样.和统计没关系.你再想想?

    点评

    给力: 5.0 涨姿势: 5.0
    这真是极好的: 5.0 不能同意更多: 5.0
    给力: 5 涨姿势: 5 这真是极好的: 5 不能同意更多: 5
      发表于 2019-2-5 01:02

    评分

    参与人数 2爱元 +6 收起 理由
    黑洞的颜色 + 4
    tanis + 2 给力

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    16 小时前
  • 签到天数: 1664 天

    [LV.Master]无

    地板
    发表于 2019-2-5 00:54:33 | 显示全部楼层
    本帖最后由 数值分析 于 2019-2-5 01:04 编辑 ) j( F& ^$ q" T" I- c" {! H
    晨枫 发表于 2019-2-4 22:384 y  d  z) _8 c, @
    嗯,我再想想。谢谢。
    / o8 ~8 b6 v4 E7 |2 N

    $ ~% w8 b2 k2 y0 e! i! T  k请见74楼回复.谢谢.
    2 Z2 B7 s) `# ^
    4 e$ Y3 R+ ~, D  q任意偏态分布最高点的位置就不能简单的用样本均值来估计了.不过也有办法,如果已知分布函数可以用矩估计或者最大似然估计.
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    16 小时前
  • 签到天数: 1664 天

    [LV.Master]无

    5#
    发表于 2019-2-5 01:07:35 | 显示全部楼层
    Dracula 发表于 2019-2-5 01:02( l7 \: O3 l- v7 e$ L
    这个和零点的选择是有关的。如果把温度类比为具体某块板的sample size的话,统计学的那个解就是以sample  ...

    - k* A7 h6 I2 Q. i% ^( n: l你可以试试,平移没有问题的.你把他想象成求重心问题,曲线平移x,重心也平移x..
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    16 小时前
  • 签到天数: 1664 天

    [LV.Master]无

    6#
    发表于 2019-2-5 01:17:28 | 显示全部楼层
    数值分析 发表于 2019-2-5 01:072 I& W* @7 `% W: B
    你可以试试,平移没有问题的.你把他想象成求重心问题,曲线平移x,重心也平移x.. ...

    . h4 ^# s7 K% B2 y# `# r* Sintegral f(x)* x*dx=lambda右平移a个单位,则新重心位置integral f(x-a)*x*dx. 设t=x-a, integral f(t)* (t+a)*d(t+a)=integral f(t)* (t+a)* dt=integral f(t)* t* dt+integral f(t)* a* dt=lambda+a (因为integral f(t)*a *dt=a*integral f(t)* dt=a,而 integral f(t)* t* dt=lambda)
    3 z" k8 F& i; t9 p9 M  Y! l% d形状右平移a个单位,重心也右平移a个单位
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    16 小时前
  • 签到天数: 1664 天

    [LV.Master]无

    7#
    发表于 2019-2-5 01:20:32 | 显示全部楼层
    数值分析 发表于 2019-2-5 01:17' d2 T  C" a0 \# @  T6 R
    integral f(x)* x*dx=lambda右平移a个单位,则新重心位置integral f(x-a)*x*dx. 设t=x-a, integral f(t)*  ...
    ( C, F9 Y) F$ Q
    当然,前提是integral f(x)* dx=1,所以我跟晨风说要归一,否则确实不灵.
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    16 小时前
  • 签到天数: 1664 天

    [LV.Master]无

    8#
    发表于 2019-2-5 01:41:04 | 显示全部楼层
    Dracula 发表于 2019-2-5 01:37
    % T' l2 c' a$ V- f% e曲线下面的面积等于1,这个条件肯定不满足。因为这本来就不是个概率论的问题。( {  q  q  t3 d: J/ E

    ' {8 C$ i9 z& d" `* Y那个公式是sum(xi * yi)  ...

    " k) d1 A  A7 p所以我和晨风说要归一么.用histogram 面积归一以后,没问题.这实际是个加权平均问题,加权平均要求所以权重加起来和是1.即integral f(x)* dx=1,现在权重是温度,加起来肯定不是1.但只要除以总面积,(这里就是总温度),就还是满足这个关系的.不影响结果.晨风只关心最高点出现的位置,而不关心最高点是多少,这是关键.
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    16 小时前
  • 签到天数: 1664 天

    [LV.Master]无

    9#
    发表于 2019-2-5 01:51:47 | 显示全部楼层
    晨枫 发表于 2019-2-5 01:49
    * K# j- W& {, _1 e. R8 J话说,如果选“爱坛最学术贴”,这个贴有没有希望当选?我肯定投一票!
    ; ~5 m1 l1 p; @3 q  G
    4 X" G/ e7 |; C+ V/ L多谢各位老大帮忙、指点。正在用 ...

    8 ~- F$ g6 ^6 K1 i( E
    , ~) K' ?8 S7 s% }. a: j. k如果不灵就是你那个偏态曲线和博松分布曲线实际上并不像,即重心和最高点不重合.不过有的修.如果到那一步咱们再谈怎么修.
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    16 小时前
  • 签到天数: 1664 天

    [LV.Master]无

    10#
    发表于 2019-2-5 01:54:37 | 显示全部楼层
    晨枫 发表于 2019-2-5 01:49
    " P8 c& w  U9 K7 A8 I3 m  Y话说,如果选“爱坛最学术贴”,这个贴有没有希望当选?我肯定投一票!
    9 v# a( @2 ~" b: g/ j) u: P" u$ J$ h. x, r
    多谢各位老大帮忙、指点。正在用 ...

    % t4 v, o5 _" S9 k不过不管灵不灵,晨大可以帮我验证这样一个事儿,即把整个曲线平移n个单位,用同样的算法算完,结果应该是老结果平移n个单位.这个不管是不是博松,只要面积归一一定都灵.
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    16 小时前
  • 签到天数: 1664 天

    [LV.Master]无

    11#
    发表于 2019-2-5 02:23:02 | 显示全部楼层
    本帖最后由 数值分析 于 2019-2-5 02:25 编辑
    8 @* B& k( j( S9 `; e
    holycow 发表于 2019-2-5 02:15
    ) x" p+ `: B6 d" \6 X伯爵的意思是说,总温度凭什么以零摄氏度做原点?如果零度不是原点,则和原点的相对温度差之和完全是主观 ...

    2 m+ l. N+ e  h" i3 a9 i3 y: |( y* k' g0 J' D5 G
    这个答案很简单,因为用零度才像泊松分布,如果上下平移的话,重心还是存在的,只是和最高点不再重合.你可以试想一下把泊松分布加上一,然后重新归一,也能得一个新的分布,这个分布也有期望,但期望很可能就不是最高点了. 不过单峰分布,只要不是骨骼轻奇(偏度skewness特别大),基本上最高点和重心差不太远.
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    16 小时前
  • 签到天数: 1664 天

    [LV.Master]无

    12#
    发表于 2019-2-5 02:32:14 | 显示全部楼层
    holycow 发表于 2019-2-5 02:15
    + s0 }/ d- M, V5 x* F; F# o伯爵的意思是说,总温度凭什么以零摄氏度做原点?如果零度不是原点,则和原点的相对温度差之和完全是主观 ...
    * D8 Y1 O, t) G; Y
    顺便说一下,如果是对称的单峰分布的话,就没有这个问题,随便上下平移,只要归一就可以.
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    16 小时前
  • 签到天数: 1664 天

    [LV.Master]无

    13#
    发表于 2019-2-5 08:47:33 | 显示全部楼层
    本帖最后由 数值分析 于 2019-2-5 09:07 编辑
    & Q# K7 r3 L' R3 |7 x7 K& |6 `' M9 l
    holycow 发表于 2019-2-5 02:42
    * i# ~* I/ b% d& ?- e& M/ i1. 极值出在哪里,只要估计出lambda即可
    % o" \% `$ `' g) X' R" @& b2. Lambda的估计需要依赖于归一
    2 s2 |* }" s$ t. B+ W" U4 i3. 归一的分母是可以主观确定的  ...

      l$ i- r0 \; J% o- y4 X
    0 t# H0 F; ~6 M* J' S# o如果是对称的单峰分布的话,期望存在的时候,期望和峰度Kurtosis(也就是你说的陡峭程度)无关,一定在众数Mode,即峰值的地方.唯一的例外是积分不收敛,即期望不存在(比如柯西分布,这时候没有重心).对于不对称的单峰分布,唯一能影响期望的是偏度Skewness.
    / @1 N8 e8 m6 s% n/ Q" N" t# J
    4 u' f$ q  _0 ^+ Q& C( b! X7 R这很直观,您再想想?

    点评

    手误了.多谢.改过来了.  发表于 2019-2-5 09:07
    后面应该是“不对称的单峰分布”吧?对称就没有skewness了。  发表于 2019-2-5 09:04
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    16 小时前
  • 签到天数: 1664 天

    [LV.Master]无

    14#
    发表于 2019-2-5 08:49:26 | 显示全部楼层
    tanis 发表于 2019-2-5 03:26
    ' L4 ~7 e) c" d7 h冒昧的问一句,你搞过竞赛么~
    $ p# Q1 }; q: B( ?
    # j2 _) Y2 U' C4 v5 Y! y思维方式挺像的~

    * P  u# R# l. J/ w) I我希望我搞过.可以当年没赶上机会.
    2 m1 F7 _5 S  I% S$ X& M$ K3 V; S1 X& B
    不谦虚一下啊,我一直觉得我要是搞竞赛的话能有点小成绩的...呵呵...
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    16 小时前
  • 签到天数: 1664 天

    [LV.Master]无

    15#
    发表于 2019-2-5 08:54:08 | 显示全部楼层
    Dracula 发表于 2019-2-5 03:43
    2 N9 y0 E# w, W8 Q" _( _1 l问题就是这个0度在哪儿你并不知道。至于曲线下的面积必须是1这一点,只要各个点同乘或同除一个数就都可以 ...

    : X; X0 D9 T+ ~嗯...这个问题其实有点像"人择原理",不好表达清楚.
    , V) h# `$ J9 [这一切讨论的开始都是晨司机觉得这个曲线像泊送分布曲线.只有这个"0度"的位置合适,温度曲线才长得像泊松分布.如果你上下平移一下,他就不像泊送分布了.我不知道我说明白了没有...
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    16 小时前
  • 签到天数: 1664 天

    [LV.Master]无

    16#
    发表于 2019-2-5 09:01:03 | 显示全部楼层
    holycow 发表于 2019-2-5 08:56
      D3 D4 ^( @: S$ p9 L) R) N9 ^你是对的,有影响的是分布的skewness. 所以归根结底还是晨司机在零度原点图上扫了一眼,觉得看上去像是泊 ...
    & h. c) z+ \6 P7 e
    对,我们可以管这个叫"晨择原理".这是这个讨论的出发点.
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2024-5-25 19:11 , Processed in 0.051704 second(s), 23 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表