设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
楼主: 晨枫
打印 上一主题 下一主题

[科研心得] 问题:如何从数据里估算普瓦松分布的均值?

[复制链接]
  • TA的每日心情
    慵懒
    2020-1-3 00:51
  • 签到天数: 71 天

    [LV.6]出窍

    68#
    发表于 2019-2-4 23:49:10 | 只看该作者
    1, 计算最大值,
    & d( y4 u% A3 \" p# |2, 计算左右的斜率$ H- [% F% ]: ~0 k
    3, 计算左右直线的交点。
    0 o7 [& L4 r$ x! `* f- D8 z4, 由交点根据斜率反推峰值的大概值。这个是quick&dirty的解决办法。想要准确,还得曲线拟合。2阶应该就可以了。过高反而会引入误差。但是拟合的资源消耗可能系统付不起。
    ! \$ c# d0 g! v9 N3 I9 ^
    : B( X! d5 R4 E; \! o% Vhttp://www.aswetalk.net/bbs/home ... um&picid=102923
    : S6 f( K+ P4 ?/ h
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    慵懒
    2020-7-26 05:11
  • 签到天数: 1017 天

    [LV.10]大乘

    67#
    发表于 2019-2-4 22:53:44 | 只看该作者
    晨枫 发表于 2019-2-4 22:38% F8 o1 C+ W$ i2 H
    嗯,我再想想。谢谢。
    : N2 v' T# I( j; j( _5 _* v
    我曾经想过一个和42楼类似的办法。区别是分母不是板数,而是各个板加在一起的温度的和。如果这条曲线真的是个density function,也就是说,曲线下的面积等于1的话,这个办法是可以的。这个办法就是把温度类比成统计学里的sample size来处理了。但是曲线下的面积等于1这个假设肯定不对。我曾经想过把它scale成1就是的了。但问题是你的纵坐标0度的设置应该纯粹是arbitrary的,但是这个0度的设置会直接影响scaling以及最后结果,因此这个办法也不行。$ G' }3 a9 \$ Y: |7 e

    , |; G* e2 U4 L( p( g  V+ ]2 [2 G如果想不出数学上的分析解的话,我的建议是你想一想人的直觉是怎么来处理这个问题的。你前面说,人眼一下就能看出来。把人直觉的逻辑想清楚的话,写个if then else的程序实现应该不算很难。: ^0 j9 r& d( [
    3 E5 I4 Y2 p+ @; Q) r6 _
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    66#
     楼主| 发表于 2019-2-4 22:46:52 | 只看该作者
    视觉错误 发表于 2019-2-4 08:458 z9 T0 Q: L9 S, V" }2 B# j  X; B
    同意伯爵的看法,本质上是个曲线拟合。* V! |+ O* z' x0 ~6 C  P
    这个曲线有点像某种分布曲线,晨大强调这个造成误解了。 ...
    ; [7 t1 W; x) K, a+ r. I/ K
    抱歉!我还特意提一句,这不是统计问题,但还是误导了。多谢各位指点。我这会儿有很多办法可以试试了!
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2018-4-14 22:10
  • 签到天数: 354 天

    [LV.8]合体

    65#
    发表于 2019-2-4 22:45:39 | 只看该作者
    同意伯爵的看法,本质上是个曲线拟合。
    ; N- Q, I) W3 i/ P这个曲线有点像某种分布曲线,晨大强调这个造成误解了。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    64#
     楼主| 发表于 2019-2-4 22:44:55 | 只看该作者
    视觉错误 发表于 2019-2-4 08:42  u6 I: }; o6 u2 N3 }
    这个峰值位置还需要用于控制吗?- H; G( g7 U5 ^  s2 z1 T5 B
    我理解这个峰值位置计算出来也就是用于参考吧。 ...
    ) V) W! k3 ^0 c8 D
    我就是想用于控制。这对应于吸收塔里放热反应的热点位置,决定了吸收效率。跑得太偏了,要么浪费能源,要么吸收不达标。传统的单点温度控制效果有限,很容易被上下移动的峰值位置所“误导”。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2018-4-14 22:10
  • 签到天数: 354 天

    [LV.8]合体

    63#
    发表于 2019-2-4 22:42:59 | 只看该作者
    晨枫 发表于 2019-2-4 22:25
    $ N2 D8 c8 \* V" H  D是的,我以前还试过用MATLAB C通过OPC与DCS相连,在技术上这是做得到的,但可靠性达不到要求。OPC是不作 ...
    ' W) ]5 ~: R! ]9 {; @
    这个峰值位置还需要用于控制吗?& O2 T9 ?4 `' u; f! s; g. n
    我理解这个峰值位置计算出来也就是用于参考吧。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    62#
     楼主| 发表于 2019-2-4 22:42:56 | 只看该作者
    雨楼 发表于 2019-2-4 08:37* }. {0 L1 x0 c! r1 _
    1. 20个数据点在分布上有没有规律。比如两头低中间高。
    8 K( i% I+ l1 A$ o0 |& k2。规律稳定么?  n! q, z" A" _; _! i
    3。可不可以简化成20个点里找最 ...
    4 A6 G$ ?* w8 c" J$ U  i
    两头低,中间高,但峰值形状随工艺条件而变,可以从“一头歪”的泊松变到对称的正态,然后继续变到往另一头歪的泊松。选最大值然后插值也是可以的,我就是在想是不是有可以一次性计算出来的,而不需要这样搜索。
    / t' f( o5 w1 D( H; ^$ S3 G7 {4 \' l' j; H' v: g' {9 F7 h. I
    如果42楼的办法最终不行,我可能回过来用你的办法。谢谢!
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    61#
     楼主| 发表于 2019-2-4 22:38:58 | 只看该作者
    Dracula 发表于 2019-2-4 08:336 d  s" ]9 J, u) @
    42楼那个办法不对。那是把这当成个统计学的问题来处理,但这不是个统计学问题。你的纵坐标是温度,不是sa ...

    + z* _5 |# f1 h0 s3 Y嗯,我再想想。谢谢。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    60#
     楼主| 发表于 2019-2-4 22:38:00 | 只看该作者
    雨楼 发表于 2019-2-4 08:31
      W4 W  ]- T9 A6 `就是正态分布然后在x轴上平移么? 类似Y=(X-a)^2.

    ( r$ @  `) G- v4 u+ c差不多。我开始也想过用抛物线然后平移,但平移量本身也要最小二乘出来。可能还是可以线性化然后用简单的最小二乘。我来试试看。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    慵懒
    2020-1-3 00:51
  • 签到天数: 71 天

    [LV.6]出窍

    59#
    发表于 2019-2-4 22:37:37 | 只看该作者
    晨枫 发表于 2019-2-4 00:03% f( q. b% k9 ~4 i4 G
    咳咳,这个其实不是统计问题,是从有限的温度测量估计温度分布曲线的问题。吸收塔一共20块塔板,每块塔板 ...
    7 H3 {4 w" z- e* {  V& V; o
    1. 20个数据点在分布上有没有规律。比如两头低中间高。  p8 C% I& z2 n! ^
    2。规律稳定么?
    ( r1 {2 R) I' o3 A; D3。可不可以简化成20个点里找最大值。
    9 l9 l5 t& D6 l( X. {) i/ d& F4。峰值如果不在采样点(塔板),而在塔板之间,只能按相邻塔板的问题计算温度曲线斜率,然后插值,而其要比较峰值塔板两侧的斜率,取较大的。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    58#
     楼主| 发表于 2019-2-4 22:35:21 | 只看该作者
    数值分析 发表于 2019-2-4 04:34
    % Z! F7 U; W$ h1 D/ _# U+ H6 r多解释一句scale那块儿。因为泊松分布曲线下面的面积是1,而你的histogram显然不是,所以你的histogram和 ...

    # c  R8 q" F0 k4 t% y/ w多谢!记住了!
    ( l, ^( K. W5 D0 @
    9 x- m" P2 r- C" Z其实你说的办法我已经试过。我把正态分布一边的尾巴砍掉,至少外观上接近泊松或者对数正态。只要有峰在,估计出来均值就还不错,越对称越准确,就有点窃喜。但对道理不摸底,不敢放手用。除非在数学上站得住脚,否则在线的时候没人看着,给我乱估一个就完蛋了。现在看来,道理就是你说的,这个办法不只适用于正态分布。曲线只有只有半边的话,就有点悬,这个可以理解。一般到不了这个情况,程序里简单判别一下也不难,另作处理。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    慵懒
    2020-7-26 05:11
  • 签到天数: 1017 天

    [LV.10]大乘

    57#
    发表于 2019-2-4 22:33:46 | 只看该作者
    晨枫 发表于 2019-2-4 22:20
    1 p4 p0 m# I* N% h* S对,就是这个意思。我也提到了,不是统计问题,只是“形似”,想看看统计里有没有现成的办法。楼上42楼就 ...
    $ _2 j8 {: Z( w6 ?4 s
    42楼那个办法不对。那是把这当成个统计学的问题来处理,但这不是个统计学问题。你的纵坐标是温度,不是sample size,不能这么用。最明显的是,那个办法解出来的量纲是温度,而你想要的应该是具体是那块板,因此那个解和你想要的没什么关系。
    ! m  s7 w# c( O% u
    / j" O0 E# j/ e0 k
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    慵懒
    2020-1-3 00:51
  • 签到天数: 71 天

    [LV.6]出窍

    56#
    发表于 2019-2-4 22:31:30 | 只看该作者
    晨枫 发表于 2019-2-3 23:46
      b) c$ d. o1 B7 i! U是我描述得不好。再来一遍。  l) n' O& ^8 k: t/ X
    $ o7 W2 X) S  o  e! |# T
    我有一条样子像泊松分布的温度分布曲线,但只有几个稀疏的点,想用类似泊松 ...
    ! f8 H: t- ~5 _! P
    就是正态分布然后在x轴上平移么? 类似Y=(X-a)^2.
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    55#
     楼主| 发表于 2019-2-4 22:26:58 | 只看该作者
    松叶牡丹 发表于 2019-2-4 00:36
    9 J5 n" t2 a: O. K( S9 e7 T& G' h晨大辛苦,您太客气了。祝新年快乐!
    ( X# o* i. U! l5 n7 }
    松叶MM新年快乐!
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    54#
     楼主| 发表于 2019-2-4 22:26:25 | 只看该作者
    gnomegordon 发表于 2019-2-4 00:39
      F/ D+ P3 ~( l; u8 Q) H5 ?apologize. 网上搜code太麻烦,还得验证。最好有本书可以翻翻 或者搜library
      _! t6 z9 {1 e3 ^' W
    再次感谢。楼下45楼有好办法,我先试试那个办法,比kernel density简单多了。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    53#
     楼主| 发表于 2019-2-4 22:25:29 | 只看该作者
    视觉错误 发表于 2019-2-4 04:02
    ' H* \" E, j3 ~5 k# Z我记得MATLAB支持OPC
    ; B# `! m+ l( {' c( {+ B
    是的,我以前还试过用MATLAB C通过OPC与DCS相连,在技术上这是做得到的,但可靠性达不到要求。OPC是不作为可靠的控制信息通道使用的,只能传送点监视数据或者一般数据采集。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    52#
     楼主| 发表于 2019-2-4 22:23:42 | 只看该作者
    视觉错误 发表于 2019-2-4 03:40! n" w3 K: _$ |4 _( f
    石化行业的DCS应该Honeywell多吧,这年头不支持OPC的很少了。+ J" h8 p( z4 a
    数据送到电脑上算,算了以后在送回去。 ...

    ) d& O4 D# W4 S5 D1 Z; N我们有OPC,问题是可靠性。用以下层基本的回路控制一般不用OPC,当机或者“交通堵塞”的后果太大。这是惯例。只有上层的APC可以用OPC,当了就自动shed到基本控制。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    51#
     楼主| 发表于 2019-2-4 22:21:02 | 只看该作者
    小刀 发表于 2019-2-4 06:399 A7 b- t' t& H" h; {, z7 k: t" Y* i
    可以试试GMM Guassian Mixed Model去拟合统计分布
    9 Q8 ?1 ?  y% y* y* b) ]
    这个还是太复杂了。用在控制回路里,必须KISS。但还是要谢一个!
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    50#
     楼主| 发表于 2019-2-4 22:20:16 | 只看该作者
    Dracula 发表于 2019-2-4 08:071 S5 q# Y* t/ X/ z* P$ J4 e# @
    我又看了一下你这个题,终于看明白了。你的问题是一条曲线类似于统计学上Poisson或者log-normal的density f ...
    - Y" \' J" H+ Q( Q
    对,就是这个意思。我也提到了,不是统计问题,只是“形似”,想看看统计里有没有现成的办法。楼上42楼就是我一开始想到的办法,但只想到那能用于正态分布,正想改造为对数正态,没想到可以直接套泊松。这就好了。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    49#
     楼主| 发表于 2019-2-4 22:17:54 | 只看该作者
    数值分析 发表于 2019-2-4 00:567 @5 M+ c. l; x4 W& ^0 I4 K, K+ }% g: H
    你应该不用拟合分布函数吧?你只想知道峰值的位置,然后你又知道(或者说你假设)是泊松分布,所以峰值的位 ...

    7 X" I+ L. I2 J这个办法好!回头试一下!我是打算用这个办法当正态分布处理的,没想到也可以相当直接地套到泊松分布。可能这就解决我的问题了!多谢!
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2024-9-28 03:52 , Processed in 0.038187 second(s), 18 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表