
holycow 发表于 2019-2-3 22:437 B0 c' r& e; a5 B9 z7 X9 {
泊松分布?我还是没理解你釆样拿到了哪些数据点
松叶牡丹 发表于 2019-2-3 22:45
没怎么看明白题目,您是说已知y值,要求对应正态分布?
松叶牡丹 发表于 2019-2-3 22:456 D) y' } H! ~( z: k8 j" w/ s
没怎么看明白题目,您是说已知y值,要求对应正态分布?

晨枫 发表于 2019-2-4 12:50
如果太麻烦,最后可能也就用对称的正态分布近似了。反正都是近似…… ...
松叶牡丹 发表于 2019-2-3 22:52/ J6 G' l1 p1 d! _% @/ R
如果精度不要求很高的话,不知道查表法的精度能不能达到要求。那个倒是最快。 ...
晨枫 发表于 2019-2-4 12:46
是我描述得不好。再来一遍。/ _; @# {+ ~* `1 {
9 }2 O$ Y' E6 c) `
我有一条样子像泊松分布的温度分布曲线,但只有几个稀疏的点,想用类似泊松 ...
煮酒正熟 发表于 2019-2-3 22:58' _5 D. w0 s4 z$ ]7 }" ^- _
统计学我只明白最最基本的,泊松分布也理解不深。问几个傻问题吧:一共多少块塔板?为什么每块塔板只能取到 ...

tanis 发表于 2019-2-3 23:008 l+ o( X' n$ }2 x; z) {
原来是泊松分布。。。 惭愧,连最小二乘法都属于复杂算法了。。。还真不知道有什么其他的简便方法。这一 ...
松叶牡丹 发表于 2019-2-3 23:00
做成在线计算器,那就不能查表了,反而太麻烦。坐等观摩高手们过招。

晨枫 发表于 2019-2-4 13:03/ d+ A: n7 g: K5 N
咳咳,这个其实不是统计问题,是从有限的温度测量估计温度分布曲线的问题。吸收塔一共20块塔板,每块塔板 ...
晨枫 发表于 2019-2-4 13:06! X5 H0 [2 I+ I% o
切,我有那东西,还费这个事吗?Matlab、Maple,什么不能上啊!问题是我需要在线计算,而且只有FORTRAN一 ...
晨枫 发表于 2019-2-4 13:06
切,我有那东西,还费这个事吗?Matlab、Maple,什么不能上啊!问题是我需要在线计算,而且只有FORTRAN一 ...
tanis 发表于 2019-2-3 23:097 ^8 B: H. l# J
目视是指看数据点脑补么? 所以一共20个数据点(塔板),然后最高温度可能在点之间? 15s一次,速度很慢 ...
松叶牡丹 发表于 2019-2-3 23:12
您是说每块塔板都是15秒测量一次,所以每15秒要同时给出20个塔板的20个正态分布式子? ...
晨枫 发表于 2019-2-4 13:18: N' [* z: ]% H4 e4 D- u1 a1 o! g
正是:看数据点然后脑补。人工就是这么干的。但操作工要照管的事情太多,一会儿不看,可能就错过了,就可 ...
tanis 发表于 2019-2-3 23:121 e4 ?( ]4 Z* M$ P
找温度第二,第三高的两个点,拟合个直线,取中间的那个位置
晨枫 发表于 2019-2-4 13:23
塔板是等间距分布的,这样我还不如直接取温度最高的那一块了
有人工干预的时候就用人工,人忘了看就用这个。。。松叶牡丹 发表于 2019-2-3 23:21
降低精度,把一系列正态分布离散化为有限几个histogram,每次测试点先第一步进行范围判断,然后归到不同 ...
tanis 发表于 2019-2-3 23:27
哦哦。。。 那就取最高和第二个的中间位置 有人工干预的时候就用人工,人忘了看就用这个。。。 ...

松叶牡丹 发表于 2019-2-3 23:21
降低精度,把一系列正态分布离散化为有限几个histogram,每次测试点先第一步进行范围判断,然后归到不同 ...
晨枫 发表于 2019-2-4 13:33
唉,MATLAB里有histfit命令,干的正是我要的,可惜没法“偷”过来用啊
,这样啊,要不就得自己写算法了?晨枫 发表于 2019-2-4 13:33
唉,MATLAB里有histfit命令,干的正是我要的,可惜没法“偷”过来用啊
既然连忘了看也只是可能出问题,我脚的中值差不多
)(缺乏工匠精神的我。。。)& S' \0 D! P3 D6 i: I% G3 m$ \tanis 发表于 2019-2-3 23:37
Matlab 直接有poissfit啊。。。5 u* ^, C- y! |4 {
我感觉人类脑补的水平估计和取中值也差不了多少了既然连忘了看也 ...

松叶牡丹 发表于 2019-2-3 23:41
您这个采样数据如果有之前很长时间的大批量数据的话,要不选一部分建模,建立比如10个distribution式子,用 ...
晨枫 发表于 2019-2-4 13:437 u0 j X+ E5 b8 d2 Q# K6 c, @
这个好像不行?我需要的是实时估计当前的峰值点,历史数据能帮什么忙呢? ...
gnomegordon 发表于 2019-2-3 23:55$ u8 T2 y, U' A. t+ i
如果问题是拟合若干点的光滑曲线 找到最大值,kernel density 就好,matlab里的histfit 也是基于这个算法。 ...
松叶牡丹 发表于 2019-2-4 00:076 M8 ^ h' M/ g* _* i$ X- f6 z
历史数据建模自己写算法做验证用。不过如果可以像楼上那位说的可以找到现成library调用,kernel density ...
我就是要拟合一个“钟形曲线”,然后找峰值所在点。相当于上图中红线(或者lambda=2)里横轴1-2之间的位置。
Dracula 发表于 2019-2-4 00:24
说实话,你这个题目我没看懂。
0 T9 \5 V* ]# v1 z( x }( _ h
但如果你你单纯就是想实现
Dracula 发表于 2019-2-4 14:24$ {& W0 \9 j& w7 ]0 \# O- v( P
说实话,你这个题目我没看懂。
6 {. w: f' a5 @
但如果你你单纯就是想实现

晨枫 发表于 2019-2-4 14:19
多谢!这个kernel density以前没有玩过,正在研究中……

晨枫 发表于 2019-2-4 14:16: z& {' i4 M9 F; o
十分感谢!打开看到的是SRC文件,还在找FORTRAN……
晨枫 发表于 2019-2-4 14:34
有了 μ和 σ想计算峰值就容易了,我的问题是如何从histogram计算log normal的 μ和 σ。看来这也是个办 ...
晨枫 发表于 2019-2-4 13:33
唉,MATLAB里有histfit命令,干的正是我要的,可惜没法“偷”过来用啊
数值分析 发表于 2019-2-4 14:56
你应该不用拟合分布函数吧?你只想知道峰值的位置,然后你又知道(或者说你假设)是泊松分布,所以峰值的位 ...
晨枫 发表于 2019-2-4 12:30
没人理我?都在忙着吃年夜饭?
@煮酒正熟 @holycow @tanis @关中农民 @老马丁 @Dracula ...

数值分析 发表于 2019-2-4 00:56
你应该不用拟合分布函数吧?你只想知道峰值的位置,然后你又知道(或者说你假设)是泊松分布,所以峰值的位 ...
Dracula 发表于 2019-2-4 08:075 j" b/ b' T% S5 ]; \+ ]3 d& o
我又看了一下你这个题,终于看明白了。你的问题是一条曲线类似于统计学上Poisson或者log-normal的density f ...
小刀 发表于 2019-2-4 06:39: j" q% f E9 D/ {9 _+ R
可以试试GMM Guassian Mixed Model去拟合统计分布
视觉错误 发表于 2019-2-4 03:40" U- c4 G6 |/ ^+ _6 z4 W
石化行业的DCS应该Honeywell多吧,这年头不支持OPC的很少了。! S6 ]3 q( o8 U2 z' P" d3 m6 L$ J
数据送到电脑上算,算了以后在送回去。 ...
视觉错误 发表于 2019-2-4 04:02
我记得MATLAB支持OPC
gnomegordon 发表于 2019-2-4 00:39
apologize. 网上搜code太麻烦,还得验证。最好有本书可以翻翻 或者搜library
松叶牡丹 发表于 2019-2-4 00:36
晨大辛苦,您太客气了。祝新年快乐!
晨枫 发表于 2019-2-3 23:46
是我描述得不好。再来一遍。
我有一条样子像泊松分布的温度分布曲线,但只有几个稀疏的点,想用类似泊松 ...
晨枫 发表于 2019-2-4 22:20
对,就是这个意思。我也提到了,不是统计问题,只是“形似”,想看看统计里有没有现成的办法。楼上42楼就 ...
数值分析 发表于 2019-2-4 04:347 g. v' D+ p: Y
多解释一句scale那块儿。因为泊松分布曲线下面的面积是1,而你的histogram显然不是,所以你的histogram和 ...
晨枫 发表于 2019-2-4 00:03
咳咳,这个其实不是统计问题,是从有限的温度测量估计温度分布曲线的问题。吸收塔一共20块塔板,每块塔板 ...
雨楼 发表于 2019-2-4 08:31
就是正态分布然后在x轴上平移么? 类似Y=(X-a)^2.
Dracula 发表于 2019-2-4 08:33
42楼那个办法不对。那是把这当成个统计学的问题来处理,但这不是个统计学问题。你的纵坐标是温度,不是sa ...
雨楼 发表于 2019-2-4 08:37
1. 20个数据点在分布上有没有规律。比如两头低中间高。
2。规律稳定么?- y: a+ V0 t( `
3。可不可以简化成20个点里找最 ...
晨枫 发表于 2019-2-4 22:25) b2 [' O1 }/ p1 A# g9 |
是的,我以前还试过用MATLAB C通过OPC与DCS相连,在技术上这是做得到的,但可靠性达不到要求。OPC是不作 ...
视觉错误 发表于 2019-2-4 08:42# q' T' u7 Z( {3 U
这个峰值位置还需要用于控制吗?
我理解这个峰值位置计算出来也就是用于参考吧。 ...
视觉错误 发表于 2019-2-4 08:45
同意伯爵的看法,本质上是个曲线拟合。
这个曲线有点像某种分布曲线,晨大强调这个造成误解了。 ...
晨枫 发表于 2019-2-4 22:38
嗯,我再想想。谢谢。
Dracula 发表于 2019-2-4 08:53
我曾经想过一个和42楼类似的办法。区别是分母不是板数,而是各个板加在一起的温度的和。如果这条曲线真的 ...
雨楼 发表于 2019-2-4 09:49; I: w1 k% E7 E* O
1, 计算最大值,
2, 计算左右的斜率
3, 计算左右直线的交点。
关中农民 发表于 2019-2-4 07:47
晨大,这得数学博士才中啊,额完全外行了,看见这个只能联想到面条 ...
晨枫 发表于 2019-2-5 00:01
多谢。接下来我会按42楼办法用实际数据多试试,包括scaling,然后和目视结果比较。如果可靠的话,就能用 ...
晨枫 发表于 2019-2-4 22:25
是的,我以前还试过用MATLAB C通过OPC与DCS相连,在技术上这是做得到的,但可靠性达不到要求。OPC是不作 ...
Dracula 发表于 2019-2-4 22:53
我曾经想过一个和42楼类似的办法。区别是分母不是板数,而是各个板加在一起的温度的和。如果这条曲线真的 ...
晨枫 发表于 2019-2-4 22:38
嗯,我再想想。谢谢。
数值分析 发表于 2019-2-5 00:527 ]" H+ |3 _5 j
这个和统计其实关系不大.你可以把他想象成求重心问题.已知一条曲线和x轴围成一个形状,如果这个形状如果是 ...
tanis 发表于 2019-2-4 10:523 W! W2 T$ R3 G: {) a* @
大工程的可靠性果然是我们小lab里完全不能比的。

Dracula 发表于 2019-2-4 10:37: |9 {, s# ~9 V6 X( C. d
我在你这儿再贴几张Melissa Benoist的照片

Dracula 发表于 2019-2-5 01:02
这个和零点的选择是有关的。如果把温度类比为具体某块板的sample size的话,统计学的那个解就是以sample ...
数值分析 发表于 2019-2-5 01:072 ?/ f4 e/ |9 {
你可以试试,平移没有问题的.你把他想象成求重心问题,曲线平移x,重心也平移x.. ...
数值分析 发表于 2019-2-5 01:07" d+ Y- T* ~: u! D1 V2 e7 w& j0 r
你可以试试,平移没有问题的.你把他想象成求重心问题,曲线平移x,重心也平移x.. ...
数值分析 发表于 2019-2-5 01:17
integral f(x)* x*dx=lambda右平移a个单位,则新重心位置integral f(x-a)*x*dx. 设t=x-a, integral f(t)* ...
晨枫 发表于 2019-2-5 01:06
呵呵,好久没见Melissa了。她笑起来还是很charming的!少了点妖气,这是她的长处,还是缺点。Too well ro ...
数值分析 发表于 2019-2-5 01:206 t1 I; ?7 T% h& U O
当然,前提是integral f(x)* dx=1,所以我跟晨风说要归一,否则确实不灵.
Dracula 发表于 2019-2-5 01:37
曲线下面的面积等于1,这个条件肯定不满足。因为这本来就不是个概率论的问题。
那个公式是sum(xi * yi) ...
Dracula 发表于 2019-2-4 11:21
看来你不去我的那个Superhero电视剧美女贴,那儿我最近一个月基本上每隔几天就会贴几张的。昨天庆祝CW宣 ...
数值分析 发表于 2019-2-4 11:41, A' F1 U' B9 f* ?
所以我和晨风说要归一么.用histogram 面积归一以后,没问题.这实际是个加权平均问题,加权平均要求所以权重 ...
晨枫 发表于 2019-2-5 01:49# ^9 X3 Y6 ~1 x0 s' s
话说,如果选“爱坛最学术贴”,这个贴有没有希望当选?我肯定投一票!
多谢各位老大帮忙、指点。正在用 ...
晨枫 发表于 2019-2-5 01:49+ A" Q/ H$ U5 K& }* A, n4 S
话说,如果选“爱坛最学术贴”,这个贴有没有希望当选?我肯定投一票!
多谢各位老大帮忙、指点。正在用 ...
数值分析 发表于 2019-2-5 01:41
所以我和晨风说要归一么.用histogram 面积归一以后,没问题.这实际是个加权平均问题,加权平均要求所以权重 ...
数值分析 发表于 2019-2-4 11:54$ j0 e L/ n( O! n4 T
不过不管灵不灵,晨大可以帮我验证这样一个事儿,即把整个曲线平移n个单位,用同样的算法算完,结果应该是老 ...
数值分析 发表于 2019-2-4 11:510 B0 W7 S8 `& a4 G) R+ b5 F! M" O
如果不灵就是你那个偏态曲线和博松分布曲线实际上并不像,即重心和最高点不重合.不过有的修.如果到那一步 ...
数值分析 发表于 2019-2-4 09:411 G9 f! v2 S1 y7 L. W! r2 x
所以我和晨风说要归一么.用histogram 面积归一以后,没问题.这实际是个加权平均问题,加权平均要求所以权重 ...
holycow 发表于 2019-2-5 02:15
伯爵的意思是说,总温度凭什么以零摄氏度做原点?如果零度不是原点,则和原点的相对温度差之和完全是主观 ...
holycow 发表于 2019-2-5 02:15- r1 k, m/ o! I. d i9 Q* s# e
伯爵的意思是说,总温度凭什么以零摄氏度做原点?如果零度不是原点,则和原点的相对温度差之和完全是主观 ...
数值分析 发表于 2019-2-4 10:32
顺便说一下,如果是对称的单峰分布的话,就没有这个问题,随便上下平移,只要归一就可以. ...
数值分析 发表于 2019-2-5 02:23/ P7 r" h# P7 b! d6 K
这个答案很简单,因为用零度才像泊松分布,如果上下平移的话,重心还是存在的,只是和最高点不再重合.你可以 ...

数值分析 发表于 2019-2-5 02:23# G& E1 [1 c3 v% Y# A( `# H* x
这个答案很简单,因为用零度才像泊松分布,如果上下平移的话,重心还是存在的,只是和最高点不再重合.你可以 ...
对某公共汽车站的客流做调查,统计了某天上午10:30到11:47来到候车的乘客情况。假定来到候车的乘客各批(每批可以是1人也可以是多人)是互相独立发生的。观察每20秒区间来到候车的乘客批次,共观察77分钟*3=231次,共得到230个观察记录。其中来到0批、1批、2批、3批、4批及4批以上的观察记录分别是100次、81次、34次、9次、6次。使用极大似真估计(MLE),得到 的估计为λ=(81*1+34*2+9*3+6*4)/231=0.8658。
木不铎 发表于 2019-2-4 15:312 J1 a1 }: W$ S8 H) _) e2 O( O
不麻烦啊。查一下维基百科上关于“泊松分布”的页面嘛。( u2 \- \0 s& f/ c+ E; m2 f9 \
泊松分布的概率密度函数为
| 欢迎光临 爱吱声 (http://aswetalk.net/bbs/) | Powered by Discuz! X3.2 |