|
本帖最后由 Menuett 于 2013-12-22 15:59 编辑
8 e+ K2 O, Z3 J煮酒正熟 发表于 2013-12-20 12:05
* m4 K( o% ~( F4 V) Y. n基本可以说是显著的。总的来说,在商界做统计学分析,95%信心水平是用得最多的,当95%上不显著时,都会去 ...
+ t* K; r5 d$ c0 I: X/ f5 |8 Q$ d( t2 N8 v% M0 L
这个其实是一种binomial response,应该用Contigency Table或者Logisitic Regression(In case there are cofactors)来做。只记比率丢弃了Number of trial的信息(6841和1217个客户)。
& C: ]5 d1 K) t) e8 H8 ?4 ~4 C- R/ d
6 ^: M6 X9 P- C( m5 Y9 v结果p=0.5731。 远远不显著。要在alpha level 0.05的水平上检验出76.42%和75.62%的区别,即使实验组和对照组各自样本大小相同,各自尚需44735个样本(At power level 80%)。see: Statistical Methods for Rates and Proportions by Joseph L. Fleiss (1981)( l" ?( _3 f$ Z4 _" n4 X
# Y1 _+ M. p! S/ E y2 g* s, BR example:
0 {8 O3 i/ q+ C
4 s& G& ]" y! e5 r' U9 T> M<-as.table(rbind(c(1668,5173),c(287,930)))
" I1 L( h V& y> chisq.test(M) r7 J. v$ Y1 ?4 b; w
6 O8 j: F$ B' E1 N$ q; A& r, k
Pearson's Chi-squared test with Yates' continuity correction
3 n9 H8 A8 ~5 F W$ K$ Z
& Z$ s" C/ F b# v! \/ }2 H; n; Zdata: M
* t) O; D; ^, _& h$ {# HX-squared = 0.3175, df = 1, p-value = 0.5731+ J1 ~+ G, y- Q- v9 k! Z( {1 U/ }
6 }- u* H! T- e- J% `6 I5 ^Python example:
9 e2 R' O. b, l, J1 K, Y" f( y
& y1 J+ F1 T5 u; I>>> from scipy import stats
. }, a' M# U6 n>>> stats.chi2_contingency([[6841-5173,5173],[1217-930,930]])1 l" ]' q/ j# M
(0.31748297614660292, 0.57312422493552839, 1, array([[ 1659.73628692, 5181.26371308],
- j$ C5 M9 r4 B" s% q [ 295.26371308, 921.73628692]])) |
|