|
|
本帖最后由 Menuett 于 2013-12-22 15:59 编辑
) z7 M! o) R5 _1 L' W% |煮酒正熟 发表于 2013-12-20 12:05 ; W1 j! |' h/ \2 |, R
基本可以说是显著的。总的来说,在商界做统计学分析,95%信心水平是用得最多的,当95%上不显著时,都会去 ...
" ~" L' a% j! v* m# H7 L: m* W4 R# o9 X6 c" A
这个其实是一种binomial response,应该用Contigency Table或者Logisitic Regression(In case there are cofactors)来做。只记比率丢弃了Number of trial的信息(6841和1217个客户)。
% T; f7 V8 }/ I, n3 Q) T$ a8 z) _& r: M" A- E
结果p=0.5731。 远远不显著。要在alpha level 0.05的水平上检验出76.42%和75.62%的区别,即使实验组和对照组各自样本大小相同,各自尚需44735个样本(At power level 80%)。see: Statistical Methods for Rates and Proportions by Joseph L. Fleiss (1981)9 W8 k2 F; E" H
9 m" V) s0 s7 [. m$ [
R example:
8 b, R( G. o3 f$ N& |5 ?
8 s( H9 \6 D: M5 t/ N> M<-as.table(rbind(c(1668,5173),c(287,930))): R6 K/ B/ P8 C6 I$ q" q' s7 v( x7 d
> chisq.test(M)9 y2 Q C& G$ T. e4 @1 }; i9 X
) v* W& N( y* B3 ?; \% d! \
Pearson's Chi-squared test with Yates' continuity correction
) a- |6 @8 U# N6 t* }* x! C) F% {7 T$ ?( W5 v) r1 B& {& x2 j
data: M
# C% Y d2 ^' }$ pX-squared = 0.3175, df = 1, p-value = 0.5731- W* T$ p; T. ~! J4 s
% J6 L" f1 e. @8 S
Python example:% _- V' X3 A2 h
$ s8 F. V. m( k7 x4 B
>>> from scipy import stats$ g3 f2 Y6 _ _4 O: v
>>> stats.chi2_contingency([[6841-5173,5173],[1217-930,930]])
. v4 j- Y3 B& E9 a" C# z(0.31748297614660292, 0.57312422493552839, 1, array([[ 1659.73628692, 5181.26371308],% @9 D% \+ R0 k# F1 C
[ 295.26371308, 921.73628692]])) |
|