前向き研究の発表をすると、かならずツッコミが入る。
「sample size analysisはどうだったんだ?」「必要症例数は検討したんか?」
確かに最近のRCTを見ていると、必ずstatic powerや、サンプルサイズを検討している。
一般に、標本数が小さいほど検出力も小さい=第2種の過誤(β error)が生じやすいため、予めサンプルサイズを決める必要がある。
詳しいやり方を知りたくても、「疫学部が計算した」なんてハードル高い事が書いてあったりもする。統計素人の自分でもできる方法はないのか? 調べてみた。
STATAというソフトや、SPSSのオプション(高価!)でできるみたいだが、今回はfreewareとSPSSを組み合わせて使用。少なくとも、2群間のChi二乗検定と、t検定であれば何とか自分でもできそう。
統計力検定とは以下の4つがお互いに関連している。
有意水準(α、0.05)→→→→→→サンプルサイズ(N)
↑ ↓
↑ ↓
↑ ↓
検定力(1-β、0.8-0.95)←←←←←←←効果量(ファイ、Carmaer V, effect size)
すなわち、3つの要素が決定できれば、残る1つの値を算出できる。
1.サンプルサイズ 今回求めたい、必要症例数。
2.有意水準 とりあえず0.05。これは、目的とするp値の事。ほとんどの臨床研究では0.05。整形外科医が行うような研究はほぼ全て0.05。
3.検定力(power) powerとは何%の確率で狙った有意差が出せるか、とういうことかな。すなわち、「検定力0.95で必要症例数検討した」とあれば、その症例数があれば、95%の確率で有意差がでる、とういうことかな。
4.効果量(effect size) ちょっとややこしい。Chi二乗と、t検定でやり方が違う。
・カイ二乗検定の効果量
SPSSで計算できる。
・t検定の効果量
’d’という値を用いる。これには、標準偏差(SD)の値が必要。ちゃんとパイロットスタディーをやって計算している論文もあるだろうけど。これまでの研究結果や、臨床経験から勝手に推計して仮定した値から算出しているRCTの論文もあります。
4.の効果量さえ出せば、あとは、有意水準、power入力するだけで、とりあえずは必要症例数が出せます。
ポイント:症例数算出の方法は、統計学でも未だにcontorvertialな分野です。矛盾がなければOK。reviwerに指摘されても、強気に説得しましょう!