23.連続変数の解析は最初に正規性を確認する
連続変数を解析するときは、まず最初に正規分布に従うか図をかき、さらに検定をする
統計をするときは、2群や3群以上何らかの平均値に有意差があるかを検討することが多いが、そのためにどの手法(t検定なのか、Welchのt検定なのか、Mann0Whitney U検定を用いるのか)を選ぶのかが、もともとの連続変数の分布が正規分布に従うか従わないかで変わってきてしまう。そのため、連続変数のデータを集めたら、すぐに図をかき、検定を行い、正規分布に従うかどうかを判定する。
連続変数を解析する場合は、それが正規分布normal distributionに従うか、従わないかについて検討する必要がある。なお、腫瘍マーカーなど、対数変換すれば正規分布に従うこともある。
https://bellcurve.jp/statistics/course/12931.html
32-2. 正規性の確認
EZRでは、データをEZRに読み込んだ後、
統計解析 > 連続変数の解析 > 正規性の検定(Kolmogorov-Smirnov検定)
で、ヒストグラムの図と、Kolmogorov-Smirnov検定、Shapiro-Wilk検定を行ってくれる。
正規分布とは
正規分布とは、平均を μ 、分散を σ2 とした場合に以下の確率密度関数で表される確率分布を指す。
出典:https://ja.wikipedia.org/wiki/%E6%AD%A3%E8%A6%8F%E5%88%86%E5%B8%83
平均0, 分散1の正規分布のグラフ
Rでは、以下の式で描くことができます。
curve(dnorm, -5, 5)
https://ai-trend.jp/basic-study/normal-distribution/normal-distribution/
2020/05/14
正規分布の分かりやすいまとめ
https://bellcurve.jp/statistics/course/7797.html
14-1. 正規分布
https://atarimae.biz/archives/9850
正規分布とは何なのか?その基本的な性質と理解するコツ
2019年9月9日
見出し