00.初めての医療統計rとezr:05.colaboratoryで自前データでrで統計
差分
このページの2つのバージョン間の差分を表示します。
両方とも前のリビジョン前のリビジョン次のリビジョン | 前のリビジョン | ||
00.初めての医療統計rとezr:05.colaboratoryで自前データでrで統計 [2019/10/13] – [Rに関するリンク] adash333 | 00.初めての医療統計rとezr:05.colaboratoryで自前データでrで統計 [2022/03/23] (現在) – [自前データの用意] adash333 | ||
---|---|---|---|
行 10: | 行 10: | ||
今回は、自前のエクセルデータをGoogleColaboratory上にアップロードして、Rで統計解析を行いたいたいと思います。 | 今回は、自前のエクセルデータをGoogleColaboratory上にアップロードして、Rで統計解析を行いたいたいと思います。 | ||
+ | |||
+ | ===== エンコードの注意点 UTF8とShiftJIS ===== | ||
+ | https:// | ||
+ | 第23章 Rのエンコーディング問題 | ||
+ | |||
+ | Windowsでエクセルをcsvで保存すると、基本的には Shift-JISでエンコードされる。→MacやColaboratoryで開くと文字化けする | ||
+ | |||
+ | Windowsでエクセルをcsv(UTF-8形式)で保存すると、MacやColaboratoryで開くことができるが、WindowsのRStudioで開くと文字化けする | ||
+ | ===== ソースコード ===== | ||
+ | https:// | ||
===== 開発環境 ===== | ===== 開発環境 ===== | ||
行 22: | 行 32: | ||
{{ : | {{ : | ||
+ | |||
+ | {{ : | ||
{{: | {{: | ||
行 160: | 行 172: | ||
- | ===== ggplot2()関数でグラフを表示してみる ===== | + | ===== ggplot()関数でグラフを表示してみる ===== |
+ | |||
+ | DMの有無(0と1)で、BMIの棒グラフ(平均meanと標準偏差sdを計算)を描いてみます。 | ||
+ | |||
+ | < | ||
+ | # convert関数を用いるためにhablarパッケージをインストール | ||
+ | install.packages(" | ||
+ | |||
+ | # hablarパッケージの使用を宣言 | ||
+ | library(" | ||
+ | # convert関数を用いて、d2のDM列のデータ型をfactorに変更 | ||
+ | d2 %>% | ||
+ | convert(fct(DM)) | ||
+ | </ | ||
+ | |||
+ | {{: | ||
+ | |||
+ | ggplot()関数を用いて棒グラフを描画します。 | ||
+ | |||
+ | < | ||
+ | # ggplot()関数を用いる | ||
+ | # geom_bar()でstat=" | ||
+ | g <- ggplot(d3, aes(x=DM, y=mean)) + | ||
+ | geom_bar(stat=" | ||
+ | geom_errorbar(aes(ymin = mean - sd, ymax = mean + sd, width = 0.3)) | ||
+ | g | ||
+ | </ | ||
+ | |||
+ | {{: | ||
+ | |||
+ | ===== t検定を行う ===== | ||
+ | DM(糖尿病)の有無で、BMIに差があるかt検定してみます。(t検定できるかどうかは、今回は気にしないことにします。) | ||
+ | |||
+ | まず、DM_ari と、DM_nasiの数列(ベクトル?tibble? | ||
+ | < | ||
+ | DM_ari <- filter(data_xlsx, | ||
+ | DM_ari | ||
+ | |||
+ | DM_nasi <- filter(data_xlsx, | ||
+ | DM_nasi | ||
+ | </ | ||
+ | |||
+ | その後、DM_ariとDM_nasiでt検定を行います。 | ||
+ | < | ||
+ | t.ans1 <- t.test(DM_ari, | ||
+ | t.ans1 | ||
+ | </ | ||
+ | |||
+ | {{: | ||
+ | |||
+ | p-value = 0.05792 (> 0.05 ) なので、「DMの有無で、BMIに有意差があるとは言えない。」という結論になります。 | ||
+ | |||
+ | ===== 結果をipynbファイルでダウンロードして、自分のパソコンでhtmlに変換する(要Anaconda) ===== | ||
+ | 自分のパソコン(オフライン)に結果を保存しておきたい場合は、ipynbファイルをダウンロードして、htmlに変換しておきます。 | ||
+ | https:// | ||
+ | |||
+ | |||
+ | -Anacondaを自分のパソコンにインストール | ||
+ | -Anaconda promptで、conda install nbconvert でnbconvertをインストール | ||
+ | -次を入力 | ||
+ | < | ||
+ | jupyter nbconvert --to html xxxxxxxx.ipynb | ||
+ | </ | ||
+ | |||
+ | {{: | ||
+ | |||
+ | |||
+ | |||
+ | ===== ソースコード ===== | ||
+ | https:// | ||
+ | |||
+ | ===== Rでグラフを描くためのggplot2パッケージ ===== | ||
+ | Rでグラフをかくなら、必須のパッケージといってよいと思います。 | ||
+ | |||
+ | まず最初に、以下のリンク先の4つのスライドをご覧ください。素晴らしいです。 | ||
+ | |||
+ | https:// | ||
+ | Hands-on R Lecture for Makino Lab | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | http:// | ||
+ | 2019-02-23 | ||
+ | ggplot2覚書⑤ 体裁(theme、テキストgeom)に関しての大枠 | ||
+ | |||
+ | https:// | ||
+ | ggplot2 — きれいなグラフを簡単に合理的に | ||
+ | →基本的にはこちらを見れば、、、 | ||
+ | |||
+ | |||
+ | |||
行 209: | 行 313: | ||
https:// | https:// | ||
Cannot install R packages in Jupyter Notebook | Cannot install R packages in Jupyter Notebook | ||
+ | |||
+ | https:// | ||
+ | 行の選択 - filter関数 | ||
+ | |||
+ | ===== Rでt検定に関するリンク ===== | ||
+ | https:// | ||
+ | t 検定 | ||
+ | |||
+ | https:// | ||
+ | Rでt検定行う方法とそのまま使える自作関数 | ||
+ | 2018/01/03 | ||
+ | |||
+ | http:// | ||
+ | 65. 二標本検定 | ||
+ | |||
+ | https:// | ||
+ | Rによるスチューデントのt検定 | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
行 216: | 行 345: | ||
前:[[00.初めての医療統計rとezr: | 前:[[00.初めての医療統計rとezr: | ||
- | 次: | + | 次:[[00.初めての医療統計rとezr: |
00.初めての医療統計rとezr/05.colaboratoryで自前データでrで統計.1570982539.txt.gz · 最終更新: 2019/10/13 by adash333