サルでもわかるWEBプログラミング

フリーソフトのみでホームページ作成

ユーザ用ツール

サイト用ツール


00.初めての医療統計rとezr:05.colaboratoryで自前データでrで統計


差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
00.初めての医療統計rとezr:05.colaboratoryで自前データでrで統計 [2019/10/13] – [Rに関するリンク] adash33300.初めての医療統計rとezr:05.colaboratoryで自前データでrで統計 [2022/03/23] (現在) – [自前データの用意] adash333
行 10: 行 10:
  
 今回は、自前のエクセルデータをGoogleColaboratory上にアップロードして、Rで統計解析を行いたいたいと思います。 今回は、自前のエクセルデータをGoogleColaboratory上にアップロードして、Rで統計解析を行いたいたいと思います。
 +
 +===== エンコードの注意点 UTF8とShiftJIS =====
 +https://shohei-doi.github.io/quant_polisci/encoding-r.html
 +第23章 Rのエンコーディング問題
 +
 +Windowsでエクセルをcsvで保存すると、基本的には Shift-JISでエンコードされる。→MacやColaboratoryで開くと文字化けする
 +
 +Windowsでエクセルをcsv(UTF-8形式)で保存すると、MacやColaboratoryで開くことができるが、WindowsのRStudioで開くと文字化けする
 +===== ソースコード =====
 +https://colab.research.google.com/drive/19s5TIPgizVJp5LjFBEpADmMUYgy_nPMQ
  
 ===== 開発環境 ===== ===== 開発環境 =====
行 22: 行 32:
  
 {{ :00.初めての医療統計rとezr:book1.xlsx |}} (←クリックでダウンロードできます。) {{ :00.初めての医療統計rとezr:book1.xlsx |}} (←クリックでダウンロードできます。)
 +
 +{{ :00.初めての医療統計rとezr:book2.xlsx |}}
  
 {{:00.初めての医療統計rとezr:pasted:20191013-075653.png}} {{:00.初めての医療統計rとezr:pasted:20191013-075653.png}}
行 160: 行 172:
  
  
-===== ggplot2()関数でグラフを表示してみる =====+===== ggplot()関数でグラフを表示してみる ===== 
 + 
 +DMの有無(0と1)で、BMIの棒グラフ(平均meanと標準偏差sdを計算)を描いてみます。 
 + 
 +<code> 
 +# convert関数を用いるためにhablarパッケージをインストール 
 +install.packages("hablar"
 + 
 +# hablarパッケージの使用を宣言 
 +library("hablar"
 +# convert関数を用いて、d2のDM列のデータ型をfactorに変更 
 +d2 %>%  
 +  convert(fct(DM)) 
 +</code> 
 + 
 +{{:00.初めての医療統計rとezr:pasted:20191013-160958.png}} 
 + 
 +ggplot()関数を用いて棒グラフを描画します。 
 + 
 +<code> 
 +# ggplot()関数を用いる 
 +# geom_bar()でstat="identity"とする必要あり 
 +g <- ggplot(d3, aes(x=DM, y=mean)) + 
 +  geom_bar(stat="identity")+ 
 +  geom_errorbar(aes(ymin = mean - sd, ymax = mean + sd, width = 0.3)) 
 +
 +</code> 
 + 
 +{{:00.初めての医療統計rとezr:pasted:20191013-161339.png}} 
 + 
 +===== t検定を行う ===== 
 +DM(糖尿病)の有無で、BMIに差があるかt検定してみます。(t検定できるかどうかは、今回は気にしないことにします。) 
 + 
 +まず、DM_ari と、DM_nasiの数列(ベクトル?tibble?)を計算します。 
 +<code> 
 +DM_ari <- filter(data_xlsx, DM == "1")$BMI 
 +DM_ari 
 + 
 +DM_nasi <- filter(data_xlsx, DM == "0")$BMI 
 +DM_nasi 
 +</code> 
 + 
 +その後、DM_ariとDM_nasiでt検定を行います。 
 +<code> 
 +t.ans1 <- t.test(DM_ari, DM_nasi, var=T) 
 +t.ans1 
 +</code> 
 + 
 +{{:00.初めての医療統計rとezr:pasted:20191013-162449.png}} 
 + 
 +p-value = 0.05792 (> 0.05 ) なので、「DMの有無で、BMIに有意差があるとは言えない。」という結論になります。 
 + 
 +===== 結果をipynbファイルでダウンロードして、自分のパソコンでhtmlに変換する(要Anaconda) ===== 
 +自分のパソコン(オフライン)に結果を保存しておきたい場合は、ipynbファイルをダウンロードして、htmlに変換しておきます。 
 +https://www.it-swarm.dev/ja/python/google-colaboratory-notebook%E3%82%92html%E3%81%AB%E4%BF%9D%E5%AD%98%E3%81%99%E3%82%8B%E3%81%93%E3%81%A8%E3%81%AF%E3%81%A7%E3%81%8D%E3%81%BE%E3%81%99%E3%81%8B%EF%BC%9F/808152667/ 
 + 
 + 
 +  -Anacondaを自分のパソコンにインストール 
 +  -Anaconda promptで、conda install nbconvert でnbconvertをインストール 
 +  -次を入力 
 +<code> 
 +jupyter nbconvert --to html xxxxxxxx.ipynb 
 +</code> 
 + 
 +{{:00.初めての医療統計rとezr:pasted:20200806-220830.png}} 
 + 
 + 
 + 
 +===== ソースコード ===== 
 +https://colab.research.google.com/drive/19s5TIPgizVJp5LjFBEpADmMUYgy_nPMQ 
 + 
 +===== Rでグラフを描くためのggplot2パッケージ ===== 
 +Rでグラフをかくなら、必須のパッケージといってよいと思います。 
 + 
 +まず最初に、以下のリンク先の4つのスライドをご覧ください。素晴らしいです。 
 + 
 +https://heavywatal.github.io/slides/makino2019r/ 
 +Hands-on R Lecture for Makino Lab 
 + 
 + 
 + 
 + 
 +http://knknkn.hatenablog.com/entry/2019/02/23/181311 
 +2019-02-23 
 +ggplot2覚書⑤ 体裁(theme、テキストgeom)に関しての大枠 
 + 
 +https://heavywatal.github.io/rstats/ggplot2.html 
 +ggplot2 — きれいなグラフを簡単に合理的に 
 +→基本的にはこちらを見れば、、、 
 + 
 + 
 + 
  
  
行 201: 行 305:
 How to convert factor data to numeric for all dataset How to convert factor data to numeric for all dataset
 2018-11-05 2018-11-05
 +
 +https://cran.r-project.org/web/packages/hablar/vignettes/convert.html
 +A grammer for data type conversion
 +https://cran.r-project.org/web/packages/hablar/index.html
 +hablar: Non-Astonishing Results in R
 +
 +https://stackoverflow.com/questions/42459423/cannot-install-r-packages-in-jupyter-notebook
 +Cannot install R packages in Jupyter Notebook
 +
 +https://kazutan.github.io/kazutanR/hands_on_170730/filter.html
 +行の選択 - filter関数
 +
 +===== Rでt検定に関するリンク =====
 +https://oku.edu.mie-u.ac.jp/~okumura/stat/ttest.html
 +t 検定
 +
 +https://to-kei.net/r-beginner/r-9-t-test/
 +Rでt検定行う方法とそのまま使える自作関数
 +2018/01/03
 +
 +http://cse.naro.affrc.go.jp/takezawa/r-tips/r/65.html
 +65. 二標本検定
 +
 +https://data-science.gr.jp/implementation/ist_r_student_t_test.html
 +Rによるスチューデントのt検定
 +
 +
 +
 +
  
  
行 212: 行 345:
 前:[[00.初めての医療統計rとezr:04.googlecolaboratoryでrプログラミング|04.GoogleColaboratoryでRプログラミング]] 前:[[00.初めての医療統計rとezr:04.googlecolaboratoryでrプログラミング|04.GoogleColaboratoryでRプログラミング]]
  
-次: +次:[[00.初めての医療統計rとezr:06.colaboratoryでrで折れ線グラフ|06.Google Colaboratoryで時系列データで折れ線グラフを描画]]


00.初めての医療統計rとezr/05.colaboratoryで自前データでrで統計.1570979828.txt.gz · 最終更新: 2019/10/13 by adash333

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki