====== 04.GoogleColaboratoryでRプログラミング ======
---//2019/10/10 更新//
[[00.初めての医療統計rとezr:index.html|初めての医療統計RとEZRトップページ]]
前回は、[[00.初めての医療統計rとezr:03.excelでcsv出力|03.Excelでcsv形式でデータを保存]]で、Rで自作データを読み込むための準備を行いました。
今回は、[[https://colab.research.google.com/|GoogleColaboratory]]を用いて、オンライン上でRプログラミングを行い、[[[[00.初めての医療統計rとezr:03.excelでcsv出力|03.Excelでcsv形式でデータを保存]]のcsvデータを読み込んで、平均値や最大値などを計算してみたいと思います。
===== 流れ =====
(1)https://colab.research.google.com/drive/17wdl8HaRrjCQpdRC3Sg9KAqH2DQNLryr
を、名前をつけて保存。(Rが使用できる設定になっている。)
(2)Rでプログラミング(tidyverseはあらかじめ入っている)
(3)以下のサイトで、Googleドライブ経由でipynbファイルをhtmlファイルに変換(googleログインが必要)
https://htmtopdf.herokuapp.com/ipynbviewer/
===== 参考:tibbleとtribble =====
# tibble, tribbleについては以下のページを参考に
# https://opur.club/textbook/2018-2-2/#tibble
library(tidyverse)
d <- tribble(
~ID,~age,~sex,~DM,~HbA1c00M,~HbA1c01M,~HbA1c02M,~HbA1c03M,
1,56,"M",1,7.3,7.4,7.3,7.4,
2,77,"F",1,8.3,8.4,8.3,8.2,
3,68,"M",1,7.1,7,7,7,
4,81,"F",1,7.6,7.4,7.3,7.4,
5,42,"M",1,10.1,8.4,7.3,6.5,
6,65,"M",1,6.1,6.2,6.2,6.3,
7,68,"F",1,7.8,7.4,7.9,8.4
)
d
csvファイルの読み込み
# データの取り込み
library(tidyverse)
d <- read_csv("book2.csv")
d
===== ソースコード =====
https://colab.research.google.com/drive/1tbREJ52ZgSwaVCsGT1SSfUHMO-3xh06O
===== 開発環境 =====
Windows10 Pro (1803) (OSは何でもよいです)
Chrome
Googleアカウント
===== GoogleColaboratoryでRプログラミングを行うようにする方法の大まかな流れ =====
<方法1> ← 最もお勧めです
以下のテンプレートへ行き、Googleログインして、『ファイル』>『ドライブにコピーを保存』を順にクリックすると、自分のipynbファイルとして、そのままRを利用することができます。
https://colab.research.google.com/drive/1Wbt_tHd9KFEEszzXchwuFrhyCNR_KgtC
{{:00.初めての医療統計rとezr:pasted:20191013-165744.png}}
<方法2>
流れとしては、
-GoogleColaboratoryで『PYTHON3の新しいノートブック』を作成
-GoogleDriveで上記ipynbファイルを『Text Editor for Drive』で開き、''%%"kernelspec":{"name":"ir","display_name":"R"}%%''に変更
-GoogleColaboratoryで再度、上記ipynbファイルを開く
となります。以下に、詳しく説明していきたいと思います。
===== GoogleColaboratoryで新規ipynbファイルを作成 =====
Googleアカウントが無ければ作成してください(無料)。
[[https://colab.research.google.com/|GoogleColaboratory]]へ行き、Googleアカウントでログインします。
{{:00.初めての医療統計rとezr:pasted:20191012-061611.png}}
上記のような画面になるので、『PYTHON3の新しいノートブック』をクリックします。
すると、以下のようになるので、画面左上の、『Untitled0.ipynb』をクリックして、
{{:00.初めての医療統計rとezr:pasted:20191012-061729.png}}
191012_001.ipynb に変更します。
{{:00.初めての医療統計rとezr:pasted:20191012-061825.png}}
===== Googleドライブで『Text Editor for Drive』をインストール =====
Googleドライブ経由でipynbファイルの中身を変更するために、『Text Editor for Drive』をインストールします。
[[https://drive.google.com/drive/my-drive|Googleドライブ]]にログインして、自動的に作成される『Colab Notebooks』フォルダを開きます。
{{:00.初めての医療統計rとezr:pasted:20191012-062044.png}}
先ほどの 191002_001.ipynb を右クリックして、『アプリで開く』>『アプリを追加』をクリックします。
{{:00.初めての医療統計rとezr:pasted:20191013-061225.png}}
{{:00.初めての医療統計rとezr:pasted:20191013-061313.png}}
『Text Editor for Drive』をクリックします。
{{:00.初めての医療統計rとezr:pasted:20191013-061356.png}}
『接続』をクリック。
{{:00.初めての医療統計rとezr:pasted:20191013-061456.png}}
『OK』をクリック。
{{:00.初めての医療統計rとezr:pasted:20191013-061530.png}}
タブの右上の『×』をクリックしてタブを閉じます。
{{:00.初めての医療統計rとezr:pasted:20191013-061610.png}}
191002_001.ipynb を右クリックして、『アプリで開く』>『Text Editor for Drive』をクリック
{{:00.初めての医療統計rとezr:pasted:20191013-061737.png}}
『Login & Anthorize』をクリックして、案内に従って『許可』します。
{{:00.初めての医療統計rとezr:pasted:20191013-061837.png}}
{{:00.初めての医療統計rとezr:pasted:20191013-061943.png}}
{{:00.初めての医療統計rとezr:pasted:20191013-062027.png}}
すると、以下のような画面になります。
{{:00.初めての医療統計rとezr:pasted:20191013-062131.png}}
===== ipynbファイルをテキストエディタ『Text Editor for Drive』で編集してRを使用できるようにする =====
この時点で、191002_001.ipynb を『Text Editor for Drive』で開いた状態となっています。
{{:00.初めての医療統計rとezr:pasted:20191013-062131.png}}
"kernelspec":{"name":"python3","display_name":"Python 3"}
となっている部分を、
"kernelspec":{"name":"ir","display_name":"R"}
に変更します。
{{:00.初めての医療統計rとezr:pasted:20191013-062417.png}}
{{:00.初めての医療統計rとezr:pasted:20191013-073932.png}}
下の方へ行き、『Save』をクリックします。
{{:00.初めての医療統計rとezr:pasted:20191013-063610.png}}
{{:00.初めての医療統計rとezr:pasted:20191013-063640.png}}
{{:00.初めての医療統計rとezr:pasted:20191013-063701.png}}
{{:00.初めての医療統計rとezr:pasted:20191013-063724.png}}
画面左下の方が、Save Completed になったことを確認してから、『×』をクリックして、タブを閉じて、191002_001.ipynb の編集を終了します。
{{:00.初めての医療統計rとezr:pasted:20191013-063819.png}}
すると、以下のような画面になります。
{{:00.初めての医療統計rとezr:pasted:20191013-062607.png}}
===== 変更したipynbファイルでRを実行してみる =====
変更後のipynbファイルをGoogleColaboratory上で再度開きます。
191002_001.ipynb を右クリックして、『アプリで開く』>『Google Colaboratory』の順にクリックします。
{{:00.初めての医療統計rとezr:pasted:20191013-062745.png}}
すると、以下のような画面になります。この状態で、Rが使用できるようになっています。
{{:00.初めての医療統計rとezr:pasted:20191013-063909.png}}
試しに、以下を入力して、Shift+Enterで、実行してみます。
Rに標準で入っているirisデータを用いて表示してみます。
library(tidyverse)
iris %>% head
{{:00.初めての医療統計rとezr:pasted:20191013-063956.png}}
str(iris)
{{:00.初めての医療統計rとezr:pasted:20191013-075904.png}}
以下のコードを入力して、グラフを描いてみます。
# ggplotのキャンバスを作成
# ggplot()関数の第1引数はdata、第2引数はmappingとなる
# aesにcolor = Speciesを追加
p_3 <- ggplot(iris, aes(x = Sepal.Length, y = Petal.Length, color = Species)) +
geom_point()
# 出力
p_3
{{:00.初めての医療統計rとezr:pasted:20191013-073751.png}}
===== ソースコード =====
https://colab.research.google.com/drive/1tbREJ52ZgSwaVCsGT1SSfUHMO-3xh06O
===== Rに関するリンク =====
https://qiita.com/wakuteka/items/95ac758070f6f4d89a96
@wakuteka
2016年12月26日に更新
R言語 標準データセットの私的まとめ
https://kazutan.github.io/fukuokaR11/intro_ggplot2.html
ggplot2による可視化入門
kazutan
2018/9/15
===== GoogleColaboratoryに関するリンク =====
https://qiita.com/shoji9x9/items/0ff0f6f603df18d631ab
@shoji9x9
2019年06月09日に更新
Google Colabの使い方まとめ
https://www.codexa.net/how-to-use-google-colaboratory/
Google Colabの知っておくべき使い方 – Google Colaboratoryのメリット・デメリットや基本操作のまとめ
2018.03.30
by codexaチーム
https://ntk-lab.com/google_colab/
5分で分かるGoogle Colaboratoryの使い方
2018.10.26
https://qiita.com/kaito_takahashi/items/a5a785a5bebe030cbe2b
@kaito_takahashi
2019年04月09日に投稿
【初心者向け】Google Colaboratoryの使い方
===== リンク =====
目次:[[00.初めての医療統計rとezr:index.html|初めての医療統計RとEZR]]
前:[[00.初めての医療統計rとezr:03.excelでcsv出力|03.Excelでcsv形式でデータを保存]]
次:[[00.初めての医療統計rとezr:05.colaboratoryで自前データでrで統計|05.Google Colaboratoryで自前データでRで統計]]