====== 04.GoogleColaboratoryでRプログラミング ====== ---//2019/10/10 更新// [[00.初めての医療統計rとezr:index.html|初めての医療統計RとEZRトップページ]] 前回は、[[00.初めての医療統計rとezr:03.excelでcsv出力|03.Excelでcsv形式でデータを保存]]で、Rで自作データを読み込むための準備を行いました。 今回は、[[https://colab.research.google.com/|GoogleColaboratory]]を用いて、オンライン上でRプログラミングを行い、[[[[00.初めての医療統計rとezr:03.excelでcsv出力|03.Excelでcsv形式でデータを保存]]のcsvデータを読み込んで、平均値や最大値などを計算してみたいと思います。 ===== 流れ ===== (1)https://colab.research.google.com/drive/17wdl8HaRrjCQpdRC3Sg9KAqH2DQNLryr を、名前をつけて保存。(Rが使用できる設定になっている。) (2)Rでプログラミング(tidyverseはあらかじめ入っている) (3)以下のサイトで、Googleドライブ経由でipynbファイルをhtmlファイルに変換(googleログインが必要) https://htmtopdf.herokuapp.com/ipynbviewer/ ===== 参考:tibbleとtribble ===== # tibble, tribbleについては以下のページを参考に # https://opur.club/textbook/2018-2-2/#tibble library(tidyverse) d <- tribble( ~ID,~age,~sex,~DM,~HbA1c00M,~HbA1c01M,~HbA1c02M,~HbA1c03M, 1,56,"M",1,7.3,7.4,7.3,7.4, 2,77,"F",1,8.3,8.4,8.3,8.2, 3,68,"M",1,7.1,7,7,7, 4,81,"F",1,7.6,7.4,7.3,7.4, 5,42,"M",1,10.1,8.4,7.3,6.5, 6,65,"M",1,6.1,6.2,6.2,6.3, 7,68,"F",1,7.8,7.4,7.9,8.4 ) d csvファイルの読み込み # データの取り込み library(tidyverse) d <- read_csv("book2.csv") d ===== ソースコード ===== https://colab.research.google.com/drive/1tbREJ52ZgSwaVCsGT1SSfUHMO-3xh06O ===== 開発環境 ===== Windows10 Pro (1803) (OSは何でもよいです) Chrome Googleアカウント ===== GoogleColaboratoryでRプログラミングを行うようにする方法の大まかな流れ ===== <方法1> ← 最もお勧めです 以下のテンプレートへ行き、Googleログインして、『ファイル』>『ドライブにコピーを保存』を順にクリックすると、自分のipynbファイルとして、そのままRを利用することができます。 https://colab.research.google.com/drive/1Wbt_tHd9KFEEszzXchwuFrhyCNR_KgtC {{:00.初めての医療統計rとezr:pasted:20191013-165744.png}} <方法2> 流れとしては、 -GoogleColaboratoryで『PYTHON3の新しいノートブック』を作成 -GoogleDriveで上記ipynbファイルを『Text Editor for Drive』で開き、''%%"kernelspec":{"name":"ir","display_name":"R"}%%''に変更 -GoogleColaboratoryで再度、上記ipynbファイルを開く となります。以下に、詳しく説明していきたいと思います。 ===== GoogleColaboratoryで新規ipynbファイルを作成 ===== Googleアカウントが無ければ作成してください(無料)。 [[https://colab.research.google.com/|GoogleColaboratory]]へ行き、Googleアカウントでログインします。 {{:00.初めての医療統計rとezr:pasted:20191012-061611.png}} 上記のような画面になるので、『PYTHON3の新しいノートブック』をクリックします。 すると、以下のようになるので、画面左上の、『Untitled0.ipynb』をクリックして、 {{:00.初めての医療統計rとezr:pasted:20191012-061729.png}} 191012_001.ipynb に変更します。 {{:00.初めての医療統計rとezr:pasted:20191012-061825.png}} ===== Googleドライブで『Text Editor for Drive』をインストール ===== Googleドライブ経由でipynbファイルの中身を変更するために、『Text Editor for Drive』をインストールします。 [[https://drive.google.com/drive/my-drive|Googleドライブ]]にログインして、自動的に作成される『Colab Notebooks』フォルダを開きます。 {{:00.初めての医療統計rとezr:pasted:20191012-062044.png}} 先ほどの 191002_001.ipynb を右クリックして、『アプリで開く』>『アプリを追加』をクリックします。 {{:00.初めての医療統計rとezr:pasted:20191013-061225.png}} {{:00.初めての医療統計rとezr:pasted:20191013-061313.png}} 『Text Editor for Drive』をクリックします。 {{:00.初めての医療統計rとezr:pasted:20191013-061356.png}} 『接続』をクリック。 {{:00.初めての医療統計rとezr:pasted:20191013-061456.png}} 『OK』をクリック。 {{:00.初めての医療統計rとezr:pasted:20191013-061530.png}} タブの右上の『×』をクリックしてタブを閉じます。 {{:00.初めての医療統計rとezr:pasted:20191013-061610.png}} 191002_001.ipynb を右クリックして、『アプリで開く』>『Text Editor for Drive』をクリック {{:00.初めての医療統計rとezr:pasted:20191013-061737.png}} 『Login & Anthorize』をクリックして、案内に従って『許可』します。 {{:00.初めての医療統計rとezr:pasted:20191013-061837.png}} {{:00.初めての医療統計rとezr:pasted:20191013-061943.png}} {{:00.初めての医療統計rとezr:pasted:20191013-062027.png}} すると、以下のような画面になります。 {{:00.初めての医療統計rとezr:pasted:20191013-062131.png}} ===== ipynbファイルをテキストエディタ『Text Editor for Drive』で編集してRを使用できるようにする ===== この時点で、191002_001.ipynb を『Text Editor for Drive』で開いた状態となっています。 {{:00.初めての医療統計rとezr:pasted:20191013-062131.png}} "kernelspec":{"name":"python3","display_name":"Python 3"} となっている部分を、 "kernelspec":{"name":"ir","display_name":"R"} に変更します。 {{:00.初めての医療統計rとezr:pasted:20191013-062417.png}} {{:00.初めての医療統計rとezr:pasted:20191013-073932.png}} 下の方へ行き、『Save』をクリックします。 {{:00.初めての医療統計rとezr:pasted:20191013-063610.png}} {{:00.初めての医療統計rとezr:pasted:20191013-063640.png}} {{:00.初めての医療統計rとezr:pasted:20191013-063701.png}} {{:00.初めての医療統計rとezr:pasted:20191013-063724.png}} 画面左下の方が、Save Completed になったことを確認してから、『×』をクリックして、タブを閉じて、191002_001.ipynb の編集を終了します。 {{:00.初めての医療統計rとezr:pasted:20191013-063819.png}} すると、以下のような画面になります。 {{:00.初めての医療統計rとezr:pasted:20191013-062607.png}} ===== 変更したipynbファイルでRを実行してみる ===== 変更後のipynbファイルをGoogleColaboratory上で再度開きます。 191002_001.ipynb を右クリックして、『アプリで開く』>『Google Colaboratory』の順にクリックします。 {{:00.初めての医療統計rとezr:pasted:20191013-062745.png}} すると、以下のような画面になります。この状態で、Rが使用できるようになっています。 {{:00.初めての医療統計rとezr:pasted:20191013-063909.png}} 試しに、以下を入力して、Shift+Enterで、実行してみます。 Rに標準で入っているirisデータを用いて表示してみます。 library(tidyverse) iris %>% head {{:00.初めての医療統計rとezr:pasted:20191013-063956.png}} str(iris) {{:00.初めての医療統計rとezr:pasted:20191013-075904.png}} 以下のコードを入力して、グラフを描いてみます。 # ggplotのキャンバスを作成 # ggplot()関数の第1引数はdata、第2引数はmappingとなる # aesにcolor = Speciesを追加 p_3 <- ggplot(iris, aes(x = Sepal.Length, y = Petal.Length, color = Species)) + geom_point() # 出力 p_3 {{:00.初めての医療統計rとezr:pasted:20191013-073751.png}} ===== ソースコード ===== https://colab.research.google.com/drive/1tbREJ52ZgSwaVCsGT1SSfUHMO-3xh06O ===== Rに関するリンク ===== https://qiita.com/wakuteka/items/95ac758070f6f4d89a96 @wakuteka 2016年12月26日に更新 R言語 標準データセットの私的まとめ https://kazutan.github.io/fukuokaR11/intro_ggplot2.html ggplot2による可視化入門 kazutan 2018/9/15 ===== GoogleColaboratoryに関するリンク ===== https://qiita.com/shoji9x9/items/0ff0f6f603df18d631ab @shoji9x9 2019年06月09日に更新 Google Colabの使い方まとめ https://www.codexa.net/how-to-use-google-colaboratory/ Google Colabの知っておくべき使い方 – Google Colaboratoryのメリット・デメリットや基本操作のまとめ 2018.03.30 by codexaチーム https://ntk-lab.com/google_colab/ 5分で分かるGoogle Colaboratoryの使い方 2018.10.26 https://qiita.com/kaito_takahashi/items/a5a785a5bebe030cbe2b @kaito_takahashi 2019年04月09日に投稿 【初心者向け】Google Colaboratoryの使い方 ===== リンク ===== 目次:[[00.初めての医療統計rとezr:index.html|初めての医療統計RとEZR]] 前:[[00.初めての医療統計rとezr:03.excelでcsv出力|03.Excelでcsv形式でデータを保存]] 次:[[00.初めての医療統計rとezr:05.colaboratoryで自前データでrで統計|05.Google Colaboratoryで自前データでRで統計]]