目次

04.GoogleColaboratoryでRプログラミング

2019/10/10 更新
初めての医療統計RとEZRトップページ

前回は、03.Excelでcsv形式でデータを保存で、Rで自作データを読み込むための準備を行いました。

今回は、GoogleColaboratoryを用いて、オンライン上でRプログラミングを行い、03.Excelでcsv形式でデータを保存のcsvデータを読み込んで、平均値や最大値などを計算してみたいと思います。

流れ

(1)https://colab.research.google.com/drive/17wdl8HaRrjCQpdRC3Sg9KAqH2DQNLryr
を、名前をつけて保存。(Rが使用できる設定になっている。)

(2)Rでプログラミング(tidyverseはあらかじめ入っている)

(3)以下のサイトで、Googleドライブ経由でipynbファイルをhtmlファイルに変換(googleログインが必要)
https://htmtopdf.herokuapp.com/ipynbviewer/

参考:tibbleとtribble

# tibble, tribbleについては以下のページを参考に
# https://opur.club/textbook/2018-2-2/#tibble

library(tidyverse)
d <- tribble(
  ~ID,~age,~sex,~DM,~HbA1c00M,~HbA1c01M,~HbA1c02M,~HbA1c03M,
  1,56,"M",1,7.3,7.4,7.3,7.4,
  2,77,"F",1,8.3,8.4,8.3,8.2,
  3,68,"M",1,7.1,7,7,7,
  4,81,"F",1,7.6,7.4,7.3,7.4,
  5,42,"M",1,10.1,8.4,7.3,6.5,
  6,65,"M",1,6.1,6.2,6.2,6.3,
  7,68,"F",1,7.8,7.4,7.9,8.4
)
d

csvファイルの読み込み

# データの取り込み
library(tidyverse)
d <- read_csv("book2.csv") 
d

ソースコード

https://colab.research.google.com/drive/1tbREJ52ZgSwaVCsGT1SSfUHMO-3xh06O

開発環境

Windows10 Pro (1803) (OSは何でもよいです)
Chrome
Googleアカウント

GoogleColaboratoryでRプログラミングを行うようにする方法の大まかな流れ

<方法1> ← 最もお勧めです
以下のテンプレートへ行き、Googleログインして、『ファイル』>『ドライブにコピーを保存』を順にクリックすると、自分のipynbファイルとして、そのままRを利用することができます。

https://colab.research.google.com/drive/1Wbt_tHd9KFEEszzXchwuFrhyCNR_KgtC

<方法2>
流れとしては、

  1. GoogleColaboratoryで『PYTHON3の新しいノートブック』を作成
  2. GoogleDriveで上記ipynbファイルを『Text Editor for Drive』で開き、"kernelspec":{"name":"ir","display_name":"R"}に変更
  3. GoogleColaboratoryで再度、上記ipynbファイルを開く

となります。以下に、詳しく説明していきたいと思います。

GoogleColaboratoryで新規ipynbファイルを作成

Googleアカウントが無ければ作成してください(無料)。

GoogleColaboratoryへ行き、Googleアカウントでログインします。

上記のような画面になるので、『PYTHON3の新しいノートブック』をクリックします。

すると、以下のようになるので、画面左上の、『Untitled0.ipynb』をクリックして、

191012_001.ipynb に変更します。

Googleドライブで『Text Editor for Drive』をインストール

Googleドライブ経由でipynbファイルの中身を変更するために、『Text Editor for Drive』をインストールします。

Googleドライブにログインして、自動的に作成される『Colab Notebooks』フォルダを開きます。

先ほどの 191002_001.ipynb を右クリックして、『アプリで開く』>『アプリを追加』をクリックします。

『Text Editor for Drive』をクリックします。

『接続』をクリック。

『OK』をクリック。

タブの右上の『×』をクリックしてタブを閉じます。

191002_001.ipynb を右クリックして、『アプリで開く』>『Text Editor for Drive』をクリック

『Login & Anthorize』をクリックして、案内に従って『許可』します。

すると、以下のような画面になります。

ipynbファイルをテキストエディタ『Text Editor for Drive』で編集してRを使用できるようにする

この時点で、191002_001.ipynb を『Text Editor for Drive』で開いた状態となっています。

"kernelspec":{"name":"python3","display_name":"Python 3"}

となっている部分を、

"kernelspec":{"name":"ir","display_name":"R"}

に変更します。

下の方へ行き、『Save』をクリックします。

画面左下の方が、Save Completed になったことを確認してから、『×』をクリックして、タブを閉じて、191002_001.ipynb の編集を終了します。

すると、以下のような画面になります。

変更したipynbファイルでRを実行してみる

変更後のipynbファイルをGoogleColaboratory上で再度開きます。

191002_001.ipynb を右クリックして、『アプリで開く』>『Google Colaboratory』の順にクリックします。

すると、以下のような画面になります。この状態で、Rが使用できるようになっています。

試しに、以下を入力して、Shift+Enterで、実行してみます。

Rに標準で入っているirisデータを用いて表示してみます。

library(tidyverse)
iris %>% head

str(iris)

以下のコードを入力して、グラフを描いてみます。

# ggplotのキャンバスを作成
# ggplot()関数の第1引数はdata、第2引数はmappingとなる
# aesにcolor = Speciesを追加
p_3 <- ggplot(iris, aes(x = Sepal.Length, y = Petal.Length, color = Species)) +
  geom_point()
# 出力
p_3

ソースコード

https://colab.research.google.com/drive/1tbREJ52ZgSwaVCsGT1SSfUHMO-3xh06O

Rに関するリンク

https://qiita.com/wakuteka/items/95ac758070f6f4d89a96
@wakuteka
2016年12月26日に更新
R言語 標準データセットの私的まとめ

https://kazutan.github.io/fukuokaR11/intro_ggplot2.html
ggplot2による可視化入門
kazutan
2018/9/15

GoogleColaboratoryに関するリンク

https://qiita.com/shoji9x9/items/0ff0f6f603df18d631ab
@shoji9x9
2019年06月09日に更新
Google Colabの使い方まとめ

https://www.codexa.net/how-to-use-google-colaboratory/
Google Colabの知っておくべき使い方 – Google Colaboratoryのメリット・デメリットや基本操作のまとめ
2018.03.30
by codexaチーム

https://ntk-lab.com/google_colab/
5分で分かるGoogle Colaboratoryの使い方
2018.10.26

https://qiita.com/kaito_takahashi/items/a5a785a5bebe030cbe2b
@kaito_takahashi
2019年04月09日に投稿
【初心者向け】Google Colaboratoryの使い方

リンク

目次:初めての医療統計RとEZR

前:03.Excelでcsv形式でデータを保存

次:05.Google Colaboratoryで自前データでRで統計