目次
文書の過去の版を表示しています。
ggplot2で折れ線グラフ
ggplot2は、Rでグラフを描くときに便利なパッケージです。
使い方
1. RStudioにtidyverseを インストール(ggplot2なども自動的にインストールされる) 2. library(tidyverse) 3. 元データを整然データに変換(gather関数) 4. グラフ描画のコードを記載(ggplot関数)
整然データについては、以下のサイトの解説が非常にわかりやすいです。
開発環境
Windows 8.1 Pro (64-bit)
R Studio 1.1.383
1.ExcelデータからR読み込み用csvファイルの作成
エクセルに書き込んでいくのですが、1行目にIDや年齢、糖尿病DMの有無などの項目を並べていき、2行目からは各症例の生データを打ち込んでいきます。できれば、項目もデータも『半角英数字』が望ましいです。もし欠損データがある場合は、『NA』と入力します。
今回は、以下のようなデータを用意します。糖尿病の7症例の3ヶ月間のHbA1c[%]の推移のデータだとします。
ID | age | sex | DM | HbA1c00M | HbA1c01M | HbA1c02M | HbA1c03M |
---|---|---|---|---|---|---|---|
00001 | 56 | M | 1 | 7.3 | 7.4 | 7.3 | 7.4 |
00002 | 77 | F | 1 | 8.3 | 8.4 | 8.3 | 8.2 |
00003 | 68 | M | 1 | 7.1 | 7.0 | 7.0 | 7.0 |
00004 | 81 | F | 1 | 7.6 | 7.4 | 7.3 | 7.4 |
00005 | 42 | M | 1 | 10.1 | 8.4 | 7.3 | 6.5 |
00006 | 65 | M | 1 | 6.1 | 6.2 | 6.2 | 6.3 |
00007 | 68 | F | 1 | 7.8 | 7.4 | 7.9 | 8.4 |
エクセルの画面では以下のようになります。
上記のエクセルファイルは、以下からダウンロードできます。
ファイル > 名前をつけて保存 > CSV(コンマ区切り)(*.csv) で、“保存”をクリック。
この、book2.csvというファイルを、C:/r/R_data/ 下にコピーしておく。(R Notebookでファイルを簡単に指定できるように。)
2.csvファイルの読み込み
R Studioの画面で、“File” > “New File” > “R Notebook” をクリック。
下のような画面になる
チャンクの部分(灰色の部分)に、以下のように記載。
x <- read.csv("book2.csv") x
チャンクの右側の三角ボタンをクリックして、チャンク内のコードを実行。
以下のようになる。
3.元データを整然データに変換(gather関数)
R Studioの画面で、画面右上の方の、“Insert” > “R” で、新しいチャンク(灰色の部分)が挿入されるので、そちらに、以下のコードを記載。
x <- read.csv("book2.csv") summary(x)
作成中
4. グラフ描画のコードを記載(ggplot関数)
作成中
参考文献
2016-08-22
ggplot2を使って、折れ線グラフを作る-1
http://mukkujohn.hatenablog.com/entry/2016/08/22/215632
グラフ描画ggplot2の辞書的まとめ20のコード
https://mrunadon.github.io/ggplot2/
論文用の棒グラフと折れ線グラフをggplot2で描く
https://mrunadon.github.io/ThesisPlot/
R言語でデータの並べ替え
http://webbeginner.hatenablog.com/entry/2015/06/02/015010
→reshape2パッケージのmelt関数
reshape2
http://qh73xebitbucketorg.readthedocs.io/ja/latest/1.Programmings/r/library/reshape2/main/
整然データ“tidy data”とは何か?
http://id.fnshr.info/2017/01/09/tidy-data-intro/
『グラフ作成用のパッケージであるggplot2は、整然データを入力として受け付ける』
@wakuteka
2016年12月05日に更新
tidyr::gather( )とtidyr::spread( )でデータフレームを自在に変形する
https://qiita.com/wakuteka/items/a16783571794f12af2ac
2017年現在、ggplot2を用いる際には、
library(tidyverse) library(ggplot2)
してから、tidyrパッケージのgather()関数を用いると良さそうです。(最初はこんなことを言われても訳わかんないと思いますので、具体例で解説させていただきたいと思います。)
参考文献2
ggplot2の使い方については、ggplot2の作者が著者の以下の本が非常にお勧めです。
<html>
<iframe style=“width:120px;height:240px;” marginwidth=“0” marginheight=“0” scrolling=“no” frameborder=“0” src=“rcm-fe.amazon-adsystem.com/e/cm?lt1=_blank&bc1=000000&IS2=1&bg1=FFFFFF&fc1=000000&lc1=0000FF&t=twosquirrel-22&o=9&p=8&l=as4&m=amazon&f=ifr&ref=as_ss_li_til&asins=487311814X&linkId=26063d4041294b5aa9b961f0c1c4e172”></iframe>
</html>
===== リンク =====
次:
ggplot2で折れ線グラフ
前:
RNotebookで折れ線グラフ
初めての医療統計 目次