「Rではじめるデータサイエンス」を写経(1)ggplot2
以下の本を衝動買い、、、
ggplot2を作った人が著者らしい!
ちなみに、英語の本文は、以下のサイトで読むことができるらしい。
まだ第1章を流し読みしただけですが、論文の図をかくのには、有用そうな本でした。
ちなみに、練習問題の解答例が、以下のサイトに掲載されています。
Exercise Solutions and Notes for “R for Data Science”
Jeffrey B. Arnold
https://jrnold.github.io/e4qf/
(環境)
Windows 8.1 Pro
R Studio 1.1.383
(1)tidyvereseパッケージのインストール
File > New File > R Notebook で、新規R Notebookを作成し、171215_ggplot2_007 という名前で保存。
画面右下の、「Packages」をクリック
「Install」をクリック
”Installl Packages”ウィンドウが現れるので、"tidyverse"と入力して、”Install”をクリック
“Yes"をクリック
1分くらいで、"tidyverse"その他のインストールが終わる。
tidyverseパッケージを用いる場合は、
library(tidyverse)
と記載する必要がある。
(2)mpgデータフレーム
ggplot2のmpgデータフレーム
mpg
displ 車のエンジンのサイズ、リットル単位
hwy 高速道路走行時の燃費、xマイル/1ガロン(mpg)
ggplotを作る
Hide
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy))
このプロットにより、エンジンサイズ(displ)と、燃費(hwy)は負の相関を示す。
ggplot() 座標平面を作成
geom_point() 散布図を作成
グラフ作成テンプレート
ggplot(data = <DATA>) +
<GEOM_FUNCTION>(mapping = aed(<MAPPINGS>))
練習問題
Hide
library(tidyverse)
ggplot(data = mpg)
Hide
library(tidyverse)
mtcars
nrow(mtcars)
[1] 32
Hide
ncol(mtcars)
[1] 11
Hide
?mpg
drv
f = front-wheel drive, r = rear wheel drive, 4 = 4wd
つまり、drvは駆動を表す。
hwyとcyl(number of cylinders)の散布図
Hide
library(tidyverse)
ggplot(data = mpg) +
geom_point(mapping = aes(x = cyl, y = hwy))
class vs drvの散布図
Hide
library(tidyverse)
ggplot(data = mpg) +
geom_point(mapping = aes(x = class, y = drv))
なぜプロットが役に立たないのかは、、、drvの選択肢?が数値ではなく、順序もないから?
いや、classの選択肢?も数値でもなく、順序もない。
答えは分からず。
エステティックマッピング
Hide
library(tidyverse)
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy, color = class))
library(tidyverse)
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy, size = class))
library(tidyverse)
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy, alpha = class))
library(tidyverse)
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy), color = "blue")
とりあえずここまで。
ディスカッション
コメント一覧
まだ、コメントがありません