スポンサーリンク

「Rによる統計解析」を写経してみる(1)

統計解析をしていて、「この1個のデータが間違っていたので、平均とか有意差とかの計算、最初から全部やり直し!」みたいなことは多々ある。

その都度、EZRを使って統計をやり直しているのだが、なかなか面倒なものがある。

そこで、以前触ったことはあったのだが、もう一度、Rの勉強をしてみたいと思い、以下の本を衝動買い!

ちなみに、以前、以下の本を購入しているが、全部は写経できてはいない。

 

今回の本は、上記の本より難しいらしいが、、、どうなることやら。。。ちなみに、EZRのおすすめの本は以下になります。下記の本は、統計を実際に行う方に、本当におすすめです。

最初は、EZRを用いて統計解析するのがとても分かりやすくてよい。Rで統計を行っても、最後は、EZRで答え合わせはしておきたい。

(環境)
Windows 8.1 Pro
Anaconda 4.4.0 (64-bit)

(0)環境構築

Jupyter NotebookでRを使用できるようにする。本格的にやるのなら、R Studioをインストールした方がよいと思われるが、個人的にJupyter Notebookが好きなので、こっちでやってみる。

Jupyter Notebookで、Keras2 という名前の仮想環境を構築しておいた状態で、以下のコマンドを入力。

conda install -c r r-essentials

途中で何か聞かれるので、y + Enter

image

image

jupyter notebook

として、jupyter notebookを起動。

画面右上の、New > R で、ipynbファイルを起動。

image

名前を、Chapter02 に変更して、以下のように入力して、Shift+Enter

image

hightの入力がミスしていた

image

相関係数、散布図

image

行列?

image

image

行列は、すべての列が同じデータ型を持っていなければならないとのことで、行列の要素に数値と文字列が混ざっていてはいけないらしい。

そのため、cbind ではなく、data.frame を用いて、「データフレーム」なるものを作成するらしい。

Jupyter Notebook上では、見栄えは変わらない。。。

image

2.2 データファイルを準備する。

「Rで読めるcsvファイル」

(1)行は観察対象で、列は変数

(2)1行目は変数の名前を記述

(3)欠損値は必ず、「NA」で表す

この3つは覚えておく必要がある。

エクセルで以下のようなxlsxファイルを作成後、csv形式で保存。

image

image

image

テキストエディタ(Visual Studio Code)でtest.csv を開くと以下のようになっている。

image

reac.csv関数

image

table 関数と、sapply関数で、データのチェック。

本当は、変数の設定もちゃんとできるようになっておく必要があるが、今回は割愛。

2.16 ファイルに保存する

image

こんな感じのテキストファイルが出力される

image

csv出力の方は、少し迷ったが、write.csv(df, file="new2.csv") とすればよい。

image

image

一応、ここまで。

 

 

途中

スポンサーリンク

R

Posted by twosquirrel