「Rによる統計解析」を写経してみる（１）

2017年11月18日

統計解析をしていて、「この1個のデータが間違っていたので、平均とか有意差とかの計算、最初から全部やり直し！」みたいなことは多々ある。

その都度、EZRを使って統計をやり直しているのだが、なかなか面倒なものがある。

そこで、以前触ったことはあったのだが、もう一度、Rの勉強をしてみたいと思い、以下の本を衝動買い！

ちなみに、以前、以下の本を購入しているが、全部は写経できてはいない。

今回の本は、上記の本より難しいらしいが、、、どうなることやら。。。ちなみに、EZRのおすすめの本は以下になります。下記の本は、統計を実際に行う方に、本当におすすめです。

最初は、EZRを用いて統計解析するのがとても分かりやすくてよい。Rで統計を行っても、最後は、EZRで答え合わせはしておきたい。

（環境）
Windows 8.1 Pro
Anaconda 4.4.0 (64-bit)

（０）環境構築

Jupyter NotebookでRを使用できるようにする。本格的にやるのなら、R Studioをインストールした方がよいと思われるが、個人的にJupyter Notebookが好きなので、こっちでやってみる。

Jupyter Notebookで、Keras2 という名前の仮想環境を構築しておいた状態で、以下のコマンドを入力。

conda install -c r r-essentials

途中で何か聞かれるので、y + Enter

jupyter notebook

として、jupyter notebookを起動。

画面右上の、New > R で、ipynbファイルを起動。

名前を、Chapter02　に変更して、以下のように入力して、Shift+Enter

hightの入力がミスしていた

相関係数、散布図

行列？

行列は、すべての列が同じデータ型を持っていなければならないとのことで、行列の要素に数値と文字列が混ざっていてはいけないらしい。

そのため、cbind ではなく、data.frame　を用いて、「データフレーム」なるものを作成するらしい。

Jupyter Notebook上では、見栄えは変わらない。。。

2.2　データファイルを準備する。

「Rで読めるcsvファイル」

（１）行は観察対象で、列は変数

（２）1行目は変数の名前を記述

（３）欠損値は必ず、「NA」で表す

この３つは覚えておく必要がある。

エクセルで以下のようなxlsxファイルを作成後、csv形式で保存。

テキストエディタ（Visual Studio Code）でtest.csv を開くと以下のようになっている。

reac.csv関数

table　関数と、sapply関数で、データのチェック。

本当は、変数の設定もちゃんとできるようになっておく必要があるが、今回は割愛。

2.16　ファイルに保存する

こんな感じのテキストファイルが出力される

csv出力の方は、少し迷ったが、write.csv(df, file=”new2.csv”)　とすればよい。

一応、ここまで。

途中

まだ、コメントがありません