===== Excelでデータを保存するときの注意点 =====
前回の[[Excelで折れ線グラフと誤差]]では、体重の時系列データの平均と標準偏差を計算し、標準偏差つきの折れ線グラフを作成しました。今回は、カルテ調べを行い、エクセルに生データを保存するときの筆者のお勧めの方法を記載させていただきます。
結論は、以下のようになります。
1. 1行目に、一番左から項目を羅列する。
2. 1行目は空欄は作らない。
3. 1行目の項目は半角英字で始まり、2文字目以降は半角英数字またはピリオドのみ。
4. 2行目以降は、1行につき、1症例のデータを記載する。
5. 2行目以降でデータが無いセルは『NA』と記載する。
1.2.4は譲れない点です。3.5は、後日、t検定などをおこなうために統計ソフトEZRやRを利用するための準備です。エクセルのみ使用する場合は必須ではありません。
==== 環境 ====
Windows 8.1 Pro\\
Microsoft Excel 2013
==== 1.データの記載方法 ====
エクセルに書き込んでいくのですが、1行目にIDや年齢、糖尿病DMの有無などの項目を並べていき、2行目からは各症例の生データを打ち込んでいきます。できれば、項目もデータも『半角英数字』が望ましいです。もし欠損データがある場合は、『NA』と入力します。
以下に例を記載します。糖尿病の7症例の3ヶ月間のHbA1c[%]の推移のデータだとします。
^ ID ^ age ^ sex ^ DM ^ HbA1c00M ^ HbA1c01M ^ HbA1c02M ^ HbA1c03M ^
| 00001 | 56 | M | 1 | 7.3 | 7.4 | 7.3 | 7.4 |
| 00002 | 77 | F | 1 | 8.3 | 8.4 | 8.3 | 8.2 |
| 00003 | 68 | M | 1 | 7.1 | NA | 7.0 | 7.0 |
| 00004 | 81 | F | 1 | 7.6 | 7.4 | 7.3 | 7.4 |
| 00005 | 42 | M | 1 | 10.1 | 8.4 | 7.3 | 6.5 |
| 00006 | 65 | M | 1 | 6.1 | 6.2 | NA | 6.3 |
| 00007 | 68 | F | 1 | 7.8 | 7.4 | 7.9 | 8.4 |
エクセルの画面では以下のようになります。
上記のエクセルファイルは、以下からダウンロードできます。
(作成中)
===== 参考文献 =====
Excelでエラーバー付きグラフを作成する\\
http://www.isc.chubu.ac.jp/tsuzuki/k16/w5/errorbar-e.html
excelで各プロットごとに異なる値の標準偏差をつける方法を教えてください。\\
https://m.chiebukuro.yahoo.co.jp/detail/q14116575309
整然データとは何か\\
http://id.fnshr.info/2017/01/09/tidy-data-intro/
===== リンク =====
次:[[Excelで$マークの使い方]]
[[初めての医療統計:index.html|初めての医療統計 目次]]
前:[[Excelで折れ線グラフと誤差]]