2012年12月5日水曜日

Rインストール、セットアップ関連の参考情報


(cf. Rいろは http://nhkuma.blogspot.jp/p/r_5.html

##### Rとは?################
データ編集、整理、統計解析、シミュレーション、グラフ作成などが可能な、オープンソースのフリーウェアです。国内ではこの10年くらいで爆発的にユーザが増えているようで、関連書籍も豊富に出版されてます。
(cf. wikipediaのRについての記述 http://ja.wikipedia.org/wiki/R言語


##### Rのインストール #####################
Rのインストール http://www.okada.jp.org/RWiki/?R%20%A4%CE%A5%A4%A5%F3%A5%B9%A5%C8%A1%BC%A5%EB

R(32bit)、R64(64bit)のいずれを使ったらよいか?:どちらでもOK。動作するならばR64がメリットが多い。今のところR64にしても不安定感は感じたことがありません。
# Rは常に最新版にしておくことをお勧めします(私の場合、3ヶ月に一度くらい)
# 自分の使うパッケージの一覧をメモ書きしておくとよいです。
# install.packages("パッケージ名", dependencies=T) # をズラズラとリストアップしたものを一括でR画面にコピペすれば、一通りの再インストールをしてくれます。


##### 機能パッケージの追加インストール ########################
# 注:この作業は、PCがネットに繋がっている時に行いましょう。バックグラウンドで、ダウンロードしてインストールするという手順が行われています。

Rには関数を追加するためのパッケージが豊富に用意されています。
パッケージの追加方法は、こちらのページの下記の方に詳しく述べられています(http://cse.naro.affrc.go.jp/takezawa/r-tips/r/08.html)。Mac版の場合は、必ず"依存パッケージ(関連する機能)も含める"のチェックボックスをオンにした上でインストールしましょう。

追加したパッケージは、library(パッケージ名)、と入力すると呼び出すことができます。すると、単に黙って通してくれるか、あるいは「~をロードしています」など、立ち上げプロセスが表示されます。逆に、「~が見つかりません」のようなエラーが出る場合はインストールできていないということです。また、インストールしたパッケージが作られた環境よりも、ご自身のパソコンのRの方がバージョンが低い場合、「~Rのver.xxのもとで作られました」みたいなメッセージが出ます。この場合はRの最新バージョンを再インストールすることを強くお勧めします。

library(パッケージ名)で呼び出そうとしたときに、依存パッケージが足らない場合、それらのパッケージもインストールするかと聞かれるので、そうしたらそれに従っていくと使えるようになります。ちゃんとメニューからインストールしたつもりが二度手間になったりと正直面倒くさいです…。
↓もはや、メニュー操作をあきらめて、コードで打った方が早い気がします(初心者の方には抵抗があるでしょうけれど)。
install.packages("パッケージ名", dependencies=T) # というようにR画面に打ち込むと依存パッケージ込みでインストールできる
#(Rの下記の画面に入力orコピペするなどすればOKです)


*注:たま~にinstall.packages()をやってもエラーになったり、無視されたりすることがありました。こういう日は、ラボからでも自宅からでもできなかったので、CRANのサーバ?が落ちていたのだと判断しています。そういう場合は仕方がないので日を改めて再挑戦しましょう。借り入れとインストールは計画的に!^^;


##### Rを普通のソフトみたいにメニューから項目を選んで操作する補助機能:Rコマンダー##########
Rの追加パッケージの1つ、Rcmdrのこと。メニューから選択して機能を実行するような普通の統計ソフト風の使い勝手をRで実現する、補助輪付き自転車のようなRの追加機能。R初心者向き。"Rコマンダー"でWeb検索するとたくさんの情報が得られます(当サイトではあまり詳しくは触れていません)。
一度インストールしておけば、library(Rcmdr) 、と入力すれば呼び出せます。何かが足らないとか見つからないというエラーメッセージが出るときはRcmdr自体か、または依存パッケージがインストールできていないということです。メッセージに従ってインストール作業をしても、うまくインストールできないときはR本体も最新版に入れ直した方がよいです(これは他のパッケージにも言えること)。じつはRにとっては背伸びしてる機能な気がします…orz

##### Mac版のRコマンダーの注意 #############
R本体に加え、X11またはXQuartz(http://xquartz.macosforge.org/landing/)もインストールしておく必要があります(UNIXをGUI(ぐらふぃかる・ゆーざ・いんたーふぇいす)のX11上で動作させるためのドライバ?)。

##### Rコードの編集補助ツール ########################
# よく使う作業内容はファイルに書いて保存しておくと再利用に便利

### Mac:メニューの"ファイル"→"新規文書"。拡張子 .R で保存されるエディタが有用。選択したコードをcommand + returnで実行可能。
# サポート機能充実でオススメ(かつてはバグも多かったが現在は問題を感じることはなくなった)
# その他、コード編集エディタとして有名な「mi(ミミカキエディタ)」もお勧め。Winと相互にファイルのやり取りをする時に、文字コードセットをいじるなども容易です(http://www.mimikaki.net/)。

### Win:メニュー"ファイル"→"新規スクリプト"。選択したコードをCtrl + Rで実行可能。
# 注:Mac版のデフォルトである文字コードUnicodeがWin版では化けます。Win版はJISコードが用いられています…早くUnicodeに対応させてほしいです。
# 残念ながらWin版にはサポート機能がほとんどありません。おそらくWinは既存のコード用エディタが豊富なため、開発者があまりがんばっていないのではないかと…。

### Win用、お勧めコード編集ツール ##
# Winにもエディタ機能(スクリプト)が付いているのですが、コンソールの出力結果をスクリプト側にコピペすると文字コード絡みのエラーが起こるなど、使い勝手が悪いです。下記のようなコード編集用のエディタを使用することをオススメします。

# 1. Notepad++日本語版(http://www.geocities.jp/npp_euc_jp/)
# コードの各要素が色分けされているなど、打ち間違えの防止に対して強力、非常に分かりやすい。また、文字コードへの対応も優れている。
# ところで、解凍すると適当な場所に展開されてしまうのですが(デスクトップなどに)、そういうアプリらしいです。好きなところに置いてお使いください(Winユーザに聞いている限りは、それでもトラブルはないらしいです)。Mac版Rで作られた「.R」のコードファイルも文字化けすることなく問題なく開くことができます。

# 2. TeraPad(http://www5f.biglobe.ne.jp/~t-susumu/library/tpad.html)。
こちらも文字コードの対応がしっかりしたコード打ちのエディッタです。コードの選択などしやすいですが、コードの色分けなど視覚的な支援の機能は無い模様。

# 注:Microsoft Wordでのコード編集は止めた方がよいでしょう。お節介機能「オートコレクト」により、行頭の小文字やクオーテーションマークなどが勝手に置き換えられてしまいエラーのもとになります。

# cf. R用エディタ(http://cse.naro.affrc.go.jp/takezawa/r-tips/r/04.html)


###### 外見上は分かりにくい、Rコードの文字置き換わり(このサイトでも生じるかも)#####
 様々な理由で、複数のマシンや人の間でRのコードをやりとりする必要が生じると思います。このサイトでも環境の食い合わせによっては、特定の文字が外見上極めてよく似た異なる文字に置き換わってしまうことがあるかもしれません。怪しいと思ったら、該当箇所をいったん消して、打ち直してみましょう。また、検索&全置換で置き換えるのも効率が良いです。以下、化けやすいコードをリストアップします。

・全角スペース:コード中やコード末に全角スペースがあると悪さをすることがあります。とくにコード末にくっついているスペースが盲点になりがちです。これが混じっているとエラーメッセージは出さないのにコードは通っていないという厄介なエラーが起こります。
・タブ:かといってタブは余計に悪いようです。半角スペースを何回も打って間を空けるのが無難です。とくに行頭のタブは危険なようです。
・クオーテーションマーク( " ):これも別物に変換されている場合があります。これらしい文字は少なくとも3種類あるようです(どれが正解か分かりますか?→ “ ” ")。牛の足跡状というか短い真っ直ぐなラインが二つ並んでいるのが適切な文字です(3番目の ")。上または下がオタマジャクシ状に膨れている、または傾いているヤツはアウトです( “ ” )。(ただしWindows版Rのデフォルトエディタでは傾いてるヤツしか入力できないようですが問題にならない模様、Winの場合何がダメで何がいいのかちょっと分かりません。)
・全角:繰り返しになりますが、よく分からないエラーを引き起こす場合が多々あるので、シャープ (#) 以降に説明を入れる以外での、コード中での全角の使用は控えましょう。
・矢印(<- ):これも何か別のものに置き換わっていることがあります。

・cf. 文字が原因のエラーの中には、サイレントエラーというか、エラーメッセージは出ないのになぜか正常作動しないみたいなかなり厄介なケースも頻発します。おかしなスペースによるエラーや、glmのリンク関数指定などの位置に入っている""が“ ”に置き換わっているケースがとくに要注意です。

*Rの出力画面の中の半角スペースをタブに変更してエクセル等に張れるようにするための補助サイト http://filter.webings.net/
("連続半角スペースをタブに変換"を選ぶとよいです)

・Rコード体裁のお作法サイト
http://google-styleguide.googlecode.com/svn/trunk/google-r-style.html
見やすいコード作りのために参考になるでしょう。すみません、私のサイトではあまり守れていません…また文字化けを避けることなどをより優先しています。

0 件のコメント:

コメントを投稿