この授業の目的
アート系学生が作品が,マーケティングなどの演習のためにデータ処理・分析を行う場合を想定して,統計などで頻繁に使われているR言語の基礎と,データ処理の方法と統計の基礎についてを学ぶ.数値を扱う内容・統計に関する内容はPython3版と対応させており,同じデータ,同じ内容である.
ネットコンテンツの取得やそのパース,文字列処理などについてはPythonの方がライブラリが揃っているためPythonを推奨する.逆にRは数学的なライブラリ(例えばグラフの描画や,あるパラメータを最適化するなど)がビルトインであるため,数学的な処理に関してはRを推奨する.(Pythonは追加パッケージがそれを担う)
(アルゴリズムを擬似コードで書きやすいものはPython,数式で書きやすいものはR,がそれぞれ有利,と言うイメージ)
本コンテンツはJupyter Notebookで動作するRを対象とする.Microsoftが提供するAzure NotebookのRは,PythonのGoogle Colaboratoryと同じくローカルに環境構築が一切いらないのでオススメ.
また,本コンテンツでは,読み込ませるデータの作成(オープンデータを整える)には表計算ソフトを対話的に用いる(Pyhotnの広義ノートの方ではプログラム的に処理している).これは本Rの講義の方が,Pythonの講義に比べ,プログラミングの技能を獲得していない学生を対象としているからである.
コンテンツ
- Rの基本,配列array,関数定義
- Rのベクタとマトリクス
- CSVのPlot,data.frameの取り扱い
- Rのdata.frame用の高階関数apply
- 散布図の描画
- CSVデータからの相関係数の算出
- CSVデータからの単純線形回帰分析
- CSVデータからのt検定
- CSVデータからの分散分析と多重比較
- CSVデータからの重回帰分析と因果関係
- CSVデータからの主成分分析
- CSVデータからの線形二項分類
- CSVデータからの因子分析
Azure NotebooksでRを使う方法
Microsoftが運営しているので,Microsoftアカウントを取得しておく.
Azure Notebooksのページに行き,右上のSign InからMSアカウントでサインイン(ログイン)する.
上の「My Projects」を選択.
「New Project」で授業用(もしくは自習用)のプロジェクトを作成する.
プロジェクト名と,プロジェクトID(URLになる.なんでも良い)を入れて,「Create」.
空のプロジェクトができる.要するに「フォルダ」である.
「+」マークをクリックし,「Notebook」を選択.
ノートブックの名前をつけて,使用する言語「R」を選択して,「New」
新しいノートブックができたので,クリックする.
Rのコードが入力できるようになる.入力したら「Run」でその入力部分を実行できる.