[Work/Class/Rの基礎とデータ処理]

アート系学生のためのRの基礎とデータ処理・分析

この授業の目的

アート系学生が作品が,マーケティングなどの演習のためにデータ処理・分析を行う場合を想定して,統計などで頻繁に使われているR言語の基礎と,データ処理の方法と統計の基礎についてを学ぶ.数値を扱う内容・統計に関する内容はPython3版と対応させており,同じデータ,同じ内容である.

ネットコンテンツの取得やそのパース,文字列処理などについてはPythonの方がライブラリが揃っているためPythonを推奨する.逆にRは数学的なライブラリ(例えばグラフの描画や,あるパラメータを最適化するなど)がビルトインであるため,数学的な処理に関してはRを推奨する.(Pythonは追加パッケージがそれを担う)

(アルゴリズムを擬似コードで書きやすいものはPython,数式で書きやすいものはR,がそれぞれ有利,と言うイメージ)

本コンテンツはJupyter Notebookで動作するRを対象とする.Microsoftが提供するAzure NotebookのRは,PythonのGoogle Colaboratoryと同じくローカルに環境構築が一切いらないのでオススメ.

また,本コンテンツでは,読み込ませるデータの作成(オープンデータを整える)には表計算ソフトを対話的に用いる(Pyhotnの広義ノートの方ではプログラム的に処理している).これは本Rの講義の方が,Pythonの講義に比べ,プログラミングの技能を獲得していない学生を対象としているからである.

コンテンツ

  1. Rの基本,配列array,関数定義
  2. Rのベクタとマトリクス
  3. CSVのPlot,data.frameの取り扱い
  4. Rのdata.frame用の高階関数apply
  5. 散布図の描画
  6. CSVデータからの相関係数の算出
  7. CSVデータからの単純線形回帰分析
  8. CSVデータからのt検定
  9. CSVデータからの分散分析と多重比較
  10. CSVデータからの重回帰分析と因果関係
  11. CSVデータからの主成分分析
  12. CSVデータからの線形二項分類
  13. CSVデータからの因子分析

Azure NotebooksでRを使う方法

Microsoftが運営しているので,Microsoftアカウントを取得しておく.

Azure Notebooksのページに行き,右上のSign InからMSアカウントでサインイン(ログイン)する.

MSアカウントでサインイン

上の「My Projects」を選択.

My Projects

「New Project」で授業用(もしくは自習用)のプロジェクトを作成する.

New Project

プロジェクト名と,プロジェクトID(URLになる.なんでも良い)を入れて,「Create」.

プロジェクト名とプロジェクトIDを入れる

空のプロジェクトができる.要するに「フォルダ」である.

からのプロジェクトができた状態.

「+」マークをクリックし,「Notebook」を選択.

新規ノートブック

ノートブックの名前をつけて,使用する言語「R」を選択して,「New」

Rのノートブックを新規作成

新しいノートブックができたので,クリックする.

新しいノートブックができた

Rのコードが入力できるようになる.入力したら「Run」でその入力部分を実行できる.

Runで実行する