「入門 機械学習」覚え書きメモ1
2013年1月23日 (機械学習)
就活スタート、M1終わりの中間発表の申請などブログを2ヶ月程、寝かしている間に様々な事がありました…。今後の修士論文に向けた研究において、データを分析するための知識として統計や機械学習について理解する必要があるので、オライリー本の「入門 機械学習」(原書:Machine Learning for Hackers)を読み始めました。まずは、1~3章を読破することを目標としたいと思います。
本書のサンプルコード(github.com/johnmyleswhite/ML_for_Hackers)
本書で使用する統計解析ソフトウェア「R」は、Mac OS X版(2.15.2 GUI 1.53)を使用しています。
機械学習の定義と統計学と機械学習の違い
- 機械学習とは、観測可能な世の中の記録からパターンを推論し、知見を得るための手法と手段。
- (統計学)人間に対して世界の何らかのことについて教えるためのツールを開発することに関心。人間がより良い判断を下すための材料。
- (機械学習)コンピュータに対して、世界の何らかのことについて教えること。コンピュータがそこで得た知識を他に利用することができる。
機械学習における学習の意味
- データから可能な限り(適切量の)情報を抽出すること
- ※抽出:データの基本構造を解析して、ノイズから信号をふるい分けるアルゴリズムを使うこと 例)パターン認識アルゴリズム
第1章の内容
- 機械学習のためのRの基礎知識をInfochimps.comというデータサービスで公開されているアメリカにおける未確認飛行物体の目撃情報のデータ群を使って学ぶ。
- ライブラリとデータ(tsvファイル)の読み込み方から誤ったデータの処理(クリーニング)と正しいデータの収集・整理方法、ggplot2を使ったグラフの生成方法まで
補足と雑記
- Rを扱うためのR言語の基礎については詳しく触れられていないので、基礎的な部分は別の書籍を片手に。
- やる夫シリーズ、ありました。やる夫で学ぶSVM&R
コメントをどうぞ