Machine Learning Week1 - Introduction
Machine Learning(機械学習)とは
以下の引用が、「機械学習とは何か」で一番有名な定義.
A computer program is said to learn from experience E with respect to some task T and some performance measure P if its performance on T, as measured by P, improves with experience E. コンピュータプログラムはタスクTとパフォーマンス測定Pに関連する経験Eから学習すると言われています。タスクTでパフォーマンスをした場合、パフォーマンス測定Pによって達成度が測定され、経験Eによって改善されていきます。
supervised/unsupervised learning
機械学習は、学習データによって大きく二つに分かれている
Supervised Learning(教師あり学習)
データとして正しい答えを与えられる(given the right answer for each example in the data.)ので、それを元に予測をさせる.
例)
- 家の広さと家賃の関係
- 腫瘍のサイズとガンの良性/悪性の確率
Unsupervised Learning(教師なし学習)
与えられるデータはラベル識別(意味付け)されておらず、機械にそのラベル付けや分類をさせる.
例)
- google news
問題
unsupervisedなアルゴリズムはどれか
- スパム or notスパムと分類した複数のメールを元にして、スパムフィルターに学習させる
- ウェブ上のニュース記事を元に、同じ内容同士でグルーピングする
- 顧客データのデータベースを参照して、市場区分を特定して顧客を分類する.
- 糖尿病と診断された患者データを元に、診断対象者が糖尿病かどうか診断する.
回帰/分類問題
学習させると言っても、最終的にどういった結果が欲しいかで二つに分かれる
- Regression(回帰問題) : 実数(連続値)を予測する
-> 住宅価格の予測(家の広さと値段の関係) - Classification(分類問題) :
-> 腫瘍の大きさと、その悪性か良性の関係
学習したこと
- 「機械学習とは何か」を理解し、E/T/Pそれぞれを説明できる
- unsupervisedとsupervisedの違いを理解する
- Regression/Classificationの違いを理解する
用語
- hypothesis : 仮説、だが機械学習では意味が違う。予測と訳すのが良い