shivaseの日記

SIer→Web→教師→SIer→ベンチャー(SRE)と異色な人生を歩んでいるエンジニアの日記

Machine Learning Week1 - Introduction

Machine Learning(機械学習)とは

以下の引用が、「機械学習とは何か」で一番有名な定義.

A computer program is said to learn from experience E with respect to some task T and some performance measure P if its performance on T, as measured by P, improves with experience E. コンピュータプログラムはタスクTとパフォーマンス測定Pに関連する経験Eから学習すると言われています。タスクTでパフォーマンスをした場合、パフォーマンス測定Pによって達成度が測定され、経験Eによって改善されていきます。

機械学習とは何か? – 機械学習の定義と使える言い回し | コンピュータサイエンス | POSTD

supervised/unsupervised learning

機械学習は、学習データによって大きく二つに分かれている

Supervised Learning(教師あり学習)

データとして正しい答えを与えられる(given the right answer for each example in the data.)ので、それを元に予測をさせる.

例)

  • 家の広さと家賃の関係
  • 腫瘍のサイズとガンの良性/悪性の確率

Unsupervised Learning(教師なし学習)

与えられるデータはラベル識別(意味付け)されておらず、機械にそのラベル付けや分類をさせる.

例)

  • google news

問題

unsupervisedなアルゴリズムはどれか

  • スパム or notスパムと分類した複数のメールを元にして、スパムフィルターに学習させる
  • ウェブ上のニュース記事を元に、同じ内容同士でグルーピングする
  • 顧客データのデータベースを参照して、市場区分を特定して顧客を分類する.
  • 糖尿病と診断された患者データを元に、診断対象者が糖尿病かどうか診断する.

回帰/分類問題

学習させると言っても、最終的にどういった結果が欲しいかで二つに分かれる

  • Regression(回帰問題) : 実数(連続値)を予測する
    -> 住宅価格の予測(家の広さと値段の関係)
  • Classification(分類問題) :
    -> 腫瘍の大きさと、その悪性か良性の関係

学習したこと

  • 「機械学習とは何か」を理解し、E/T/Pそれぞれを説明できる
  • unsupervisedとsupervisedの違いを理解する
  • Regression/Classificationの違いを理解する

用語

  • hypothesis : 仮説、だが機械学習では意味が違う。予測と訳すのが良い

【スポンサーリンク】