Machine Learning 共筆 Week 3

BigstarPie
No Free Lunch
Published in
2 min readApr 12, 2018

Type of Learning

這周主要簡單介紹了一下有哪些機器學習的input/output、學習方式、餵資料的方式,大致上有以下四種分類:

Different Output Space:

  • Binary Classification (是非題) ex. 從病人特徵得知有沒有生病
  • Multi-class Classification (選擇題) ex. 從病人特徵推論得了甚麼病
  • Regression (有邊界的實數) ex. 從病人特徵得知要花多少天復原
  • Structured Learning (一連串結構)多類別分類問題的延伸

Different Data Label:

  • Supervised Learning: 有給出答案(Label)的問題
  • Unsupervised Learning: 沒有給出答案的分群(clustering) 問題
分類文章主題、outlier detect 都算是這類問題
  • Semi-Supervised Learning: 有些有答案有些沒答案的問題
取得全部label是困難的,透過少數有標label的資料來做多數沒標label分類的折衷作法
  • Reinforcement Learning:透過獎懲,讓機器知道他做了一個正確或錯誤的判斷
從一些片面或模糊的資訊中學習 通常是序列發生

Different Protocol:

  • Batch learning: 資料批次進來,透過固定的 hypothesis 做預測
  • Online learning: 資料循序進來,hypothesis隨著新資料進來而改進
  • Active Learning: 因為Batch / Online 的學習方式都是被動的,讓機器透過有技巧的問問題,在資料點少的時候有好的學習效果

Different Input Space:

  • Concrete Features: 某種程度上經過人為整理的,且可簡單具體(透過具有domain knowledge的人)定義之特徵
  • Raw Features: 未經過人為整理的原始資料,難以簡單定義,需要透過人或是機器進一步介入處理之特徵(ex: 影像、語音)
  • Abstract Features: 抽象的資料(ex: 沒有任何意義的編號),跟raw features類似,但機器學習難度更高

--

--