Machine Learning 共筆 Week 3

Published in

No Free Lunch

2 min readApr 12, 2018

--

Type of Learning

這周主要簡單介紹了一下有哪些機器學習的input/output、學習方式、餵資料的方式，大致上有以下四種分類:

Different Output Space:

Binary Classification (是非題) ex. 從病人特徵得知有沒有生病
Multi-class Classification (選擇題) ex. 從病人特徵推論得了甚麼病
Regression (有邊界的實數) ex. 從病人特徵得知要花多少天復原
Structured Learning (一連串結構)多類別分類問題的延伸

Different Data Label:

Supervised Learning: 有給出答案(Label)的問題
Unsupervised Learning: 沒有給出答案的分群(clustering) 問題

分類文章主題、outlier detect 都算是這類問題

Semi-Supervised Learning: 有些有答案有些沒答案的問題

取得全部label是困難的，透過少數有標label的資料來做多數沒標label分類的折衷作法

Reinforcement Learning:透過獎懲，讓機器知道他做了一個正確或錯誤的判斷

從一些片面或模糊的資訊中學習 通常是序列發生

Different Protocol:

Batch learning: 資料批次進來，透過固定的 hypothesis 做預測
Online learning: 資料循序進來，hypothesis隨著新資料進來而改進
Active Learning: 因為Batch / Online 的學習方式都是被動的，讓機器透過有技巧的問問題，在資料點少的時候有好的學習效果

Different Input Space:

Concrete Features: 某種程度上經過人為整理的，且可簡單具體(透過具有domain knowledge的人)定義之特徵
Raw Features: 未經過人為整理的原始資料，難以簡單定義，需要透過人或是機器進一步介入處理之特徵(ex: 影像、語音)
Abstract Features: 抽象的資料(ex: 沒有任何意義的編號)，跟raw features類似，但機器學習難度更高

Machine Learning

BigstarPie

Written by BigstarPie

Editor for

No Free Lunch

Help
Status
About
Careers
Press
Blog
Privacy
Terms
Text to speech
Teams