決策樹的延伸 — — 隨機森林（Random Forest）

Published in

AI 講講話

Aug 29, 2022

什麼是隨機森林？

上一篇直覺易懂的分類 — — 決策樹（Decision Tree）中，我們學到了什麼是決策樹。而什麼是隨機森林呢？我們可以想像一個很大的森林，裡面包含了很多棵決策樹，而每一棵決策樹都是互相獨立的，至於要怎麼決定最後的結果，是以眾數或取得平均的方式決定最終的結果。

也就是說，隨機森林就是包含多棵決策樹的分類器，決策樹可以處理離散型（discrete）和連續型（continuous）的資料。離散型資料指的是特定值，這些值可能無窮無盡，但每個值都是不同的，並且沒有中間的灰色區域，例如蘋果的數量。連續型資料不限於特定值，而是包含在連續範圍內的任何值，在任何兩個連續數據值之間，可能有無限多個其他值，例如身高、體重。

在離散型的資料中，隨機森林就是取得決策樹的眾數；而連續型的資料中，隨機森林就是取得決策樹結果的平均。