白色化は無相関化→標準化の順番

takkii
Music and Technology
2 min readNov 11, 2017

はじめてのパターン認識の4章を読んだ。

この章では白色化について紹介されてた。

白色化は、特徴量同士の相関をなくしつつ、平均を0、分散1に収まるようにデータを変更することである。

白色化で行っていることは、無相関化+標準化だが、その順番がわからなくなってしまいそうなので、イメージをメモしておく。

2次元平面にデータをプロットした図をイメージしてみる。相関があるというのは片方が増えるともう一方も増加ないし減少する傾向があるということ。無相関化はこのプロットを回転させ、片方の増減がもう一方の増減に影響がないようにする。

標準化は二次元平面にプロットされたデータの平均を0にし、縦横のばらつき(分散)を1にするということ。

仮に標準化→無相関化したとすると、標準化によって縦横の分散が1になったにも関わらず、無相関化による回転によって、縦横の分散が1からずれてしまう。

そのため、無相関化→標準化でないといけない。

本当は図とか描きたいのだが、Macで描くのめんどくさくて文字ばかりになってしまいすいません。。。

--

--

takkii
Music and Technology

Competitive Programming, MachineLearning, Manga, Music, BoardGame.