Yoctol Paper Note ep.20: Regularizing CNN with Locally Constrained Decorrelations

Published in

YOCTOL.AI

3 min readApr 10, 2018

本文所使用圖皆截自原論文

編按：在優拓每週一次的 Seminar，Data Team 的大夥會輪流分享最近看過的一篇印象深刻的論文。這一系列文章就是將會議上討論的內容整理出來，分享給優拓以外的同好。本系列的前一篇請見：

優拓 Paper Note ep.19: Language Modeling with Gated CNN

blog.yoctol.com

這篇 ICLR 2017 的論文來自巴塞隆納自治大學的電腦視覺團隊。他們提出一種新的 Regularization 方法， OrthoReg，試圖減低同一層權重之間的相關性，具體來說，他們在原本的 cost function 上加這一項：

直觀上解釋，這個 reularization term 代表權重之間的 cosine similarity 的平方，透過最小化這項，可以讓權重之間的相關性趨近零。

減低相關性的機制並沒有非常明確的理論背景。由於這個 correlation 是做在線性空間上，然而目前的 NN 架構有許多非線性的操作，作者在論文中並沒有對此進行更多解釋。（在評論區有人提出：ReLU(Wx) 和 ReLU(-Wx) 的輸出是完全正交，但權重之間的 cosine similarity 是完全負相關）
在 benchmark 上，作者並沒有給出實驗結果的信賴區間。不確定是否有對 test set 刻意調整。