JimmyWu《模型成效》從Booking.com的150個機器學習專案學習模型上線的6個重點這篇文章是閱讀完Booking.com的機器學習團隊發表的文章《150 Successful Machine Learning Models: 6 Lessons Learned at…Jan 25, 2020Jan 25, 2020
JimmyWu《決策樹系列》NGBOOST 模型介紹今天介紹的主題是來自《NGBoost: Natural Gradient Boosting for Probabilistic Prediction》,乍看之下會以為又是一個Tree Boosting的模型,但實際上這篇文章中並不限定使用Tree作為base…Dec 7, 2019Dec 7, 2019
JimmyWu《前處理》資料前處理的重要性在一間大公司裡通常各個部門都會有自己使用的系統跟DB,因此在資料科學發展較先進的公司中通常會有Data Lake(通常是Hadoop)從各個不同DB收資料…Sep 7, 2019Sep 7, 2019
JimmyWu《決策樹系列》 XGBoost模型理論從在學校以來就很少碰到決策樹的演算法,決策樹演算法相較於深度學習有較好的可解釋性、且需要調整的參數較少,這也是為什麼我想要研究決策樹演算法的關係。上一篇《決策樹是什麼》簡單描述了決策樹的演算方式,這偏則是要介紹大名鼎鼎的XGBOOST《XGBoost: A Scalable…Aug 31, 2019Aug 31, 2019
JimmyWu《Outlier Detection》如何將GAN用在Outlier Detection上最近正在做的案子要用到Outler Detection的架構,因此Survey了一些Outlier Detection的做法。Aug 9, 2019Aug 9, 2019
JimmyWu《Super Mask》探索神經網路的潛在結構2019 ICLR的最佳論文獎頒給了 Uber AI Lab發的《Deconstructing Lottery Tickets: Zeros, Signs, and the Supermask》。這篇文章主要是研究Frankle and Carbin提出的Lottery…Jun 15, 2019Jun 15, 2019
JimmyWu《Dimension Reduction》快速了解PCA的原理及使用方法平常在做模型的時候,如果模型有太多的Feature會造成幾個訓練上的困難:Apr 21, 2019Apr 21, 2019