Private score

「加油啊,Gary,可別把自己從第一名洗下去了!」

Gary,是ML作業一一位同學的隊名,目前暫居Private set排行榜上的第一名。

ML作業設計是利用同學們的ML model在test set上做預測,由test set的正確率表現決定排名。而test set又分為Public set跟Private set,其中的不同在於Public set是同學可以看到的分數,Private則是隱藏起來的分數,只有在比賽結束時可以看得到。這個設計的理由是希望在做ML的時候,不要為了去最佳化performance而調參數或是選特徵,而忽略了一般化ML model的重要性。簡而言之,與其想盡辦法去讓自己的model在public set上得到好結果,不如設計一個好的model,選一些合理的參數,利用上課學到的ML精神做出一個在Public以及Private都很好的結果才是重要的。

有趣的是,因為大家並無從知曉自己上傳的答案在private set 上的結果。所以就會努力的在Public上衝高排名,用了各種奇奇怪怪選feature的方法,試了許多沒道理的參數,造成Public set成績好,Private上成績卻很差的結果。

這時候助教就像上帝一般,躲在後台看著大家追尋著無意義的第一。

Gary不一樣,Gary是目前Private set上的第一名。而他在Public set上卻是完全不起眼的40多名。打個比方好了,就像是全班最矮小的戴著眼鏡的同學,是籃球校隊隊長那樣的出人意料。

有時候想想,當你不知道未來的形狀而盲目追求,為了滿足某些別人給予的價值,評分,而改變了自己,讓自己去迎合社會的標準的時候,有沒有想過自己在private set上的分數。

人生的Private set會是什麼樣子,恐怕只有上帝知道,不過上帝不能說。就像hw1,我看著大家在Public上爭第一,我也只能笑笑,然後暗自期許大家能夠後退一些,注意真正重要的事情。

我不認識Gary,只是很有趣的,我不希望他從Public上爬升,然後從Private上掉下來。

就像我期許我自己那樣。

Like what you read? Give Zih-Wei Lin a round of applause.

From a quick cheer to a standing ovation, clap to show how much you enjoyed this story.