T-Brain 狗音辨識 AI 百萬挑戰賽 參賽紀錄(一) - 競賽規則介紹

沈謙
Jul 24, 2021

--

此系列文共有7章,完整內容可至此List觀看,此篇為第1章,主要講述競賽規則&資料內容。

於2021/05/17參加此競賽,隊伍名稱為無法顯示,競賽連結如下

競賽內容為預測音檔分類,分為兩階段,目的皆為優化模型預測之結果,但細節與進行方式有些許差異,以下說明:

初賽(2021/05/10~2021/06/11)

規則

進行方式與Kaggle相同,主辦方會提供訓練集資料(含ground truth)、公開測試集資料(不含ground truth),使用訓練集訓練模型,並使用模型對測試集進行預測,將結果上傳至T-Brain平台並獲得分數計算,用於評估模型。截止日前兩天主辦方會提供私人測試集資料,此預測結果為最終分數。

最終取前25名進入決賽。

資料

1. 訓練集 : 1200筆資料,共六種分類,分別為狗吠、狗嚎、狗哭、警報器、玻璃、其他(非以上五類)

2. 公開測試集 : 10000筆資料

3. 私人測試集 : 20000筆資料

訓練集資料明顯資料純度高(分類明顯、雜音少),而測試集資料則相反,具有高度雜音。

計分方式

決賽準備(2021/06/11~2021/07/17)

規則

與初賽有些許差異,需使用AWS平台架設API,接收主辦發打出的音頻資料,並回傳預測結果,作為最終得分。

訓練集增加為1600筆資料,新增四種分類,為門鈴、鳥類、音樂、笑聲,共十種分類。

決賽(2021/07/17)

共4小時的競賽時間,主辦方以2秒一筆資料之發送速度,前2小時(test round)的3600筆資料不記分,最後 2 小時(final round)之的3600 筆資料作為算分依據。

所有發送的資料都可以進行人工標記,並且對模型進行增量訓練後,可放上新模型繼續進行預測。

成績

參賽隊伍 : 301

初賽 : 第4名

決賽 : 第6名(與獎金擦身而過,飲恨QQ)

後記

雖然沒有獎金,但晉級的隊伍都會有一台寵物攝影機,可以給家裡貓貓用,這也是當初參加的原因哈哈哈

貓貓出門散步

--

--