T-Brain 狗音辨識 AI 百萬挑戰賽參賽紀錄(一) - 競賽規則介紹

沈謙

Jul 24, 2021

此系列文共有7章，完整內容可至此List觀看，此篇為第1章，主要講述競賽規則&資料內容。

於2021/05/17參加此競賽，隊伍名稱為無法顯示，競賽連結如下

T-Brain Machine Learning Competition

居家環境中有許多不同類型的聲音，舉凡吸塵器、警報器、門鈴、電視聲等，充斥著我們的生活。由 Tomofun 所開發的 Furbo 狗狗攝影機，結合攝影機、丟零食互動、AI 智慧通知三大功能，成為狗狗的專屬保姆。Furbo…

tbrain.trendmicro.com.tw

競賽內容為預測音檔分類，分為兩階段，目的皆為優化模型預測之結果，但細節與進行方式有些許差異，以下說明:

初賽(2021/05/10~2021/06/11)

規則

進行方式與Kaggle相同，主辦方會提供訓練集資料(含ground truth)、公開測試集資料(不含ground truth)，使用訓練集訓練模型，並使用模型對測試集進行預測，將結果上傳至T-Brain平台並獲得分數計算，用於評估模型。截止日前兩天主辦方會提供私人測試集資料，此預測結果為最終分數。

最終取前25名進入決賽。

資料

1. 訓練集 : 1200筆資料，共六種分類，分別為狗吠、狗嚎、狗哭、警報器、玻璃、其他(非以上五類)

2. 公開測試集 : 10000筆資料

3. 私人測試集 : 20000筆資料

訓練集資料明顯資料純度高(分類明顯、雜音少)，而測試集資料則相反，具有高度雜音。

計分方式