碩論:應用協同過濾技術於表演藝術售票系統(結語)

Jamie Lin
Oct 3, 2023

--

這個研究,離起點並不遠。寫論文的過程中,一直有:「啊這個可以這樣這樣處理、那個若是這樣做應該會比較好......」的想法。但為了趕快畢業,這些念頭都只能擱著,看看之後還有沒有資源可以讓我繼續發展,或是有其他厲害工程師願意投入。

最想處理的是協同過濾的冷啟動問題。如同(二)裡面所說的,協同過濾是利用使用者與物品的互動紀錄來做出推薦。因此,系統無法為沒有紀錄的使用者(新帳號)提出推薦;剛開賣的音樂會也不會被選入推薦清單中。一種處理方式是為這些新使用者和新上架的音樂會另外設計一個推薦系統,例如新使用者開帳號時,就直接問他的喜好和興趣,以此提出推薦。我特別想做的是利用音樂會的演出內容,像是演出者、演出曲目的作曲家、甚至是演出曲目,直接計算新上架的音樂會與過去音樂會的相似度,以此做出推薦。

但是。售票頁面上掛的演出資訊,是一整串的文字,並無欄位分別。所以要做到利用節目內容提出推薦,必須先有個語言模型能從一整串的文字中,正確找出演出者、作曲家、曲名,才能讓推薦系統模型工作。自然語言處理是我相當有興趣但不是非常熟練的領域,訓練出這個語言模型是我的 side project 清單目前排第一的項目。

再來就是(五)提到的 SentenceTransformer 編碼問題。如何微調 SentenceTransformer,讓他可以依照我們想要的結果來判斷標題的相似度,也是個有趣的題目。但如果前段那個模型做得出來,似乎也不用管這個了?畢竟,只有音樂會標題會包含演出者和演出的相關資訊,其他戲劇、舞蹈演出比較少這樣的情形,模型練起來的用途似乎有點小。

當然,最終目標會是為整個售票系統所有節目和所有使用者建構推薦系統。在這之前,是否有辦法利用售票系統資料集的特色來提高推薦的表現?例如,之前瞄到一篇論文在討論,如果有一群一起看電影的人,如何為群體中的個體提出推薦。瞄到的意思就是還沒有讀,但或許其中的分析與手法,可能可以利用在售票系統上。

推薦系統的應用方式,直覺上是售票網站或 app 上跳出推薦清單給使用者參考。但換個方向也行喔。我們可以為使用者提出推薦,當然也可以為音樂會提出推薦:看看哪些會員最有可能對這場音樂會有興趣,針對這些會員做精準行銷。另外,售票系統的資料集也不是只能用來搭建推薦系統。就像(四)後半段的簡單統計分析,對演出單位在規劃工作時程和宣傳波段時,也是很有幫助的。其他還有幾個我覺得可以做的數據分析 projects,就讓我藏私等人來問好了。(笑)

一般我們在做行銷策略規劃時,會透過市場調查、focus group 等方式了解市場區隔,了解我們的目標客戶在哪邊。在數據分析的領域中,我們看的不再是一整塊的區隔,而是單一顧客。我們嘗試從過去的交易紀錄中,描繪這一個顧客的行為模式,為他提出專屬的建議。這是我做完這個研究的最大心得。

還有就是,我們還有很多可以做哪!

--

--

Jamie Lin

好好路不走的資深表演藝術行政,正努力轉換跑道,打算做數據分析去。