碩論:應用協同過濾技術於表演藝術售票系統(一)

售票系統資料集的特色

Jamie Lin
Sep 17, 2023

此系列是寫給藝術行政同行的,所以不會有太理論或太技術的內容。想看程式碼的請直接到我的 GitHub repo,想直接讀論文的,可以從這邊下載

感謝國家兩廳院支持,提供兩廳院售票系統 2011–2019年間,系統會員購買國家兩廳院演奏廳演出票券的交易紀錄,讓我實作推薦系統。

兩廳院售票系統,1987年~2020年,我們感謝你。

直覺上,售票系統跟一般購物平台沒什麼差別,就是賣的東西變成是票券/節目而已。但事實上,售票系統有些非常獨特的特色,使得處理資料時,會遇到不太一樣的挑戰。

  1. 獨家通路:演出節目通常只會委託一個售票系統販售,因此不會有不同購物平台、同樣產品會有不同售價的狀況。
  2. 不適用長尾獲利理論:2006年由 Anderson 提出的長尾理論,是指購物平台上,大量的小眾產品累積的收益,堪比熱門產品產生的收益。但是這個前提是小眾產品持續販售、累積。反觀售票系統販售的「票券」,演出結束後就下架,平均販售期間為二至三個月,無法產生長尾效益。
  3. 非會員亦可購票:兩廳院售票系統一直有實體票點,觀眾去這些票點購票,不需要有會員身份就可以購買;在超商的機台購票也不需要輸入會員編號;售票系統特有的「主辦單位調票」購票方式,也不強制主辦單位於調票時提供購票觀眾的會員代碼。因此,以這些方式售出的票券,就無法追蹤、分析、利用。這代表交易資料集是不完整的:可能會員這次跟主辦單位買票、下次自己上網買,有時去超商買但懶得輸入會員代碼。這個對推薦系統的影響非常大。
  4. 消費行為模式:一般購物平台上,比較少出現同一個會員在短時間內重複購買同一產品這樣的消費模式。但在售票系統上還滿常見的:一次買兩張票、幫朋友買票、甚至主動發起揪團票等等。
    另外一種常見狀況是有相同興趣的友伴可能輪流用彼此的帳號買票,這次A買、下次B買。但我們無法自交易紀錄中判斷同行人士,只能記錄到A看了演出,無法正確紀錄B也看了這場演出。
  5. 商品本質差異:售票系統的商品雖說是「票券」,但觀眾必須持票券於指定時間,前往指定地點才能使用。所以購票之時,除了對節目有沒有興趣以外,演出的時間、地點也會納入考量。例如:居住在台北市的觀眾,對某場在高雄的演出有興趣,考量額外交通、住宿和時間成本後,不一定會購票前往。又如演出時間若和工作或家庭行程衝突,即便有興趣,可能也不會購買。因此,「沒有購買」一事,不見得可以直接詮釋為「沒有興趣」。
    此外,節目和節目之間的替代性相當低。以音樂節目來說,即便是完全一樣的曲目,由不同演奏家演出,觀眾一般會視為不同節目。劇場演出更不用說了,僅僅主要角色有AB cast ,A cast 和 B cast 都可能被視為不同的演出,兩場都要看!
  6. 非常稀疏:售票系統資料集非常的稀疏,意思是,委託售票系統販售的節目非常多,但每一名會員只會購買其中非常少的節目票券,因此可供分析的資料點非常少。
  7. 缺乏使用者回饋:購物平台可以將使用者的評論、評分作為未來推薦這個產品的參考。但是,演出結束、票券下架前,售票系統無法得到觀眾的回饋。因此,即便系統有任何星等或評論機制,蒐集到的資訊已經無法幫到這場節目,只能做為未來使用。

除了以上這些售票系統獨有的特點外,售票系統資料集是典型的「隱式回饋」(implicit feedback) 資料集。意思是,我們只有使用者購買/沒購買的紀錄,沒有使用者回報喜不喜歡的資訊。相對於隱式回饋資料集,是「顯示回饋」(explicit feedback) 資料集。顯示回饋資料集包含使用者對產品的評價、評論等,所以會有正向(使用者喜歡)和負向(使用者不喜歡)雙向的資料可利用。

因為沒有使用者回饋資訊,所以隱式回饋資料集中的「有購買」,不見得可以直接連結到「使用者喜歡」。畢竟,觀眾有可能看了節目後,並不喜歡這個演出。或是這張票是買給其他人看的。這兩種狀況,都不是「有購買=喜歡」的例子。所以隱式回饋資料集的雜訊很大。

以售票系統來說,還有一個狀況需要討論:一個會員購買很多張某場音樂會的票,代表什麼意思?如果是購物平台,我們可能可以詮釋為:使用者用了這個產品,感到非常滿意,所以跟親友推薦、代他們購買,或是想要買來當作贈禮。但在售票系統上無法這麼詮釋。會員自己都還沒看過演出,所以也許只是憑藉對演出團隊的信心、推薦給親友?我們是否可以說,比起只買了1張票的節目A,會員比較喜歡他買了6張票的節目B?好像也不是這樣。所以,購票張數這個資訊,我們可以如何運用呢?

我沒有找到太多對售票系統資料集的研究。如果有人正好知道相關研究,請跟我說。好想看看這些問號可以怎麼處理。

下一篇:碩論:應用協同過濾技術於表演藝術售票系統(二)

--

--

Jamie Lin

好好路不走的資深表演藝術行政,正努力轉換跑道,打算做數據分析去。