【籃球分析101】 產出&情境 Production & Context

Tica Lin
SportsXR
Published in
6 min readJun 5, 2020

最近收到了一位好朋友的贈書,是Stephen Shea第二本關於籃球分析的著作《Basketball Analytics》,比起黑皮的第一本書多為統計公式推導,這本加入了許多空間數據的分析,並且更深入淺出的架構與解構籃球分析的精髓,推薦給初學籃球分析有興趣的朋友!
https://www.amazon.com/Basketball-Analytics-Tracking-Stephen-Shea/dp/1503236277

作為一個數據視覺化設計師與研究者,我對於實際的籃球數據分析也一知半解,但在設計的過程中,必然的發現對於教練有些數據要強調(如:排名、分差)、有些要簡化(如:實際分數),以免產生決策上的誤導。就像所有的資料分析師一樣,了解情境與商業模式才能運用數據進行有用的分析,籃球分析也有一定所需的知識背景與架構。

並不是所有人都是分析師、球探或者GM,但身為球迷或者業餘球評,有哪些層面可以幫助你更好的觀看球賽、並分析球員與球隊表現?

前文分享了籃球數據分析在球團裡的角色、以其背後技術層面的流程,提到『數據提供現狀的分析與未來方向的推估,擁有完整而全面的數據才能準確分析現狀,並有效發展未來策略。』各位想必很好奇要收集什麼數據才能得到這些有價值的分析呢?要如何提出有觀點的問題呢?這些思維與商業上的數據分析其實是雷同的,但是需要更專業的產業(籃球)知識。

我整理《Basketball Analytics》第一章的觀念在下面,供有興趣初步了解籃球分析的朋友參考與交流,雖然看似基本,但這些觀念所提出的問題,正是所有複雜統計模型與數據收集所希望能回答的。

籃球分析的精髓:考慮『產出+情境』Production + Context

Graph made by Tica L.

本書第一章就提供了很好的分析架構,讓籃球鑑賞家可以更有效地評估比賽與球員表現,不用再被單一數據誤導。

{產出Production}

首先是從產出面評估,最直觀與傳統的方式當然是直接用分數、量化數字去評量,如:單場得分32分、籃板8個等等。然而,這樣的比較固然簡單直接,像是能夠跨時代去比誰是歷史上單場得分最多的?誰是本季單場平均最高的?但這卻會引發接下來的各種疑慮:這真的是公平的比較嗎?

第二層面是考慮效能,球員是花了多少時間與機會得到這些表現?命中率有多高?除了FG%, 3P%之外,也有許多衍伸的數據,如:EFG% 將兩分與三分球共同計入,TS% 將罰球命中率也列入考慮。但只看效能,上場時間少的球員容易被高估,也沒有考慮到上場時的情境,對手與隊友強度等等。

更進一步是要考慮這些表現的實際類型,各種shot type:上籃、切入、pull-up shot、catch and shoot…?籃板的類型:像是是否有人阻擋?失誤類型:傳球中或是運球中被超球?更精確的區分這些產出的類型有助於了解球員的優劣勢與實際表現。

最後根據上述的幾項數據,能了解球員的多樣性。同樣的得分,是來自同樣類型的投籃類型,還是分布在各種可能的得分方式?進攻與防守的特性如合?越是多樣化的球員,越能分散風險、適應不同的位置,但特定位置的球員單一項目的得分能力較強。球隊在選擇球員的時候也會考慮對自身球隊陣型安排的幫助。

{情境Context}

情境面的評估是比較難被量化的,因為它包含許多實際的運動與交互影響的資訊,這些資訊需要透過Computer Vision去分解,在有2013–14 有SportVU的球員追蹤系統後開始被納入分析。但為什麼情境很重要呢?

第一重要的是考慮球員的場上使用方式,特別是持球時間、實際在團隊中的角色。通常在弱隊招收到排名前面的新球員後,會寄與重任,也因此他會有漂亮的高得分,但也會有很差的效能,因為持球時間長、加上隊友不可靠,若單獨將他的產出表現與其他隊素質較平均的先發球員比較,就會有所偏頗。球員是主攻進攻、還是防守,是助攻多或是主攻,都會影響他產出的數據代表的意義。要比較不同隊上球員的表現、或是比較同一球員在不同球季的表現,應將使用方式納入考慮。

將隊友表現與對手列入考慮是大家較熟知的。除了第一點所說的使用方式,隊友的表現也會影響球員的產出,跟較好的球員在場上,總體產出也較高。但過去使用+/-的方式單純用分差去評量球員價值,就會放大這兩點,好隊友/壞對手會讓球員的+/-加大,壞隊友/好對手則會降低,讓球員價值無法被評估。有了空間追蹤的數據分析,可以更具體的了解場上發生事件的情境,如:隊友命中率極低破壞了助攻,球員被迫自行出手投出更困難的球,也因此效率下降;對手防守的方式降低了禁區投籃的比例,導致球員挑戰更多中距離出手,命中率也下降。

最後考慮的是狀況,包括比賽狀況與球員狀況。比賽狀況考量在一場比賽中,每一分秒的重要性與壓力並不相同,比分差距小的最後兩分鐘(clutch time)價值高於上半場的時間,教練使用的戰術也會大為不同。特別被提出的一種評估方式是Point Balance(PB),用來比較在不同局面時球隊是將戰術壓在少數球員上(低PB)還是分佈在多位球員中(高PB),大多數球隊在上半場會有高PB,在clutch time則是低PB,量化不同局面在不同球隊的重要性可以相對調整球員的總體價值。球員狀況的部分則是另一個考量點,包括休息時間、身體狀況與受傷預估。在多數back-to-back的連續比賽中,球員表現通常較差,而在間隔3或4天的休息後表現較好。

綜合以上幾個考慮層面,現今籃球分析收集各種數據,比賽數據、空間追蹤、穿戴式裝置的sensor,希望能更全面的描述這些{產出+情境}提出的問題。進階數據如:RPM(Real Plus-Minus)試圖以一個數字去描述球員價值,奠定在傳統+/-上,除了包含產出數據(數量、效率),更近一步加入使用、隊友、對手等情境上的資訊。

但即使RPM的統計再精準,它就像一個黑盒子,球隊仍無法信賴單一數字去決定球員好壞,而是尋找能回答他們在上述思考框架下所提出的問題,如:我想知道這個球員能否在clutch time做出貢獻、能否在這個戰術中發揮最大功能?

奠立在這個{產出+情境}架構之上,本書作者介紹用空間追蹤數據來量化評估各方面的考量(數量、效率、類型、多樣性、使用、隊友、對手、狀況),比起單一數字,能更有效的提供決策者做決定與溝通的依據。而對籃球迷、分析師而言,這樣的架構更能幫助我們提出有趣的觀察與問題,再尋找個別的數據去進行分析與解答。

恭喜你踏上籃球分析之路!有興趣的話很推薦閱讀Dr. Shea的原書,有許多實際的例子討論可以增加你的想像力。
*這篇文章希望分享籃球的多角度給熱愛籃球的朋友,喜歡文章請掌聲讓更多人看到唷:)

--

--

Tica Lin
SportsXR

Data Viz Researcher & Designer, AR/VR Enthusiast, Life Adventurer, Basketball Lover 🏀 Creator of SportsVisReal: https://medium.com/sportsvisreal