可視化與公共交通的那些事(3):乘客去了哪兒?

Liuhuaying Yang
Vis It 有視沒事
11 min readOct 27, 2019

本文案例中的ODX可視化工具於今年1月獲得了公交績效評估挑戰賽第一名(2019 TRB Innovations in Transit Performance Measurement Challenge)

掃掃QR code,關注我們的微信公眾號,獲得最前沿的可視化資訊!

我們平時乘車上車刷卡,有時下車也刷卡。很多人可能覺得,這只是不同的計費方式:僅在上車刷卡,車資是按乘次算;下車也刷卡,車資是按站數算。

而實際上,這個簡單的刷卡動作意義非凡,因為它為真正實現公共交通能按需規劃提供了數據。然而與此同時,也帶了新的挑戰。

在面對這海量數據時,除了運算能力和算法的挑戰外,在實際業務中,規劃人員更面臨著認知、應用和溝通的挑戰。而這正是可視化對症下藥之處。

First Prize — 2019 TRB Innovations in Transit Performance Measurement Challenge

本文將介紹可視化案例,是我當時在MBTA參與的ODX可視化工具。 MBTA是位於美國波士頓的馬薩諸塞州交通局(Massachusetts Bay Transportation Authority,下稱MBTA)。

2019年初,美國運輸研究委員會舉辦了公共交通績效測量創新大賽。該挑戰賽由美國運輸研究委員會舉辦,旨在推動數據分析和傳達的方式創新,並邀請了各地運輸機構,如MBTA。MBTA的ODX可視化工具獲得了第一名。

獲獎的ODX可視化工具

這個工具是我在MBTA工作時負責設計和前端開發的。參賽時我已不在MBTA工作了,儘管”被”第一作者了,可惜沒能親臨大賽會議現場。

大賽現場的海報(照片來自另一位現場的朋友)

今天,以該這個項目為案例,來最後聊一聊可視化與公共交通的那些事。這也是這個系列的最後一篇文章,該系列其他文章請見文末。

刷卡與ODX數據

什麼是ODX數據?

在乘公交或地鐵時,我們每一次刷卡都會產生一條數據。以上車或進站刷卡為起點,以下車或出站刷卡為終點。在一定條件下,比如在刷卡下車後的車站接著又刷卡上車,則視為轉乘。

因此,ODX表示乘客一次出行中的起點、終點和轉乘點。
起點:Origin,簡稱O;
終點:Destination,簡稱D;
轉乘:Transfer,簡稱X。

下圖是我當時給MBTA規劃員做的一個快速可視化,用於研究迂迴行程(Circuitous Journey)的發生情況。其中所用的就是ODX數據。

迂迴行程分析(站點)
轉乘不在同一站點時:綠色的點為起點,折線的折點為轉乘點

ODX數據有何用處?

ODX分析是根據乘客的實際乘車行為來分析實際的出行需求,主要是回答的是乘客從哪裡上車、下車、和轉乘的問題。

在這個基礎上,其分析的問題可以具體到特定的出行行為,比如上面提到的迂迴行程分析,也可以衍生到車資定價、臨時服務等優化。

比如,對於MBTA來說,當因站點因施工關閉、增添新路線等時候,ODX分析不僅用於評估而受影響的乘客數,還用於評估因此需要投放的擺渡車輛數。

MBTA擺渡車

可見,刷卡這個動作,不單單是付錢。它提供了可供分析的數據,讓規劃員能按需做出最優決策,最終是能給乘客自己帶來更好的服務。

新加坡在公交上的海報

不刷卡就沒有ODX數據…吧?

和很多地方一樣,波士頓也沒有實行下車刷卡,所以其實下車刷卡的點是通過數據模型推算出來的。

這個模型是MBTA與MIT(MIT’s Transit Lab)合作的,專門用來推算出下車和轉乘的行為數據。下車或轉乘的數據是通過下次刷卡的數據來推算,當然其中涉及的算法和參數是非常複雜的。

我們也可以想像這種模型再精確,也是不如實際的下車刷卡數據來得真實。這也是為何MBTA的規劃員花了很多時間來檢驗ODX數據的合理性。

ODX分析令專家也頭疼?

數據驅動轉型不是想轉就能轉

正如MBTA的例子,不再局限於以人口統計或問卷採集等數據來推測需求,服務規劃開始向以分析乘客實際行為數據為驅動轉型。

然而面對海量數據,光是數據查詢就讓不少規劃員頭疼。尤其面對MBTA上千個站點和上百條線路,需要分析的場景非常多。能有一個數據查詢、分析兼可視化為一體的工具,將大大提高工作效率。

在MBTA的規劃員說:

“我已經使用ODX數據一年多了,主要是通過PostgreSQL(數據庫軟件)查詢數據。在服務規劃部門,我經常扮演’數據員(the data guy)’的角色,所以我也成了唯一一個能熟練從數據庫裡查詢ODX數據的人。
為了更了解我們ODX數據如何在復雜行為上的表現,我當初需要很多規劃員幫我測試。可是因為涉及到數據庫知識,我還是得自己來寫查詢語句。
現在我們有了這個ODX可視化工具,測試進度大大提高,因為更多人能自己探索ODX數據了。 ”

分析難,交流更難

ODX數據不僅有時間性,還有空間性,單靠抽象的語言和一行行的表格很難把問題討論清楚。所以很多實際的業務場景討論都離不開地圖。

“如果是看數據表格,以站點來統計該站的上下車次數,由於每個站點佔一行,我們很容易被誤導認為站點之前是等距的。但一旦你把這個數據放在地圖上,就會發現不是那麼回事。我相信我們開始理解如何使用這個可視化工具了。”
— — MBTA的規劃員說。

從A站到B站不僅要繞行,還要繞到河對岸去轉乘

市場現成的可視化工具也不一定能救

其實在做ODX可視化工具之前,項目也考慮過直接用其他可視化工具,比如Tableau、R Shiny。而且市面上不乏成熟的、針對公共交通規劃的可視化軟件,比如Remix。

我曾經問過ODX項目的項目經理,為什麼要自己開發。她說,對於小的公交企業,比如只有十幾條線路,可能可以使用那些軟件。但對於MBTA來說,不僅有上百條線路,數據本身也很複雜。

MBTA路線分佈(黃色為公交,其他顏色為地鐵或軌車)

比如,現實中有綜合性站台(公交和地鐵的混合站台),對於乘客來說是同一個車站,但公交站點和地鐵站台分別有各自的站台編號。並且綜合站臺本身還有一個自己的編號,與公交地鐵站台為層級關係的。

在概念溝通上,通常使用的是母編號(綜合站台的編號),但車輛出行計劃的數據只與子編號關聯(公交站台,或地鐵站台)。

Ruggles地鐵站下的公交站台

目前市面上的軟件,還不能處理這類複雜或極端的情況。所以這個項目不是為了做而做,市場現成工具始終有其局限性,自主開發有其必要性。

MBTA案例:ODX可視化工具

ODX可視化工具是對ODX數據進行可視化的網頁工具。服務規劃員可以選擇站點、路線或區域,獲知任意時間段或支付方式下的乘客在此上車、下車和轉乘的情況。

並且由於起點終點數據成對,用戶還可以深入了解在此上車的乘客去了哪兒、在此下車的乘客又是從哪兒來。

由於刷卡數據是以站點為記錄,所以本質上,選擇路線則是選擇路線上的所有站點,選擇區域是選擇該區域所有站點。

三角形表示站點,三圖依次表示一組站點、在一條線路上的站點、在一個區域裡的站點

在結果分析上,首先是提供了所選站點的基本使用情況。以下圖為例,條形圖分別顯示了有多少乘客使用所選站點為起點、終點、轉乘點。

用戶可以點擊使用情況旁的下載按鈕來下載對應的數據報告,也可以點擊乘客去向按鈕(”where people go”, “where people come from”)做深入的OD分析。

OD分析不僅提供站點或路線的分析,比如在這些站點上車的乘客有多少是在哪些站點下車、有多少是在哪裡上車、又是從哪條線路轉乘到哪條線路等。

同時,OD分析也提供區域分析,比如乘客是從哪一塊區域乘車到哪一區域。

ODX區域分析可視化

區域的劃分有多種,比如大家熟悉的行政區域劃分,也有現在用於傳統交通規劃模型的交通分析區(Traffic analysis zone,簡稱TAZ)。當然,也可以像MBTA一樣,根據站點使用頻率來做聚類分區,MBTA在工具裡簡稱其為“Cluster”。在ODX數據的表現上,再以迂迴行程為例:

迂迴行程分析(區域):綠色區域為起點所在區域,紫色區域為終點站的區域

“在我們現在這個時代,所擁有的數據量已超過20年前的想像,大多數分析已不再使用細粒度數據(granular data)。這就是為什麼聚類(cluster)對我來說通常比站點級別的信息更有用,因為有可能涉及到無數個站點。”
— — MBTA規劃員

最後

ODX工具主要解決的是複雜數據的理解和溝通,比如準確理解數據模型、打破數據查詢和獲取的技術屏障、發現數據模型本身的應用局限等。

在我做可視化畢設和畢業論文時曾討論過這個工具,大賽后我也跟MBTA的經理再次探討過這個工具的優勢。總之,這個工具之所以能在實際應用中受歡迎,尤其是在大賽中脫穎而出,我總結為以下優勢:

1. 在交通規劃行業內,實際開始運用乘客行為數據來發現和解決業務問題。

2. 研發了ODX數據模型,通過算法解決了沒有下車刷卡記錄的數據問題。

3. 用可視化的方式解決了複雜數據的理解和溝通的難題,比如準確理解數據模型、打破數據查詢和獲取的技術屏障、發現數據模型本身的應用局限等。

ODX可視化工具所運用的是可視化都是常有的條形圖、主題圖,這些圖式都是傳統的信息圖。

查爾斯·杜賓(Baron Pierre Charles François Dupin)在1826年做的法國文盲分佈圖
約翰·斯諾(John Snow)在1854年做的倫敦霍亂爆發地圖
弗朗西斯·高爾頓(Francis Galton)於1881年為皇家地理學會會刊(Proceedings of the Royal Geographical Society)做的遊客旅行時間圖(Isochronic passage chart for travellers)

很多人覺得數據可視化是個新技術,而信息圖是個舊東西,不能相提並論,甚至好像可以跳過信息圖的學習,直接上手數據可視化。

由於技術的發展,尤其是物聯技術的發展,我們能收集到越來越精細和大量的數據。在此基礎上,數據建模、機器學習等一系列大數據分析手段應運而生。

並且,可視化的數碼化也大大促進了數據處理、前端技術與性能優化的發展。這些確實是新需求、新技術、新東西。

但從視覺傳達上來講,現在絕大多數的數據可視化設計,不管是地圖還是圖表,都是以信息圖設計範式和規範為依據。

--

--

Liuhuaying Yang
Vis It 有視沒事

Information & data visualization practitioner. portfolio: spark.go4trees.com ins:@4trees.viz