用顏色探索M+藏品

Rev Dan Catt
M+ Labs
Published in
8 min readSep 25, 2019
截取自M+藏品系列網頁測試版的畫面,可見使用「顏色選取器」後所得的結果。

Dan Catt是數碼工作室Micah Walter Studio的首席工程師,現與M+緊密合作,設計並建立M+公共應用程式介面(API,網址為api.mplus.org.hk),這是M+「開放取用」計劃的重要一環。M+ API支援M+藏品系列網頁測試版,讓藏品能以隨時更新的方式在網上展示。現在,開放數據集已放到M+ API上讓公眾使用。如想瀏覽及探索Dan在文中使用的顏色元數據,請到api.mplus.org.hk或github.com/mplusmuseum/collections-data。

今年初,M+在某個週末舉行了第二屆黑客松,並發佈博物館最新的開放數據,讓大眾有機會一窺究竟。

數據是很有趣的東西,多少不一,形式各異,而且其格式總是不符合你所需!數據的來源可以很不同,有些有其一貫格式,有些則沒有任何格式可言。當M+不斷整理已在其館藏和繼續新增的藏品,所得的相關數據就會進入一個數據大熔爐,需要很多人力物力去與之周旋,以從中梳理出一些邏輯和條理來。

這些奮鬥成果已在去年配合首屆黑客松的舉行,發佈於M+的開放數據集。當中的數據包括一系列核心元素,大部分早已存在的,例如作品標題、分類、媒材、製作年份及創作人等,上述只是冰山一角而已。

第二屆黑客松舉行之時,更多數據已準備好公諸於眾,例如物件尺寸、相關展覽、屬於哪個檔案等。而有些數據仍然未能納入開放數據集,原因有很多:數據因來源不一而需統一格式;還未翻譯;或者有些資料尚待進一步研究,這些資料通常是關於藝術家、創作者、日期及地點等。所有這些工作都需要時間和資源去完成,而在公開數據前,這些資料必須先整理齊備。

有一種數據特別難確定,那就是藏品及其圖像的版權,相信大家對此不會感到意外。當然,博物館有權將一幅畫掛在館內牆上,甚至把其圖片放在網上,但要將這些圖像放進開放數據集或API供人使用或展示時,情況就變得有點複雜 — — 特別是像M+這樣的當代視覺文化博物館。

顏色!

雖然圖像不能放進API內,有些數據還是可以放進去的,那就是從圖像擷取的顏色資訊。在確認圖像版權之際,其顏色資訊仍可放進API中。發佈API供大眾使用有許多最令人興奮之處,其中之一是你永遠想不到他們會如何使用這些數據創作。有一些使用顏色數據的方法,是我能夠料到的,例如用來尋找顏色相近的圖片,但可能其他人能想出更有趣的新用法。所以,儘管某些資料未能納入,但將盡量多的數據放進開放數據集是很重要的,因為這樣便能創造更多從數據中發掘新事物的機會。

將顏色數據放進系統的第一步,就是取得藏品圖像,然後透過圖像處理去計算顏色的分佈。處理過程會經過一連串步驟,每個步驟會計算每種顏色的像素數量,將類似的顏色合成一組,把圖像中數以千計的顏色減少至幾百種。下一步會再次組合類似的顏色,進一步減少顏色的數量,如此類推,直至得到一系列鮮明的顏色為止。

在這個過程中,有些圖片會濃縮到幾種截然不同的顏色,有些則有幾十種顏色。無論圖片最後的顏色數量有多少,這個數據都能告訴我們圖片原本的複雜程度。從以下例子,你就可以看到本來的圖片和最後配色比例圖的對比。

左:橫尾忠則,《新宿泥棒日記》,1965年製造,2006年重製,絲網印刷,M+,香港,© 橫尾忠則。右:作品的配色比例圖

很明顯地,左邊第一張圖是作品本身,第二張是將作品的顏色分解重組的配色圖,第三張則是第二張的簡化版,幫助電腦更容易搜尋和配對圖片,而在這簡化版內出現的顏色就是在API內「可搜尋顏色」。

顏色搜尋

搜尋顏色時,其中一個問題就是實在有太多顏色了!以下圖為例,左右兩邊都是紅色,但其實兩者有着些微差別。以電腦語言來說,左邊的顏色編號是「#FF3333」,右邊的則是「#FF3330」。

有着些微差別的紅色。

這樣一來,要在館藏中搜尋類似顏色的作品就很麻煩了。如果我們想找「#FF3333」色的作品,結果中就不會得到非常近似的「#FF3330」色。即使兩種顏色在肉眼上看來一模一樣,但對數據庫而言,兩者是截然不同的。

這時候,「可搜尋顏色」就大派用場了。系統將一張圖像分解為幾種基本顏色:紅、橙、綠等。這些顏色都是不同深淺的三原色和次色,再加上棕色和黑、白、灰三種色調。這些顏色是大部分圖像的主色,因此可以快速地將圖像分類到色譜中不同位置。

系統並沒有將圖片簡化為獨立的配色,而是把圖片中每個像素與「可搜尋顏色」對比,將像素分類到每個顏色,因此每種顏色的比例就顯而易見。例如,一張圖片可以有很多紅色,一些橙色,少許黃色,一點藍色,其他顏色就一點也沒有。

所以,我們不是在數據庫搜索「#FF3333」,而是直接說「給我所有很紅/橙/綠的圖片」,然後應當就會得到一堆想要的圖片。

很棒的是數據庫最愛是非題,而且問題的範圍可以很廣泛 — — 我們所要求的並非給我「#FF3333」那麼具體的顏色,而是問「這張圖片有紅色嗎?」,或者「這張圖片黃色的部分多於百分之十五嗎?」,甚至是「我想找所有沒有藍色的圖片」。

不過,直接搜尋預設「可搜尋顏色」以外的特定顏色還是很有用的。以「#FF3333」定義顏色是很「電腦」的方式。取而代之,我們可以將顏色拆解為較易理解的東西,例如運用RGB三原色模式,就是用數字去定義顏色。數值由0至255,代表完全沒有至最深色。如果用 RGB系統去看「#FF3333」的話,就得出以下數字。

紅:255
綠:32
藍:32

這就像食譜一樣,當大量紅色加上綠色和藍色的點綴,最後就得出鮮艷的紅色。如果多加一點藍色,顏色就會更接近粉紅或紫色;如果三個數字都是0,就會變成黑色。

現在,搜尋類似圖像有點像這樣:

用RGB三原色模式表示「#FF2020」這種紅色。

這並不是搜尋數據庫最有效的方式,也未必得出最相關的結果。

不過,改用最原始的色環效果會更好,這樣我們就能在色環上選取一點,然後搜索這一點附近範圍顏色的所有圖片。

色環上某一點生成的顏色範圍。

這就是為甚麼數據庫和API要將最常用的顏色轉為色相數值(hue value)。你不用搜尋某個深淺度的紅綠藍,API讓你直接找色環上某個範圍內的所有圖片。例如,尋找所有這種紅色30點以內的圖片。

這樣,即使不能展示藝術品或物件的圖像,人們也能透過色彩和黑白深淺來了解館藏,用有別於平常的方式探索同樣的藏品。

跟顏色玩遊戲

即使沒有圖像,參加者也在黑客松中創造了幾件色彩繽紛的作品。第一件是Team Swire Hall的作品,他們創作了一些漂亮的海報和視覺數據化圖像,展示來自不同年代的M+藏品在顏色上有何變化。

M+黑客松參加者Team Swire Hall創作的海報和視覺數據化作品。

另一個就是「碎木機」(Woodchipper),它分解圖片的顏色,再組成拼圖。若原圖有很多紅色,那麼拼圖就會有很多紅色「碎片」。如果原圖只有一點橙色,拼圖就會有幾塊橙色「碎片」。即使看不到原來的圖片,你仍可約略知道原圖的面貌。

左:橫尾忠則,《新宿泥棒日記》,1965年製造,2006年重製,絲網印刷,M+,香港, © 橫尾忠則。右:作品的「碎木機」版本。

最後,我從香港的摩天大樓取得靈感,隨機用藏品的主色生成一些大樓。大樓愈高,表示原圖上的那種顏色愈多。每件M+藏品的圖片都有自己一個小小的城市區域。

用藏品主色建成的視覺數據建築群。

以上就是M+開放數據集及API的簡介,你可以在這裏進一步了解開放數據集,或在此處用顏色探索藏品。

--

--

Rev Dan Catt
M+ Labs

Ex-Flickr, Ex-Guardian, now playing at the intersection between data, code, journalism and art.