[腦機介面筆記]大腦視覺與事件誘發電位P300
北科大 劉益宏教授 — 腦機介面上課筆記+網路資料搜尋
聲明:本次內容為 北醫大 曾祥非 教授 上課內容的筆記
目錄:
- 視覺
- 事件誘發電位
人類的視覺
從一起車禍說起….
在2016年五月的佛羅里達州,一輛紅色的特斯拉自動駕駛以時速74英里撞上了一台違規左轉的卡車,電動車從卡車底下穿過車頂被削開,導致車主當場死亡。
這場事件如果從我們人類的角度可能很難想像,究竟為什麼一輛這麼清楚明顯的卡車沒有辦法被Tesla的電動車辨識,明明對人類輕而易舉的事情為什麼對電腦而言如此困難?
一般來說不管是什麼樣的電腦想要清楚的看到外面的景象並理解發生什麼事,都會經過以下流程(參考資料:電腦視覺 流程)
1.影像輸入 (Image Input)
2.影像前處理 (Image preprocessing)
3.影像理解 (Image understanding)
4.電腦視覺產品 (Result)
而這一次的車禍特斯拉宣稱:「車禍的原因是因為自駕車的影像理解環節出了意外,不小心把卡車理解為天空」,因此自駕車沒有做出任何減速的行為,筆直地撞上了違規的卡車。
這樣看起來人類的視覺還是電腦好太多了?
看到這裡也許你會覺得「看起來人類的視覺還是比較優秀」,人類在演化的過程中為了滿足各生活裡各式各樣的需求進化出了許許多多的功能,其中也有好有壞。好的部分讓我們得以存活下來,我們可以看到被草遮擋住的獅子老虎,能透過顏色分辨哪些事可以吃的果實哪些是有毒的,壞的部分像是我們看到的諸多錯覺,有些可能無傷大雅
其他有趣的錯覺們(空間與距離)
有些則有可能會釀成意外(底下是錯覺造成的飛機失事)
說了那麼多差不多該進入今天的主題了:
人是如何看到外部世界的呢?
人類的視覺其實跟電腦的處理過程非常的相似,我們一樣也需要一個影像輸入裝置(眼球)跟一個影像處理裝置(大腦)
當光線從我們眼球進入,經過眼角膜然後通過瞳孔透過水晶體調節最後成像在視網膜上,而當光照射在視網膜時會被轉化為電訊號,最後透過視神經將方才所轉換過的電訊號傳輸到我們的大腦做更近一步的處理。
(參考資料:視覺系統)
- 眼睛中的傳導過程
💡補充:眼盲 vs 腦盲 人類看到外部世界的過程不僅僅是透過我們的眼睛,更多時候其實是仰賴我們的大腦處理從眼球轉化過的電訊號,以電腦作為類比的話我們的眼睛就像是鏡頭,電腦收到來自鏡頭的影像後還要進一步做輪廓判斷、顏色、動態的處理才能夠全然的理解外面的世界。 所以看不到當然也分為兩種,一種是眼睛看不到的另外一種則是大腦無法解讀,這裡分享一個很奇特的個案:雖然無法看到外面景色,但是可以從事運動活動的陳靖鎧一案
大腦 (參考資料:視覺路徑)
接著,從眼睛接收到的視覺訊號會透過視神經傳輸到外側膝狀體(LGN),我們的視覺在這邊會先做一次低解析度的處理並作為視覺訊息的中轉站,把處理過的視覺訊息轉傳給我們的V1、V5
- 神經傳導過程
💡補充:看見幽靈?這裡的神經傳導過程有一個非常有意思的地方,我們在還沒完全看清楚東西的輪廓以前,視覺訊號就已經傳輸到杏仁核以及我們的V5腦區,這兩個腦區分別是掌管恐懼與看運動中的物體,科學家目前推測也許有些人看到的鬼影就來自於看到黑暗中快速移動的物體,所以下次如果真的撞鬼了,記得看仔細一點說不定只是一隻趕場的小老鼠🐭喔。
- 視覺皮層(v1~v5腦區)
v1 : 又稱「初級視覺皮質層」。接受來自LGN傳過來的視覺訊號,會把接收到視覺訊號分成「空間訊號」、「內容訊號」,主要處理方向、輪廓等視覺。
v2 : 主要的功能為圖案辨識
v3 : 形狀
v4 : 顏色和形狀
v5 : 即圖上標示的 “MT (Middle Temporal)”負責處理動態內容,如果這個腦區受傷從此以後看到的景象都會是靜態的
其中因為v2、v4腦區都在腹側(ventral),因此這兩個腦區又合稱ventral pathway,而v3、v5都在背側所以又稱dorsal pathway,如圖所示
事件誘發電位
(參考資料 : 事件相關電位)
What is “事件誘發電位(ERP,Event-related potential)” ?
當我們的身體受到來自不同的刺激時,大腦會在相應的地區產生反應,這其中也包括了我們看什麼、聽到什麼、聞到什麼或摸到什麼,科學家可以透過該腦區電位變化來進一步的推斷什麼樣的刺激與什麼樣的腦區功能有關。
上一篇文章中我們有提到腦波不外乎就是大腦裡面的電位變化,
而事件誘發電位最典型的就是 P300
”P” 代表的是Positive正的意思
“300” 則代表300毫秒
腦波測量的邏輯
讓我們來想像一下假設今天想要測量擅長做數學跟不擅長做數學題目的人他們的腦區究竟有什麼不同我們應該怎麼設計實驗呢?是只需分別收取擅長的受試者與不擅長的就可以了嗎?
當然這個做法有可能量測得出這兩者之間的差異,但很顯然我們的實驗效果可能會不太理想,因為我們再收取腦波時兩人皆無明顯或特定的活動,所以我們最後收取到的很有可能只是邏輯能力很強跟邏輯能力普通在放空時的腦區同時還會有很多雜訊。
那具體的量測實驗應該如何設計呢?
首先我們需要先了解做數學題目時可能會讓大腦做哪些處理
但如果實驗只做到這裡,我們後續再研究數據時會發現我們的大腦腦區就像放煙火一樣,幾乎每個腦區都是亮的,然後我們依然找不到擅長數學與不擅長數學的人腦區究竟有什麼差異。
於是我們需要找到另外一個對照組,但這一組的腦區必須沒有用數學腦區
最後我們才會得到像下面這張圖一樣清楚的腦區分佈
心得
每次聽完曾祥非老師的課後總會有一種恍然大悟的感覺,但由於自己的記憶力實在真的不怎麼樣,所以這次完整的把上課內容記錄下來了,方便自己日後觀看也可以推坑學弟妹去北醫修課XD
老師開場就以人類視覺與現今的機器視覺是如何不同來開場,如果有用過OpenCV跟一些機器學習來判斷外部景象的人可能會格外有感,在電腦中就連要判斷一顆球都必須要專門的演算法來處理更不用說判斷人臉了,許多我們看似非常簡單的工作其實背後的過程都非常複雜
當然我還是相信人類的科技樹總有一天會長到那裡的,畢竟在短短的20年內科技就能為我們的生活帶來這麼巨大的變化,也繼續期許有一天能為這個領域帶來一些貢獻(夢話XD)
其他參考文章: