[醫療AI]醫生與技術交流常見的六大問題

個人從早期H. Spectrum初次接觸醫療新創,到獲得數個Kaggle醫療AI題目競賽的銀牌與銅牌,後來加入醫療AI新創團隊,與醫生合作數十個醫療AI計畫,參與三篇醫療論文的發表,取得美國與台灣醫療AI相關專利,擔任人工智慧學校醫療專班講師,到近期擔任人工智慧學校專班的導師,常常與醫生討論醫療AI題目的可行性,此文就從技術的角度,整理最常被醫生問的六個問題:

1. XXXXX題目可以做嗎?

這是最多被問的題目,這要從目的和醫療AI的步驟討論起。

(1) 若目的是落地,AI從開發到落地有三步驟,資料收集、AI算法開發以及系統落地。因此考慮的點如下:

(i) 資料收集時,能不能收集到資料,這部分是醫療AI最重要的第一步,醫院的數位化程度高,放射科的題目就相對容易收集,而其他如跌倒偵測這種題目,就很難收集到資料,例如看過有團隊是假裝跌倒來收集資料,一來確定這是正常且完整的跌倒型態嗎? 二來是場景太少,會不會AI只是在辨識場景?

(ii) AI通常要給予正確的標記才有好的訓練結果,因此能不能正確標記十分重要,有些題目的痛點就是醫生無法正確判斷,然而這種題目要透過AI做判斷,困境往往就是無法正確的標記。曾經無意中做過一個實驗,相同的電腦斷層掃描影像,同一位醫師在不同時間點標記結果不全然相同,甚至有些疾病是肉眼無法正確判斷,若沒有正確的標記的資料,目前AI的技術很難有好的結果。

(iii) 落地時,資料來源是否能自動化取得,論文或院內計畫可以不用管這部分,但要做到落地上線,這部分無法自動化取得,須要透過人工的方式,如此會增加日常額外的工作,通常也很難落地,尤其是資料沒有跟系統連線,流程上是列印出來判讀的,幾乎都很難在醫療AI中落地。再者是上線後場景變化會不會很大? 例如跌倒偵測,這題目落地最困難的地方就是跌倒的姿勢太多,拍攝角度、背景和光影等等都會影響判斷。

(2) 若目的是論文或院內計畫,只要資料可以蒐集的到,能夠標記,即上述的(i)和(ii),幾乎都可以做,問題是容不容易做而已,重點在資料面以及合作做AI的技術人員。

2. 要多少資料才夠? 要多少GPU才夠?

被問到資料多少才夠,我的答案一律是『資料越多越好』。以影像來說,有些變化不大又清晰的圖片,幾百張就可以訓練出不錯的模型。但有些變化大又較模糊的影像,就需要更多的照片,例如超音波就很容易受到手持角度的影響,加上超音波影像比較模糊,資料通常要比較多效果才會好。而資料永遠不嫌多。

若是影像類別的資料,要多少GPU才能Train? 價格6萬以上的電競桌機或電競筆電通常就可以做出大概的模型,GPU的記憶體至少8G以上,但要做出更準確的模型,更好的GPU效果會更好。這些是工程問題,而工程角度是,有多少資源做多少事,所以沒有『最好』或『夠』的答案,只有更好的方向。

3. XXXXX題目用YYYYY AI技術可行嗎?

通常沒有動手做之前,都不知道可不可行,都要試試看才知道能不能做。以影像為例,目前眼睛能判斷的,AI都可以做得到一定的準確度,準確度高低而已。影像越清晰的,通常準確度也越高。例如依照過去經驗,核子放射的影像辨識結果往往比超音波來的準確。但眼睛無法判斷的,也有成功的例子,重點還是在病灶是不是從影像中可以取得、資料是不是足夠等等,這部分很不一定,大多試了才知道。

這也是工程問題,沒有所謂的SOP、也沒有所謂最好的技術,只有更好的嘗試方向。人工智慧中的『智慧』往往是需要時間去累積的,常常多次嘗試之後又找到更好的解決方案。

4. 我想要做出XXXXX題目的醫療判斷的標準,AI可行嗎?

若是要成為全世界的標準,非常難。AI是根據標記結果來判斷,若標記是醫療判斷的標準,那訓練出來的模型是有機會成為醫療判斷的標準,但應該很難,我們跟醫生一起做一些國際型競賽時,醫生看到國際型競賽的標記通常都會說「標記好爛」。因此,要標記出全世界醫療判斷的標準,目前我看到的狀況是,太困難了,若要成為院內的標準,只要標記獲得院內認可,就沒問題,所以重點是標記,而不是AI技術。

5. XXXXX題目的醫療AI可以申請專利嗎? 若已經有人做過,已經申請專利,可以做嗎?

醫療AI是可以申請專利的,申請的重點在方法的流程和步驟,但AI裡面的數學本身是無法申請專利的。目前已經有不少醫療AI的相關專利,更多細節可以參閱『電腦軟體相關發明審查基準』

即使題目相同,只要方法不同,也是可以申請專利專利的重點是方法,不是題目。因此這種情況在進行醫療AI開發時,要注意專利迴避設計等等。

6. 醫療AI新創競賽如何簡報?

個人習慣的順序大概是痛點、如何執行以及效益:

(1) 一開始就要提到痛點: 一方面是吸引人注意,二方面若聽眾沒有相關醫療背景,常常搞不清楚為何要做這題目。其實這不只是醫療AI,任何對外的新創競賽都是如此,聽眾不一定有醫療背景,讓聽眾知道想解決什麼問題最重要

(2) 如何執行方面只要概述,因為還沒有執行,能不能成功也不一定,主要是邏輯性和可行性。例如利用姿態判別是不是老年癡呆,大致敘述如何收集到資料、利用哪些資料做標記、利用那些姿態判別的AI算法等等,其實重點面還是在資料上。比較常見令聽者困擾的是,資料不知如何取得、看不懂要如何正確標記、以及被高估的AI技術。除此之外,若是要落地,落地的可行性也會是評估的方向之一,這部分在第一個問題中有提到。

(3) 最後會提到效益,效益部分是最容易寫,但要讓人印象深刻也最難寫的。在健保制度下,台灣醫療的效益往往就是改善醫療品質,所以十個題目九個都是改善醫療品質。若要有商業上的價值,可以提出更多的數據,這部分就需要做更多醫療商業模式的分析。

醫療AI在台灣如火如荼的發展中,所有醫學中心、不少區域醫院、以及一些地區醫院和診所都參與其中,每年的醫療科技展也都會發現更多新的題目進行中。醫療來自於一個嚴謹而封閉的領域,而AI來自於一個創新而開放的領域,兩個領域的交流不只是技術交流、更多其實是文化上的衝突,近年已經激起不少的火花,而火花如何燎原出更大的智慧醫療『產業』,也還有不少路要走。

--

--