[醫療AI]醫生與技術交流常見的六大問題

Published in

人工智慧的開發與落地

Dec 5, 2022

個人從早期H. Spectrum初次接觸醫療新創，到獲得數個Kaggle醫療AI題目競賽的銀牌與銅牌，後來加入醫療AI新創團隊，與醫生合作數十個醫療AI計畫，參與三篇醫療論文的發表，取得美國與台灣醫療AI相關專利，擔任人工智慧學校醫療專班講師，到近期擔任人工智慧學校專班的導師，常常與醫生討論醫療AI題目的可行性，此文就從技術的角度，整理最常被醫生問的六個問題:

1. XXXXX題目可以做嗎?

這是最多被問的題目，這要從目的和醫療AI的步驟討論起。

(1) 若目的是落地，AI從開發到落地有三步驟，資料收集、AI算法開發以及系統落地。因此考慮的點如下:

(i) 資料收集時，能不能收集到資料，這部分是醫療AI最重要的第一步，醫院的數位化程度高，放射科的題目就相對容易收集，而其他如跌倒偵測這種題目，就很難收集到資料，例如看過有團隊是假裝跌倒來收集資料，一來確定這是正常且完整的跌倒型態嗎? 二來是場景太少，會不會AI只是在辨識場景?

(ii) AI通常要給予正確的標記才有好的訓練結果，因此能不能正確標記十分重要，有些題目的痛點就是醫生無法正確判斷，然而這種題目要透過AI做判斷，困境往往就是無法正確的標記。曾經無意中做過一個實驗，相同的電腦斷層掃描影像，同一位醫師在不同時間點標記結果不全然相同，甚至有些疾病是肉眼無法正確判斷，若沒有正確的標記的資料，目前AI的技術很難有好的結果。

(iii) 落地時，資料來源是否能自動化取得，論文或院內計畫可以不用管這部分，但要做到落地上線，這部分無法自動化取得，須要透過人工的方式，如此會增加日常額外的工作，通常也很難落地，尤其是資料沒有跟系統連線，流程上是列印出來判讀的，幾乎都很難在醫療AI中落地。再者是上線後場景變化會不會很大? 例如跌倒偵測，這題目落地最困難的地方就是跌倒的姿勢太多，拍攝角度、背景和光影等等都會影響判斷。

(2) 若目的是論文或院內計畫，只要資料可以蒐集的到，能夠標記，即上述的(i)和(ii)，幾乎都可以做，問題是容不容易做而已，重點在資料面以及合作做AI的技術人員。

2. 要多少資料才夠? 要多少GPU才夠?

被問到資料多少才夠，我的答案一律是『資料越多越好』。以影像來說，有些變化不大又清晰的圖片，幾百張就可以訓練出不錯的模型。但有些變化大又較模糊的影像，就需要更多的照片，例如超音波就很容易受到手持角度的影響，加上超音波影像比較模糊，資料通常要比較多效果才會好。而資料永遠不嫌多。

若是影像類別的資料，要多少GPU才能Train? 價格6萬以上的電競桌機或電競筆電通常就可以做出大概的模型，GPU的記憶體至少8G以上，但要做出更準確的模型，更好的GPU效果會更好。這些是工程問題，而工程角度是，有多少資源做多少事，所以沒有『最好』或『夠』的答案，只有更好的方向。

3. XXXXX題目用YYYYY AI技術可行嗎?

通常沒有動手做之前，都不知道可不可行，都要試試看才知道能不能做。以影像為例，目前眼睛能判斷的，AI都可以做得到一定的準確度，準確度高低而已。影像越清晰的，通常準確度也越高。例如依照過去經驗，核子放射的影像辨識結果往往比超音波來的準確。但眼睛無法判斷的，也有成功的例子，重點還是在病灶是不是從影像中可以取得、資料是不是足夠等等，這部分很不一定，大多試了才知道。

這也是工程問題，沒有所謂的SOP、也沒有所謂最好的技術，只有更好的嘗試方向。人工智慧中的『智慧』往往是需要時間去累積的，常常多次嘗試之後又找到更好的解決方案。

4. 我想要做出XXXXX題目的醫療判斷的標準，AI可行嗎?

若是要成為全世界的標準，非常難。AI是根據標記結果來判斷，若標記是醫療判斷的標準，那訓練出來的模型是有機會成為醫療判斷的標準，但應該很難，我們跟醫生一起做一些國際型競賽時，醫生看到國際型競賽的標記通常都會說「標記好爛」。因此，要標記出全世界醫療判斷的標準，目前我看到的狀況是，太困難了，若要成為院內的標準，只要標記獲得院內認可，就沒問題，所以重點是標記，而不是AI技術。

5. XXXXX題目的醫療AI可以申請專利嗎? 若已經有人做過，已經申請專利，可以做嗎?

醫療AI是可以申請專利的，申請的重點在方法的流程和步驟，但AI裡面的數學本身是無法申請專利的。目前已經有不少醫療AI的相關專利，更多細節可以參閱『電腦軟體相關發明審查基準』。

即使題目相同，只要方法不同，也是可以申請專利。專利的重點是方法，不是題目。因此這種情況在進行醫療AI開發時，要注意專利迴避設計等等。

6. 醫療AI新創競賽如何簡報?

個人習慣的順序大概是痛點、如何執行以及效益:

(1) 一開始就要提到痛點: 一方面是吸引人注意，二方面若聽眾沒有相關醫療背景，常常搞不清楚為何要做這題目。其實這不只是醫療AI，任何對外的新創競賽都是如此，聽眾不一定有醫療背景，讓聽眾知道想解決什麼問題最重要。

(2) 如何執行方面只要概述，因為還沒有執行，能不能成功也不一定，主要是邏輯性和可行性。例如利用姿態判別是不是老年癡呆，大致敘述如何收集到資料、利用哪些資料做標記、利用那些姿態判別的AI算法等等，其實重點面還是在資料上。比較常見令聽者困擾的是，資料不知如何取得、看不懂要如何正確標記、以及被高估的AI技術。除此之外，若是要落地，落地的可行性也會是評估的方向之一，這部分在第一個問題中有提到。

(3) 最後會提到效益，效益部分是最容易寫，但要讓人印象深刻也最難寫的。在健保制度下，台灣醫療的效益往往就是改善醫療品質，所以十個題目九個都是改善醫療品質。若要有商業上的價值，可以提出更多的數據，這部分就需要做更多醫療商業模式的分析。

醫療AI在台灣如火如荼的發展中，所有醫學中心、不少區域醫院、以及一些地區醫院和診所都參與其中，每年的醫療科技展也都會發現更多新的題目進行中。醫療來自於一個嚴謹而封閉的領域，而AI來自於一個創新而開放的領域，兩個領域的交流不只是技術交流、更多其實是文化上的衝突，近年已經激起不少的火花，而火花如何燎原出更大的智慧醫療『產業』，也還有不少路要走。