メンタルヘルス×機械学習まとめ

Kentaro Hanaki
MICIN Developers
Published in
25 min readJul 13, 2021

--

近年、精神疾患の患者数は増加し続けています。厚生労働省が3年毎に行っている患者調査を見ても、以下の図からも見られる通り精神疾患の患者数は平成11年の204万人から平成26年の392万人と、15年間でおよそ2倍に増えています。

https://www.mhlw.go.jp/file/05-Shingikai-12201000-Shakaiengokyokushougaihokenfukushibu-Kikakuka/0000108755_12.pdfより引用

また、最近ではコロナの影響もあり、自粛などによる生活の変化への不安が人々の精神状態の悪化に拍車をかけています。

一方で、近年のテクノロジーの進展は目覚ましいものがあり、認知行動療法のデジタル化などが近年国内でも取り組まれており、精神疾患の治療にIT技術を役立てようという動きも出てきています。

これらの流れを踏まえた上で、本記事では機械学習のメンタルヘルスへの応用について解説してみたいと思います。

今回の記事ではこちらのサーベイ論文を大変に参考にさせていただきました。特に、こちらの論文のテーブル1〜4にこれまでに出たメンタルヘルス×機械学習の論文が網羅されているので、更に学びたい方はこちらを見ていただければと思います。

メンタルヘルスとは?

WHOによると、メンタルヘルスとは、

Mental health is not just the absence of mental disorder. It is defined as a state of well-being in which every individual realizes his or her own potential, can cope with the normal stresses of life, can work productively and fruitfully, and is able to make a contribution to her or his community.

と定義されています。この定義によると、精神疾患にかかっていないというだけでなく、その人が力を発揮でき、生活の普通のストレスとはうまく折り合いをつけることができ、生産的に働くことができ、かつ自分の所属できるコミュニティに貢献することができる、というのが重要なようです。

ただ、これらのことを実現するのを妨げる大きな要素として精神疾患があると思うので、本記事では主に精神疾患について書いていくことになります。

精神疾患とは?

アメリカ精神医学会が発行している「精神疾患の診断と分類の手引き」の第5版によると、精神疾患は以下のように定義されています。

A mental disorder is a syndrome characterized by clinically significant disturbance in an individual’s cognition, emotion regulation, or behavior that reflects a dysfunction in the psychological, biological, or developmental processes underlying mental functioning. Mental disorders are usually associated with significant distress or disability in social, occupational, or other important activities

「精神的な機能不全に起因した、医療的に重大な認知、感情制御、行動の乱れ」というのが大雑把な日本語訳かと思います。

精神疾患の定義についてはいろいろと議論があるようで、上記の「精神疾患の診断と分類の手引き」においても版によって定義が結構変わっていたり、また精神疾患の定義について議論した論文も出ていたりするので、興味がある方は調べてみると面白いかもしれません。

精神疾患に関する統計

精神疾患については、患者数が多く、かつ治療が難しいのが特徴だと思っていて、この辺りにアメリカの精神疾患に関する様々な統計が与えられているのですが、

  • 成人の4人に1人が1年以内に何らかの精神疾患に苦しむことになる
  • 成人の10人に1人が1年以内にうつ病・双極性障害・気分変調症に苦しむことになる
  • 18–54歳までの18%は何らかの不安障害(パニック障害、強迫性障害、PTSD、全般性不安障害、恐怖症など)を持つ
  • 多くの人は複数の疾患を併発する
  • 自殺者の多くは精神疾患を持っている(多くはうつ病と薬物乱用)

という感じで、苦しんでいる人の数も、その苦しみの度合いも、大変に大きなものとなっています。なので、(大変難しい分野ではあるものの)もし機械学習を精神疾患の診断や治療に何らかの形で役立てることが出来れば大変にインパクトの大きい話になるのではないかと思っています。

何故メンタルヘルスに機械学習使いたいのか(というタイトルのポエム)

上記の通り、メンタルヘルスは改善することが出来れば非常にインパクトの大きい分野なので、いろんな手法を試すべきであり、その手法のうちの一つが機械学習である、という見方も出来るのですが、個人的にはそれ以上に「精神疾患と機械学習は相性が良いので、きっと機械学習が役に立つ」と思っています。

これはprecision medicineなどとも絡んでくるのですが、一般的に疾患というのは「個人差」が結構あって、ある人にはこの治療法がよく効くのだけれども別の人には全く効かない、というのが往々にしてあったりします。この理由の一つとしては、同じ疾患に見えるものでも実は異なる原因で起きていることがあって、異なる原因で起きているのであれば違う治療法が最適解となる、ただし精神疾患の分野では疾患の原因究明が(一部には脳が複雑過ぎるというのもあり)あまり進んでいないと言われています(例えばこちらの論文など)

一方で、機械学習はこの「個人差」を扱うのに長けています。これは、

  • 人間には追いきれない大量の特徴量を組み合わせた予測を行うことが出来る
  • クラスタリングなどを用いて、個人差の原因となっているサブグループを自動抽出することが出来る
  • 推薦システムなどを用いて、個々にあった治療法などを推薦できる

などの理由によるものです。これらの機械学習のアプローチは必ずしも疾患の原因を明らかにするものではないのですが、少なくとも「誰に何が有効か」ということに対してある程度の示唆を与えてくれるわけなので、この「個人差」に起因する部分をある程度解決してくれる、それが私が精神疾患と機械学習の相性がとても良いと思っている理由です。

メンタルヘルス × 機械学習の分類

機械学習をメンタルヘルスに応用する研究については以下のような分類が出来るかと思います。

  1. 検知への応用
  2. 予後の予測や治療への応用
  3. 公衆衛生への応用
  4. 医療行政への応用

本記事では1と2を中心に解説し、3についても軽く触れたいと思います。

検知への応用

こちらはそのまんまで、精神疾患にかかっている方を各種データから検知しようというものです。上記のサーベイ論文によるとメンタルヘルス×機械学習の論文の大半はここにカテゴライズされるので、本記事でもこの部分が一番長くなります。

検知への応用については、使用するデータの種類に応じて更に細かいクラスに分類できるかと思います。以下では、それぞれのデータの種類について代表的な論文などを紹介していきたいと思います。

脳の画像(fMRI、sMRIなど)

https://cfmriweb.ucsd.edu/Howto/3T/structure.htmlより引用

sMRI(structural MRI)は解剖学的な構造を見る技術、fMRI(functional MRI)は脳内の血流の変化を見ることで脳の活動を見る技術です。一部の精神疾患についてはこれらの脳の画像にも変化が出るので、それらを使って疾患の検知を行っている研究がいくつかあります。いくつか例を挙げると、

  • アルツハイマーの検知:sMRIの画像から大脳皮質の厚さ、脳灰白質の面積や密度を特徴量として用い、アルツハイマーの患者をAUC〜0.93程度で予測
  • うつ病のかかりやすい人の予測生理学的な研究により、側頭葉と下側帯状皮質の相互作用が強い人は自責しやすいということが知られているので、fMRIの画像からそれらの特徴量などを用いてうつ病のかかりやすさを予測

などがあります。

言語データ

https://www.colorado.edu/disabilityservices/students/note-taking-accommodationsより引用

医療における言語データとしてはEHRのフリーテキスト部分などがありますが、精神疾患においてはカウンセリングに際して臨床心理士がカウンセリングノートを作成するのでそちらを使ったり、あとは患者に文章を作成してもらってそれを分析したりします。二つほど論文を紹介します。

モバイル/センサーデータ

Technology photo created by rawpixel.com

スマホやウェアラブルなどのモバイルデバイスからとれるデータであったり、各種センサーからとれるデータを使った精神疾患の検知です。

  • スマホ、ウェアラブルデータからの成績や睡眠の質などの推定:スマホ使用歴やウェアラブルからの生体データと、大学での成績や睡眠の質の相関を調べた研究。得られた知見としては、「深夜にスマホを使用する人は睡眠の質が低く、朝使用する人は高い」、「ストレスレベルが高い人はSMSの使用頻度が低い傾向にあり、使用するとしても遅い時間に使用する傾向がある」、「就寝前に人と話す人はストレスレベル高め」、「成績が良い人はネガティブなメールを送りがち」、などいろいろ面白い
  • 子供のADHDと双極性障害の分類: 子供の双極性障害はADHDと症状が似通っているが、双極性障害については睡眠や概日リズムに障害が出やすいことが過去の研究で知られており、これらやbipolar vulnurability indexをActigraphと呼ばれるウェアラブルデバイスから取得して特徴量として用い、ADHDと双極性障害を分類する

音声データ

こちらは主に発話を録音し、それを分析して精神疾患を検知しようというものです。代表的な例としては、

  • 医師との会話データからの気分変調症とうつ病の検知:発話の平均長、発話間隔、検査対象者が話す時間の割合、声の高さ系、声の高さと大きさの揺れ(jitter and shimmer)が有効
  • 説明文からのアルツハイマー病の検知:絵画について説明をしてもらい、それを分析してアルツハイマー病を検知する。こちらの論文ではかなり詳細にどの特徴量が効いたかの解析を行っていて、意味の欠如(代名詞の多用、語彙の低下)、音声異常(周波数領域の偏り、沈黙時間の増加)、文法の欠如(時制や冠詞の欠落)、必要な情報の欠如(キーワードの欠落、前置詞の欠如)などが有効な特徴量となっていたとのこと
Cézanne, Paul — Still Life with a Curtain. こんな感じの絵を説明してもらう(多分)

などがあります。なお、アルツハイマー病などの認知症はICD-11においては精神疾患に分類されてはいないのですが、少なくとも症候群としての認知症は精神疾患に含めるべきという議論もあり、また上記の解析はアルツハイマー病以外にも適用できそうなことから、一応紹介しています。

予後の予測や治療への応用

https://www.communitypractitioner.co.uk/news/2017/10/mental-health-risk-linked-medication-during-pregnancyより引用

続いては、予後の予測や治療についてです。上にも書きましたが、一般的に疾患に対する治療の効果というのは人によって様々で、同じ治療法がある人には効いても、他の人には全く効かなかったりします。なので「個人にあった治療法を提示する」というのが非常に重要になるのですが、そこで「個人に合わせる」ということが得意な機械学習が活きてくるわけです。

こちらでは、「予後の予測」「介入・治療」「サポートグループの提示」に分けて説明をしたいと思います。

予後の予測

こちらは治療に対する予後を予測するというものです。予後の予測については様々な精神疾患(双極性障害、PTSD、うつ病、精神病など)において機械学習が使われていますが、ここでは代表的な論文を二本紹介します。

  • 抗うつ薬に対する予後の予測:人口統計的特徴量と医療的特徴量から、エスシタロプラムとノルトリプチリンという二つの抗うつ薬の予後を予測。エスシタロプラムについては寛解をAUC〜0.72程度で予測し、特に効いた特徴量は、BMI、食欲、興味の低下や活動量の減少といった症状が見られるか、不安が身体症状に現れるか、だったとのこと
  • 退院後の経過の予測:退院後に定期的に取得される、睡眠やQOLに関する構造化データ、及びHow do you feel today?という質問に対する答えを分析し、そこから自殺念慮や精神症状を検知する。構造化データを組み合わせた方が精度は良いが、上記の質問の答えだけを使ってもそこそこの精度で予測できる

介入・治療

続いては介入・治療についてです。予後の予測と近い話な気がするのですが、予後の予測では介入・治療が固定されていたのに対し、こちらは「どういう介入・治療をするのが適切か」というところに焦点が置かれています。こちらの研究としては、

  • 個人に合わせたうつ病の治療法の提示:心理的、及び生理的な状態からうつ病を予測するアルゴリズムを作成、そのモデルを元にどの状態を変えれば精神状態が改善するかを提示する
  • アルコール依存症への介入:スマホに特殊なアプリを入れて、スマホの動きや使用歴を取得。それを用いてアルコール摂取のタイミングを教師あり学習で予測する。特徴量としては、時間、動きの変化、スマホをいじる長さ、通話時間やタイピングの速度が効いたとのこと

などがあります。ちなみに、もっと安直に推薦システムを使えばいいのではないかとも思い調べてはみたのですが、推薦システムを使った研究はこちらの論文くらいしか見つかりませんでした。

ピアサポートの促進

精神疾患においては医師による介入・治療が重要なのはもちろんのこと、それと同様に同じような疾患を持つ患者やその家族のピアサポートが重要になったりします。このようなピアの推薦であったり、オンラインのサポートグループ内のコメントの監視に機械学習が使われています。

公衆衛生への応用

こちらは大規模なサンプルの中でのメンタルヘルスの状態の変化を見る研究です。例えば、現在のコロナ禍で精神状態が悪くなっている人は結構いると思うのですが、それを例えばSNSのデータなどから検証・分析するなどの研究もこちらのカテゴリーに属します。

大規模なサンプルが必要なので、使用できるデータは必然的に限られてくるのですが、大きく分けると以下のようなデータが使われています。

  • SNSデータ(Twitter)
  • EHRデータ
  • 調査や診断ツールなど

SNSの広がりにより様々な大規模解析が行えるようになったというのが研究コミュニティでは大きかったようで、SNSを使った分析として以下のようなものが行われています。

  • Twitterデータからのオピオイド鎮痛剤乱用の分析:オピオイド鎮痛剤の乱用に関するツイートを抽出し、その位置情報から州ごとのオピオイド鎮痛剤の乱用の広がりを推定。アメリカ政府が行っているオピオイド鎮痛剤乱用に関する調査と非常に強い相関を持つことを確認した
  • 悲惨な事件の後の人々のメンタルヘルス状態の変化の分析:銃乱射事件の後の人々のメンタルヘルス状態の変化を分析。単純な辞書ベースの分析に加え、問題があるツイートとそうでないツイートの分類を精緻化することで、事件が起こった市では人々のツイートが事件前と同じ状態に戻るまで時間がかかるなど、既存手法では分からなかった知見を得た

メンタルヘルス×機械学習研究に共通の問題点

最後に、メンタルヘルス×機械学習の応用において様々な研究に共通する問題点を挙げておきたいと思います。

データ量が少ない

本記事で紹介した論文をチェックいただければ分かるかと思うのですが、これらの研究で使用されているデータはO(100)くらいのものが多く、少ないものだと100例未満のものもあったりして、例えば深層学習をやろうとするとデータ量的に結構厳しいような印象を受けます。

再現性

機械学習の研究では既存研究を再現出来ないのはよくあることだと思うのですが、医療系の場合は(データがセンシティブなものが多いこともあり)公開データセットがあまり存在しない、論文で使用したデータセットが公開されていないなどの理由で、普通の機械学習の研究よりも再現するのが難しいように思います。

正解ラベルをつけるのが難しい

教師あり機械学習では正解ラベルが必要なわけですが、機械学習の文脈に限らず、精神疾患は客観的な検査などで診断するのが難しいので、正解ラベルをつけるのが難しいという問題があります。こちらについては、同じく機械学習の文脈に限らず、標準化された評価ツール(質問表など)を使って診断/正解ラベル付けすることが多いようです。

最後に

弊社では、共にAIやテクノロジーを駆使して日本の医療を良くしていく仲間たちを募集しています。フルタイム、インターンの募集要項はこちら。

フルタイム https://www.wantedly.com/projects/406812

インターン https://www.wantedly.com/projects/406820

参考文献

  1. Shatte ABR, Hutchinson DM, Teague SJ. Machine learning in mental health: a scoping review of methods and applications. Psychol Med. 2019 Jul;49(9):1426–1448.
  2. American Psychiatric Association. (2013). Diagnostic and statistical manual of mental disorders (5th ed.).
  3. Telles-Correia D, Saraiva S, Gonçalves J. Mental Disorder-The Need for an Accurate Definition. Front Psychiatry. 2018 Mar 12;9:64.
  4. Stephan KE, Bach DR, Fletcher PC, Flint J, Frank MJ, Friston KJ, Heinz A, Huys QJM, Owen MJ, Binder EB, Dayan P, Johnstone EC, Meyer-Lindenberg A, Montague PR, Schnyder U, Wang XJ, Breakspear M. Charting the landscape of priority problems in psychiatry, part 1: classification and diagnosis. Lancet Psychiatry. 2016 Jan;3(1):77–83.
  5. Doan NT, Engvig A, Zaske K, Persson K, Lund MJ, Kaufmann T, Cordova-Palomera A, Alnæs D, Moberget T, Brækhus A, Barca ML, Nordvik JE, Engedal K, Agartz I, Selbæk G, Andreassen OA, Westlye LT; Alzheimer’s Disease Neuroimaging Initiative. Distinguishing early and late brain aging from the Alzheimer’s disease spectrum: consistent morphological patterns across independent samples. Neuroimage. 2017 Sep;158:282–295.
  6. Sato JR, Moll J, Green S, Deakin JF, Thomaz CE, Zahn R. Machine learning algorithm accurately detects fMRI signature of vulnerability to major depression. Psychiatry Res. 2015 Aug 30;233(2):289–91.
  7. Green S, Lambon Ralph MA, Moll J, Deakin JF, Zahn R. Guilt-selective functional disconnection of anterior temporal and subgenual cortices in major depressive disorder. Arch Gen Psychiatry. 2012 Oct;69(10):1014–21.
  8. Oseguera O, Rinaldi A, Tuazon J, et al. Automatic Quantification of the Veracity of Suicidal Ideation in Counseling Transcripts. In: HCI International 2017 –Posters’ Extended Abstracts. Springer International Publishing 2017. 473–9.
  9. Strous RD, Koppel M, Fine J, et al. Automated characterization and identification of schizophrenia in writing. J Nerv Ment Dis2009;197:585–8.
  10. Sano A, Phillips AJ, Yu AZ, McHill AW, Taylor S, Jaques N, Czeisler CA, Klerman EB, Picard RW. Recognizing Academic Performance, Sleep Quality, Stress Level, and Mental Health using Personality Traits, Wearable Sensors and Mobile Phones. Int Conf Wearable Implant Body Sens Netw. 2015.
  11. Faedda GL, Ohashi K, Hernandez M, et al. Actigraph measures discriminate pediatric bipolar disorder from attention-deficit/hyperactivity disorder and typically developing controls. J Child Psychol Psychiatry2016;57:706–16.
  12. Indic P, Salvatore P, Maggini C, Ghidini S, Ferraro G, Baldessarini RJ, Murray G. Scaling behavior of human locomotor activity amplitude: association with bipolar disorder. PLoS One. 2011;6(5):e20650.
  13. Kliper R, Portuguese S, Weinshall D. Prosodic Analysis of Speech and the Underlying Mental State. MindCare. 2015.
  14. Fraser KC, Meltzer JA, Rudzicz F. Linguistic Features Identify Alzheimer’s Disease in Narrative Speech. J Alzheimers Dis. 2016;49(2):407–22.
  15. Iniesta R, Malki K, Maier W, Rietschel M, Mors O, Hauser J, Henigsberg N, Dernovsek MZ, Souery D, Stahl D, Dobson R, Aitchison KJ, Farmer A, Lewis CM, McGuffin P, Uher R. Combining clinical variables to optimize prediction of antidepressant treatment outcomes. J Psychiatr Res. 2016 Jul;78:94–102.
  16. Cook BL, Progovac AM, Chen P, Mullin B, Hou S, Baca-Garcia E. Novel Use of Natural Language Processing (NLP) to Predict Suicidal Ideation and Psychiatric Symptoms in a Text-Based Mental Health Intervention in Madrid. Comput Math Methods Med. 2016;2016:8708434.
  17. Yang S, Zhou P, Duan K et al. emHealth: Towards Emotion Health Through Depression Prediction and Intelligent Health Recommender System. Mobile Netw Appl. 2018; 23:216–226.
  18. Bae S, Chung T, Ferreira D, Dey AK, Suffoletto B. Mobile phone sensors and supervised machine learning to identify alcohol use events in young adults: Implications for just-in-time adaptive interventions. Addict Behav. 2018 Aug;83:42–47.
  19. Indic P, Salvatore P, Maggini C, Ghidini S, Ferraro G, et al. (2011) Scaling Behavior of Human Locomotor Activity Amplitude: Association with Bipolar Disorder. PLOS ONE. 2011;6(5): e20650.
  20. Song I, Dillon D, Goh TJ, Sung M. A Health Social Network Recommender System. In: Kinny D, Hsu JY, Governatori G, Ghose AK (eds) Agents in Principle, Agents in Practice. PRIMA 2011. Lecture Notes in Computer Science, vol 7047. Springer, Berlin, Heidelberg.
  21. Kavuluru R, Williams AG, Ramos-Morales M, Haye L, Holaday T, Cerel J. Classification of Helpful Comments on Online Suicide Watch Forums. ACM BCB. 2016 Oct;2016:32–40.
  22. Chary M, Genes N, Giraud-Carrier C, Hanson C, Nelson LS, Manini AF. Epidemiology from Tweets: Estimating Misuse of Prescription Opioids in the USA from Social Media. J Med Toxicol. 2017 Dec;13(4):278–286.
  23. Glasgow K, Fink C, Boyd-Graber JL. ‘ Our Grief is Unspeakable’: Automatically Measuring the Community Impact of a Tragedy. ICWSM Published Online First: 2014.

--

--