X-Ray Vision — использование Ocean Protocol в отрасли здравоохранения

Эта публикация посвящена использованию децентрализованных решений для работы с данными на базе Ocean Protocol в отрасли здравоохранения. Ее целью является содействие обсуждению возможностей Ocean Protocol в сфере совместного доступа к данным и разработки отраслевых способов применения ИИ.

Чтобы узнать больше об организации работы с данными на базе Ocean Protocol, ознакомьтесь со следующими публикациями: «Проект Manta Ray — анализ и обработка данных на базе Ocean Protocol» и «Организация работы с данными на базе Ocean Protocol»).

Рисунок 1. Результаты определения затемнения легкого с помощью технологии глубокого обучения

I. Современное здравоохранение: испытание трудностями?

«Забыта, отвержена и встревожена», — вот чувства, которые я испытала в ожидании своего диагноза, из-за чего стала чувствовать себя еще хуже. Однако это ожидание также заставило меня осознать свою острую внутреннюю потребность в излечении и получении заботы от других, как раз того, что должно обеспечивать современное здравоохранение — медицинскую помощь и человеческую заботу!

Так как в каком же состоянии находится современное здравоохранение?

С точки зрения помощи оно развивается семимильными шагами. От высокоэффективной диагностики до удаленной медицины современные технологии позволяют нам жить дольше и при этом быть здоровее. А вот что касается заботы о пациентах, то тут все обстоит не так хорошо. Недостаточный уровень человеческого общения и низкий уровень услуг приводят к недовольству потребителей, создавая возможности на мировом рынке (объем которого в 2019 г. составит 7 трлн евро) и способствуя изменению отрасли. Однако по мере этих изменений возникает ряд новых проблем. Давайте взглянем на них.

Согласно прогнозам, к 2025 г. объем данных, генерируемых отраслью здравоохранения, составит 9% от общего количества данных в мире (≈ 17 зеттабайт).

Каждый день в отрасли здравоохранения создается большой объем данных (внутренних и внешних данных, данных физической деятельности и лабораторных испытаний, данных клинической диагностики и страховых компаний), которые могут использоваться ИИ для создания ценности. Однако эти данные настолько фрагментированы между различными сферами, что это ограничивает использование ИИ и развитие индивидуализированной медицины.

В странах с развитыми цифровыми технологиями электронные медицинские карты активно используются врачами/больницами и хранятся в централизованных базах данных. Однако эти системы подвержены взломам и не защищают потребителей от киберпреступников.

В США ежегодный ущерб от мошенничества в сфере здравоохранения составляет более 100 млрд долл.

В целом мы видим, что трансформация здравоохранения уже идет полным ходом, и большие данные могут сыграть большую роль в этом. Однако недостаток интеграции данных и возможностей применения ИИ, а также низкий уровень безопасности системы сдерживают появление сверхнадежного и высокодоступного сервиса в этой сфере. Системе требуются инновационные решения.

II. Как Ocean Protocol может помочь трансформировать систему здравоохранения?

Ocean Protocol открывает совершенно новые перспективы, при которых управление здравоохранением может гармонично сосуществовать с большими данными.

  • Во-первых, внедрение распределенного реестра Ocean Protocol позволит медицинским учреждениям безопасно хранить данные пациентов в блокчейнах с контролируемым доступом.
  • Во-вторых, решения на базе смарт-контрактов Ocean Protocol могут помочь потребителям создать свою собственную сеть уполномоченных участников и контролировать доступ к своим данным с помощью ключей шифрования.
  • В третьих, организация работы с данными на базе Ocean Protocol в рамках проекта Manta Ray позволит использовать интегрированные данные и осуществлять децентрализованные вычисления с помощью ИИ с целью улучшения управляемых данными приложений.
Рисунок 2. Рентгеновское зрение (изображение JarJarDrinks с сайта Imgur)

Чтобы обрисовать наши перспективы и продемонстрировать потенциал использования Manta Ray для удовлетворения текущих потребностей, мы разработали X-Ray Vision — вариант использования протокола для медицинской диагностики, включающий два модуля: 1) визуализацию медицинских снимков; 2) выявление заболевания.

Медицинская диагностика X-Ray Vision

В качестве примера для данного случая мы использовали пневмонию — инфекционное заболевание легких. Оно является наиболее частым осложнением неотложной хирургической помощи и уносит больше всего жизней маленьких детей (1,4 млн в год). В настоящее время лучшим методом диагностики пневмонии является рентгенография органов грудной клетки. Визуальным признаком пневмонии является затемнение легкого, которое на рентгеновских снимках проявляется белым цветом (Рисунок 3 слева).

Рисунок 3. Рентгенография органов грудной клетки с затемнениями в рамках

О пневмонии, выявленной с помощью рентгенографии, рентгенологи должны сообщать терапевтам. Однако мировой дефицит рентгенологов серьезно влияет на эффективность диагностики. Кроме того, снимки органов грудной клетки хранятся в формате DICOM. Визуализация снимка DICOM и извлечение метаданных занимают много времени и требуют наличия отдельной рабочей станции/стороннего программного обеспечения.

Модуль 1: визуализация медицинских снимков

Рисунок 4. X-Ray Vision, модуль I: веб-приложение для анализа и визуализации медицинских снимков

Чтобы повысить эффективность диагностики с помощью снимков и связать ее с процессом обработки и анализа данных, мы разработали интерактивное веб-приложение, использующее язык Python и среду Dash (Рисунок 4, https://x-ray-vision.herokuapp.com), которое выступает в качестве:

  • платформы для поиска и просмотра медицинских снимков;
  • интерактивного инструмента для загрузки файлов DICOM, визуализации снимков и извлечения метаданных медицинских снимков (рентгеновских, КТ и МРТ);
  • пакета для местной обработки конфиденциальных данных (с инструкцией можно ознакомиться на GitHub).

Модуль 2: выявление заболевания

После этого мы разработали модель выявления пневмонии, которая использует снимки органов грудной клетки в качестве входных данных и отмечает затемнение легких на снимке.

1) Модель глубокого обучения

Мы произвели перенос обучения, используя новейшую модель машинного распознавания образов — Mask-RCNN, предварительно обученную с помощью набора данных CoCo. Mask R-CNN (Рисунок 5) состоит из четырех модулей. Первые два модуля извлекают элементы изображения и генерируют предложения (областей, вероятно содержащих объект). На основании этих предложений два следующих модуля генерируют граничные рамки и маски для каждого экземпляра объекта (Таблица 1).

Рисунок 5. Интерпретация сцен модели MASK-RCNN (адаптированных из Microsoft CoCo)
Таблица 1. Модули Mask R-CNN высокого уровня

2) Обучение и прогнозирование

  • пСреда обучения: AMI для глубокого обучения на экземпляре P3 в AWS (1 графический процессор и 16 Гбайт памяти).
  • Данные: полный набор данных из 26 684 снимков органов грудной клетки (из клинического центра Национальных институтов здравоохранения и конкурса компании Kaggle и Радиологического общества Северной Америки).
  • Эксперименты: в 1-м эксперименте «Малые данные + малая модель» мы используем базовую модель и выборочный набор данных. Во 2-м эксперименте «Большие данные + большая модель» мы обучили модель Mask-RCNN с помощью полного набора данных. Процесс обучения и гиперпараметры модели описаны в Таблице 2.
Таблица 2. Обзор обучения и проверка результатов
  • Прогнозирование: время прогнозирования для каждого снимка составило 0,26 с. На образце указан результат прогнозирования (Рисунок 1 слева). Выделенные области на снимке указывают на маски сегментации, граничные рамки и вероятность того, что экземпляр является областью затемнения.
  • Посмотрите на «блокноты» Jupyter для пошагового представления процессов обучения и прогнозирования.

Регистрация процесса в качестве активов

Чтобы X-Ray Vision можно было использовать на платформе для торговли данными, мы зарегистрировали его элементы в качестве активов с помощью «блокнота» Manta Ray под названием Publish and Register (datascience.oceanprotocol.com). В результате было создано четыре типа активов:

  • упорядоченные наборы данных (выборочный набор данных и полный набор данных), которыми могут пользоваться и изменять специалисты по работе с данными;
  • сценарии эталонных процессов (четыре «блокнота» Jupyter), в которых могут принимать участие (в том числе посредством их дополнения) специалисты по работе с данными;
  • весы обученных моделей (базовая и улучшенная модели), чтобы специалисты по работе с данными могли сэкономить время/деньги и получить модели с лучшей производительностью;
  • веб-инструмент для специалистов по работе с данными / докторов, чтобы те могли производить визуализацию медицинских снимков и анализ метаданных.

Каждый актив представлен идентификатором (DID), регистрируемым в смарт-контракте, и документом DID (DDO), который хранится в базе данных Aquarius. URL-адреса активов шифруются при публикации. Системы контроля происхождения активов могут отслеживать вносимые в активы изменения, а также его источник и движение. Исторические данные об активах могут использоваться для подтверждения их достоверности и оценки.

III. В погоне за заботой и решением проблем

Подводя итог, можно сказать, что X-Ray Vision может помочь поставщикам данных получить контроль над ними, ускорить предоставление услуг ИИ, повысить продуктивность докторов и трансформировать здравоохранение с целью построения эффективной экосистемы, характеризующейся высоким уровнем знаний, безопасности и заботы о пациентах.

Как использование децентрализованных решений для работы с данными на базе Ocean Protocol может помочь улучшить экспертные знания и расширить области применения ИИ в других отраслях? Поделитесь своими идеями и комментариями с нами в Twitter, Telegram, LinkedIn, Reddit или Gitter.


Благодарим




Мы надеемся, что вы готовы узнать еще больше — заходите на Dev-Ocean, чтобы разобраться, над чем мы работаем, а все технические вопросы присылайте в наш чат Gitter.

Подписывайтесь на аккаунты Ocean Protocol в Twitter, Telegram, LinkedIn, Reddit, GitHub и на рассылку, чтобы быть в курсе обновлений и объявлений по проекту.