Искусственный интеллект в диагностике заболеваний глаз

DeepLearning технологияОфтальмология находится на пороге революции в области скрининга, диагностики и лечения глазных заболеваний, и эту революцию возглавляет компьютерная технология, известная как «Deep learning»(DL),имеющая все шансы на изменение концепции офтальмологической практики. DL является молодым и наиболее быстро растущим направлением в области машинного обучения, посредством которого анализируются обширные базы данных и сравниваются с условным эталоном.Технология DL используется в таких областях, как беспилотные автомобили, прогнозирование действий в настольных играх (например, шахматы), в социальных сетях для идентификации объектов и людей на фото и видео, а также в основе разработки «истинного» искусственного интеллекта. 

В своей повседневной диагностической практике офтальмологи полагаются на распознавание образов посредством прямой или косвенной визуализации глаза и окружающих его структур. Большинство диагностических технологий в офтальмологии предоставляют клиницисту дополнительную информацию посредством цифрового представления этих же структур. Эта зависимость от изображений делает область офтальмологии идеально подходящей для использования алгоритмов DL. Внедрение DL-алгоритмов в практику офтальмологии уже началось и может потенциально изменить фундаментальный тип работы, выполняемой офтальмологами, и есть все основания полагать, что компьютерный интеллект сыграет важную роль в скрининге и диагностике заболеваний глаз в ближайшие годы. Такие технологические достижения могут привести к тому, что человеческие ресурсы будут сосредоточены на непосредственных взаимодействиях между клиницистом и пациентом, таких как обсуждение диагноза, прогноза заболевания и вариантов лечения. 

Технические аспекты глубокого обучения 

Существует несколько терминов, обычно связанных с компьютерными методами, которые касаются цифрового анализа и сценариев принятия решений, включая оценку медицинских изображений. 

Компьютерная диагностика относится к подходам, в которых конкретные клинические признаки, связанные с заболеванием, извлекаются с помощью специально разработанных фильтров обработки изображений. Термин «машинное обучение» обычно относится к любому методу классификации моделей (контролируемой или неконтролируемой), позволяющему определить отличия от базового паттерна (контрольные данные). DL по большей части относится к схемам машинного обучения, в которых используются сверточные нейронные сети (СНС). В таких сетях используется банк фильтров для обработки изображений, позволяющих отделять варианты изображений, которые сеть считает показательными с точки зрения наличия патологических признаков (биомаркеров заболеваний), данный механизм также лежит в основе процесса «обучения», который является неотъемлемой частью методов классификации образцов.

Наконец, термин «искусственный интеллект» (AI) в общем смысле относится к любой системе, основанной на машинном обучении, которая способна изучать новые шаблоны и функции неконтролируемым образом, когда вмешательство со стороны третьей стороны (обычно людей) не требуется. 

Основным недостатком реального применения СНС на первых этапах его развития было банальное отсутствие вычислительной мощности. Рост производительности графических процессоров, значительно опережающий вычислительные возможности центральных процессоров (ЦП), сделал возможности СНС в обучении гораздо более глубокими, мощными и эффективными по времени. Такие глубокие нейронные сети в настоящее время обычно называют DL-решениями и включают такие примеры, как GoogLeNet, VGG и SegNet. Эти решения смогли продемонстрировать большие перспективы в обобщении содержания конкретных изображений, а также в промышленном анализе, как это реализовано в алгоритмах, строящих рекомендации в системе Netflix. В последние годы было произведено много попыток оценить возможности применения подобных систем для медицинских целей, включая анализ биомедицинских изображений. 

Существующие сегодня DL-решения для анализа биомедицинских изображений подразделяются на две основные группы: 

  • DL-решения для изображений и связанных с ними условий (диагноз, стадия заболевания и т.д.), обычно называемые методами классификаций изображений. 
  • Сети для изображений и связанных с ними масками контрольных данных (черно-белые изображения), в которых патологические состояния, связанные с заболеванием, определяются вручную, что обычно называют методом семантической сегментации. 

Исследования DL в офтальмологии активно развиваются и вполне могут стать частью повседневной клинической практики в относительно близком будущем. Подобно тому, как и электрокардиограф может обеспечить специалиста относительно точным считыванием электрических потенциалов сердца, DL-алгоритмы уже сегодня предлагаются рядом частных компаний, занимающихся скринингом заболеваний сетчатки, включая диабетическую ретинопатию и возрастную макулярную дегенерацию. Предполагается, что в свое время алгоритмы DL могут быть включены во многие офтальмологические диагностические приборы. 

Алгоритмы

Катаракта 

Показательное исследование GaoX. с соавт., сфокусированное на переднем отрезке глаза, продемонстрировало значимую способность DL классифицировать ядерную катаракту на снимках оптических срезов, полученных с щелевой лампы, по классификационной системе Wisconsin. При этом средняя абсолютная погрешность составляла 0,304, а интегральная погрешность классификации ≤1,0 встречалась в 99%,что превосходило другие опубликованные в литературе автоматизированные методы классификации катаракты. DL также применялся к изображениям щелевой лампы для классификации катаракты в педиатрической практике. Алгоритм СНС имел высокую чувствительность и специфичность для классификации катаракты, определения степени ее плотности и локализации в хрусталике патологических участков в сравнении с данными, полученными от офтальмологов на рутинном педиатрическом осмотре. 

Глаукома 

Исследования в области применения DL для диагностики глаукомы проводились на основе результатов различных приборов, включая цифровые изображения диска зрительного нерва (ДЗН), оптическую когерентную томографию (OКT) и поля зрения. При этом клиническая оценка ДЗН включала определение соотношения диаметра ДЗН к экскавации, оценку фокальных изменений нейроретинального пояска и перипапиллярного слоя нервных волокон, а также наличие кровоизлияний в ДЗН и морфометрических изменений сосудов сетчатки. Для разработки алгоритма диагностики глаукоматозного ДЗН также был использован СНС, при клинической оценке которого на двух отдельных базах данных площадь под ROC-кривой (AUC) составляла 0,831 и 0,878. 

В настоящее время диагностика глаукомы во многом базируется на анализе параметров ОКТ диска зрительного нерва. Гибридный DL-метод с использованием единичных широкоугольных ОКТ-сканов успешно отличал здоровых пациентов от пациентов с ранними признаками глаукомы, создав карту вероятности, которая была достоверной на 93,1% по сравнению с экспертной диагностикой глаукомы. Другие исследования продемонстрировали полезность DL для сегментации изображений ОКТ головки зрительного нерва, включая точную идентификацию слоя нервных волокон сетчатки (точность 0,84±0,03). DL также успешно решило задачу оценки полей зрения, идентифицируя и описывая дефектные предпериметрические глаукоматозные изменения (в соответствии с критериями Андерсона–Пателлы) наHumphrey FieldAnalyzer30-2 (Meditec,Дублин, Калифорния). Глубокая нейронная сеть с обратной связью имела AUC 92,6% (95%, доверительный интервал 89,8%–95,4%), что превосходило другие методы машинного обучения. 

Болезни сетчатки 

Результаты исследований, связанных с возрастной макулярной дегенерацией (ВМД) и диабетической ретинопатией (ДР), продемонстрировали высокую ценность DL в скрининге и диагностике данных заболеваний. В рамках исследования по ВМД использовались глубокие СНС, через которые была пропущена база из 130000 верифицированных ретинальными специалистами цветных фундус фотографий. Снимки классифицировались на не имеющие патологии / с начальными изменениями (1 и 2 стадии по классификации AREDS) и прогрессирующей / развитой стадиями (3 и 4 стадии по классификации AREDS). Прогрессирующая / развитая стадии при анализе были определены и рассматривались как референтная ВМД. 

Точность анализа DL варьировала от 88,4%±0,5% до 91,6±0,1%, а AUC – в пределах от 0,94-0,96.DL также применялось для обнаружения ВМД на ОКТ-изображениях, при этом использовался подход DL с применением TensorFlow (Google Inc., MountainView, Калифорния) и базы данных 1,2 миллиона изображений. «Обученная» программа в дальнейшем была протестирована на отдельной выборке из 50 здоровых контрольных снимках и 50 с верифицированной неоваскулярной ВМД, продемонстрировав 100% точность идентификации. 

Первоначальные исследования в области скрининга ДР были направлены на машинное выявление специфических особенностей заболевания, таких как микроаневризмы, твердые экссудаты и кровоизлияния. В последующем в литературе были описаны работы, демонстрирующие возможности алгоритмов DL в идентификации ДР без явных определяющих признаков заболевания. Недавнее исследование с использованием базы данных 75137 изображений глазного дна, на которых разрабатывался и обучался алгоритм DL, позволило отличить здоровые снимки от тех, которые были верифицированы специалистами как имеющие признаки ДР, при этом AUC составляла 0,97, достигая чувствительности 94% и специфичности 95%. Еще в одном недавнем исследовании была описана несколько более специфичная оценка ДР. Данное исследование, проводилось компанией Google Inc.,в рамках которого был разработан алгоритм, использующий СНС для определения референтной ДР, которая дополнительно могла включать твердые экссудаты в области макулы в пределах 1 диаметра ДЗН. Модель обучалась на двух отдельных наборах данных, достигая AUC 0,991 (95%, доверительный интервал 0,988-0,993) и 0,990 (95%, доверительный интервал 0,966–0,995). По результатам исследования были определены две точки отсечения, в зависимости от использования которых чувствительность варьировала от 87,0 до 97,5%, а специфичность – от 93,4 до 98,5%. DL также применялся для идентификации деталей и их структурирования в виде сегментации составляющих сетчатки на снимках ОКТ: СНС для идентификации интраретинальной жидкости (коэффициент перекрестной проверки Dice0. 911). 

Кроме того, DL был использован для улучшения качества сегментации при диабетическом макулярном отеке (ДМО) и ВМД, а также для точного обнаружения и количественной оценки объема жидкости. Так, DL успешно детектировал внутриретинальную жидкость со средним AUC 0,94 (диапазон 0,91–0,97) и субретинальную жидкость с AUC 0,92 (диапазон 0,86-0,98). 

Расширенное глубокое обучение 

В одной из недавних работ были исследованы возможность и потенциал множественного выявления заболеваний с использованием DL. В частности, был разработан и валидирован алгоритм DL для обнаружения ДР, возможной глаукомы и ВМД с использованием изображений глазного дна популяции пациентов, страдающих диабетом. Референтная ДР была определена как умеренная непролиферативная диабетическая ретинопатия (НДР) или выше, ДМО (наличие твердых экссудатов) или неградируемое ненормальное изображение.

Угрожающая зрению ретинопатия была определена в промежуток между НДР и пролиферативной ДР. Возможная глаукома определялась алгоритмом, если обнаруживалось соотношение диаметр ДЗН / экскавация ≥0,8, при фокальных изменениях нейроретинального ободка или слоя нервных волокон сетчатки, а также при обнаружении кровоизлияний в ДЗН. Алгоритм обеспечивал высокую чувствительность и специфичность для обнаружения референтной ДР (чувствительность 90,5 (95%, ДИ 87,3–93,0%); специфичность 91,6% (95%, ДИ 91,0– 92,2%), угрожающей зрению ДР (чувствительность 100% (95%, ДИ 94,1–100%); специфичность 91,1% (95%, ДИ 90,7–91,4%), возможной глаукомы (чувствительность 96,4% (95%, ДИ 81,7–99,9%); специфичность 87,2% (95%, ДИ 86,8–87,5%) и ВМД (чувствительность 93,2% (95%, ДИ 91,1–99,8%); специфичность 88,7% (95%,ДИ 88,3–89,0%). Результаты исследования выглядят еще более валидными, если принять во внимание то, что это было мультицентровое исследование 10 когорт (общее количество проанализированных снимков 494661) пациентов с диабетом. 

DL стал надежным инструментом в интерпретации офтальмологических данных, полученных из фотографий глазного дна, ОКТ и полей зрения. Было показано, что метод машинного обучения является эффективным скрининговым инструментом для таких распространенных глазных заболеваний, как возрастная макулярная дегенерация, диабетическая ретинопатия и глаукома, и ранняя диагностика этих состояний будет способствовать снижению предотвращаемой потери зрения. Так, на международном уровне и локальных сообществах с недостаточным уровнем обслуживания существует значительная брешь для скрининга, а эффективный автоматизированный процесс телеофтальмологии помогает решать неудовлетворенные потребности в скрининге ряда заболеваний. Алгоритмы DL уже сегодня могут быть применены к программам телеофтальмологии, чтобы дифференцировать нормальные изображения сетчатки от аномальных,тем самым уменьшая нагрузку на клиницистов и увеличивая объем обследованных пациентов. 

Надо понимать, что DL-алгоритмы помогают клиницистам в выявлении исключительно конкретных аномалий, обнаруженных при скрининговом тестировании, при этом программное обеспечение может предоставлять специалисту предварительный диагноз с соответствующим описанием основных патологических отклонений, обнаруженных при машинном анализе. В то же время окончательная постановка диагноза, а также консультирование пациента и его лечение остаются ответственностью офтальмолога. 

DL могут быть интегрированы в систему первичной медико-санитарной помощи, уменьшая или потенциально устраняя ненужные рефералы. В перспективе подобные системы могли бы позволить вывести телеофтальмологию на новый уровень, обеспечив пациентам возможность проводить самоконтроль, фотографируя сетчатку с помощью смартфона,а также тестируя остроту и поля зрения. Такая технология могла бы значительно расширить возможности пациентов: облегчать раннюю диагностику и своевременно выявлять поддающиеся терапии заболевания глаз. 

Согласованная интерпретация офтальмологических данных с помощью DL может также способствовать повышению качества научных работ путем снижения вариабельности оценок исследователей. Использование DL-сетей для диагностики с использованием одного фильтра для каждого изображения в процессе обучения (методы классификации изображений) может привести к тому, что сеть свяжет с изображением неверную информацию в виде присутствия на нем патологических изменений. В качестве конкретного примера можно привести работу Abramoff M.D. с соавт., в которой было показано, что при фоторегистрации глазного дна у пациентов в подгруппе с более высокой встречаемостью ДМО, снимки с несколько более темпоральным расположением ДЗН (ближе к центру) были неправильно интерпретированы DL-сетью, которая при обучении связала подобное положение диска с наличием у пациентов ДМО. Мы считаем, что наилучшим типом подобных DL-сетей являются те, что базируются на конкретных масках (черно-белое аннотирование) патологических состояний (методы семантической сегментации),которые могут обнаруживать и сегментировать диагностические «ключи» (признаки заболеваний), как это делают специалисты, и, следовательно, предоставлять классификацию, основанную на полученных данных. 

Важно помнить, что текущие медицинские знания основаны на данных многолетних наблюдений, гипотезах, валедизируемых посредством проведения множества клинических исследований, в связи с чем нельзя воспринимать результаты систем DL как абсолютные по точности, без глубокого понимания клинической ситуации, критической оценки и не проверяя должным образом соответствие результатов имеющимся в распоряжении специалистов медицинским знаниям. На сегодняшний день включение DL-алгоритмов в клиническую практику пока что остается редким. 

Мы считаем, что наилучший уход за пациентами осуществляется через непосредственное взаимодействие между врачом и пациентом, основанное на доверии и сострадании, в то время как DL решения должны лишь дополнять его. 

DeepLearning – это новый инструмент, который может принести пользу как пациенту,так и клиницисту,однако на сегодняшний момент у данной технологии все еще остаются определенные ограничения. По мере развития технология DL будет все более интегрироваться в офтальмологическую практику, освобождая врачей от повторяющихся задач и позволяя им сосредоточиваться на улучшении ухода за пациентами. DL позволит офтальмологам сфокусировать свои ресурсы на отношениях с пациентом,а также оптимизировать медицинскую и хирургическую помощь. 

Доктор офтальмолог Левина ДарьяПодпишись на инстаграм офтальмохирурга
Доктор Левина поделится своим опытом с читателями проекта «eyes for me».