Оценка риска легочных узелков с помощью глубокого обучения и анализа неопределенности
Рак легких остается существенной причиной смертности, и раннее выявление имеет важное значение для улучшения результатов лечения пациентов. Появление испытаний скрининга рака легких, таких как Национальное испытание скрининга легких (NLST) и Датское испытание скрининга рака легких (DLCST), выявило потенциал низкодозной компьютерной томографии (КТ) в обнаружении легочных узелков на ранних стадиях, что может значительно снизить показатели смертности. Однако растущий спрос на КТ-скрининг опережает доступность рентгенологов, что приводит к задержкам в диагностике. Модели глубокого обучения (DL) появились в качестве решения этой проблемы, предоставляя автоматизированную помощь в интерпретации медицинских изображений, особенно для оценки риска злокачественности легочных узелков. Хотя модели DL показали себя многообещающими, отсутствие у них оценки неопределенности может помешать их эффективности в клинической практике, где точные и надежные прогнозы имеют решающее значение. В недавней статье в журнале European Radiology рассматривается интеграция оценки неопределенности в ранее разработанную модель DL для оценки риска злокачественности легочных узлов, оценивается ее эффективность при различных характеристиках узлов и определяется ее потенциал для клинического применения в реальных условиях.
Роль неопределенности в глубоком обучении
Одним из критических ограничений современных моделей DL является их неспособность сообщать о неопределенности в своих прогнозах. Это особенно важно в медицинских приложениях, где решения об уходе за пациентами часто зависят от точных и надежных оценок. Модель DL, которая может оценить собственную неопределенность, предоставляет врачам дополнительный уровень информации, помогая им выявлять случаи, когда необходима дополнительная оценка человеком. В этом исследовании оценка неопределенности была интегрирована в уже существующую модель DL, которая уже продемонстрировала высокую эффективность при оценке риска злокачественности легочных узелков.
Исследователи применили эту оценку неопределенности к двум наборам данных: набору разработки из DLCST, который состоит из данных скрининга рака легких, и клиническому набору данных из третичного академического центра. Неопределенность была рассчитана с использованием метода на основе энтропии, который измеряет случайность в прогнозах модели. Высокая энтропия указывает на неопределенность, в то время как низкая энтропия предполагает, что модель уверена в своей классификации. Были установлены два пороговых значения на основе 90-го и 95-го процентилей распределения неопределенности, разделяющих узелки на определенные и неопределенные группы.
Эффективность модели в неопределенных случаях
Исследование выявило значительное падение производительности модели при анализе неопределенных случаев. Когда модель была применена к определенным случаям (с низкой энтропией), она достигла площади под кривой рабочей характеристики приемника (AUC) 0,93 в наборе данных DLCST, что указывает на превосходную производительность при идентификации злокачественных узелков. Однако AUC модели упала до 0,62 в неопределенной группе, что подчеркивает проблемы с точной классификацией этих случаев. Эта закономерность также наблюдалась при проверке модели на внешнем клиническом наборе данных, где AUC упала с 0,90 для определенных случаев до 0,62 для неопределенных случаев.
Примечательно, что неопределенные случаи включали более крупные доброкачественные узелки, а также частично твердые и нетвердые узелки, которые сложнее классифицировать по сравнению с твердыми узелками. Это говорит о том, что характеристики узелков, такие как размер и состав, вносят значительный вклад в неопределенность модели. Эти результаты подчеркивают важность интеграции оценки неопределенности в модели DL, поскольку это позволяет более четко понимать, когда модель, скорее всего, будет допускать ошибки, предоставляя врачам ценный инструмент для выявления случаев, требующих дополнительного человеческого обзора.
Значение для клинической практики
Интеграция оценки неопределенности в модели DL имеет глубокие последствия для клинической практики. В реальных условиях врачи с большей вероятностью доверяют прогнозам модели, когда они сопровождаются оценкой определенности. В случаях, когда модель неопределенна, врачи могут быть предупреждены о необходимости дальнейшего пересмотра, тем самым снижая риск неправильной диагностики. Это особенно важно в условиях нехватки рентгенологов, поскольку это позволяет модели DL обрабатывать обычные случаи, одновременно отмечая более сложные случаи для оценки человеком.
Исследование также подчеркивает важность проверки моделей DL на внешних наборах данных. Значительная разница в уровнях неопределенности между данными скрининга из DLCST и клиническим набором данных подчеркивает необходимость оценки моделей на различных наборах данных, которые лучше отражают изменчивость, встречающуюся в клинической практике. Такой подход гарантирует, что модель достаточно надежна для обработки широкого спектра типов и размеров узелков, с которыми она столкнется в реальных условиях.
Кроме того, исследование предполагает, что оценка неопределенности может быть полезной для оптимизации клинических рабочих процессов. Передавая неопределенные случаи экспертам-людям, модель может помочь приоритизировать случаи, требующие немедленного внимания, потенциально улучшая результаты лечения пациентов за счет ускорения процесса диагностики. Однако авторы предупреждают, что оптимальный порог неопределенности может варьироваться в зависимости от клинических условий и должен определяться в ходе междисциплинарных обсуждений с участием как врачей, так и специалистов по данным.
Заключение
Интеграция оценки неопределенности в модели DL представляет собой значительный шаг вперед в повышении безопасности и надежности автоматизированной оценки риска злокачественности легочных узлов. Выявляя случаи, когда модель неопределенна, этот подход предоставляет врачам жизненно важный инструмент для принятия более обоснованных решений, снижения риска ошибок и повышения общей надежности моделей DL в медицинских приложениях.
Результаты этого исследования показывают, что модели DL с оценкой неопределенности могут работать хорошо в некоторых случаях, но испытывают трудности с более сложными случаями, такими как более крупные доброкачественные узлы и субсолидные узлы. Это подчеркивает важность постоянного совершенствования алгоритмов DL и расширения обучающих наборов данных для улучшения производительности в более широком диапазоне типов узлов. Поскольку использование скрининга КТ продолжает расти, а программы скрининга рака легких становятся более распространенными, потребность в надежных и эффективных моделях DL будет только расти. Оценка неопределенности будет играть решающую роль в обеспечении того, чтобы эти модели можно было безопасно и эффективно интегрировать в клиническую практику, что позволит им помочь снизить нагрузку на рентгенологов, сохраняя при этом высокие стандарты ухода за пациентами.
Дальнейшие исследования должны быть сосредоточены на расширении применения оценки неопределенности в различных модальностях визуализации и типах рака и изучении ее влияния на людей-считывателей посредством клинических исследований. Объединяя сильные стороны моделей DL и человеческий опыт, мы можем приблизиться к будущему, в котором диагностика на основе ИИ станет бесшовной и надежной частью медицинской практики.
Источник: European Radiology