Прогнозирование биомаркеров рака молочной железы с помощью многозадачного глубокого обучения
Рак молочной железы остается одной из основных причин смертности от рака среди женщин. Точная классификация подтипов рака молочной железы на основе молекулярных биомаркеров, таких как рецептор эстрогена (ER), рецептор прогестерона (PR) и рецептор человеческого эпидермального фактора роста 2 (HER2), имеет решающее значение для принятия решений о лечении и прогнозирования результатов. Неинвазивные технологии визуализации обладают потенциалом для идентификации этих биомаркеров без необходимости проведения процедур биопсии. Недавние достижения в области глубокого обучения продемонстрировали перспективность в интерпретации медицинских изображений, особенно в прогнозировании биомаркеров, связанных с раком. В недавнем обзоре, опубликованном в Insights Into Imaging, изучается эффективность многозадачной модели глубокого обучения, обученной на 3D-изображениях всей молочной железы (3DWBUS) для точного прогнозирования экспрессии ER, PR и HER2 и повышения интерпретируемости.
Модели глубокого обучения для прогнозирования биомаркеров
Традиционные однозадачные модели глубокого обучения анализируют данные УЗИ для прогнозирования экспрессии отдельных биомаркеров. Однако этим моделям часто требуются более явные ограничения для проблем интерпретируемости. Напротив, многозадачный подход к обучению объединяет две задачи: сегментацию опухоли и прогнозирование биомаркеров. Интеграция сегментации стимулирует модель фокусироваться на интересующих областях в груди, тем самым повышая точность прогнозирования и интерпретируемость модели.
В исследовании были проанализированы 388 пациентов с раком груди, которым была сделана 3DWBUS-визуализация. Набор данных был разделен на обучающий, проверочный и тестовый наборы. Архитектура 3D ResNet использовалась для построения как однозадачных, так и многозадачных моделей, причем первая была сосредоточена исключительно на прогнозировании экспрессии биомаркеров, а вторая объединяла задачи сегментации и классификации. Эффективность модели оценивалась с использованием таких метрик, как площадь под кривой рабочей характеристики приемника (AUC), чувствительность, специфичность и интерпретируемость с помощью методов визуализации, таких как Grad-CAM++.
Производительность моделей с одной и несколькими задачами
Как однозадачные, так и многозадачные модели продемонстрировали сильные прогностические возможности для ER, PR и HER2. В индивидуальных оценках однозадачная модель показала более высокую производительность для прогнозирования ER с AUC 0,809. Напротив, многозадачная модель показала лучшие результаты для прогнозирования PR и HER2 с AUC 0,767 и 0,697 соответственно. Однако при рассмотрении общей производительности многозадачная модель последовательно превосходила однозадачную модель по нескольким показателям. В частности, многозадачная модель достигла более высокого макро AUC (0,733), чем однозадачная модель (0,708).
Улучшение производительности многозадачной модели можно объяснить ее способностью более эффективно фокусироваться на области поражения с помощью задачи сегментации. Используя дополнительное ограничение сегментации, модель смогла лучше различать соответствующие особенности опухоли, связанные с экспрессией биомаркеров, что привело к более точным прогнозам. Это было очевидно в повышенном внимании к пораженным областям тканей, как визуализировалось с помощью тепловых карт Grad-CAM++, которые были сосредоточены на областях поражения.
Объясняемость и визуализация с помощью Grad-CAM++
Многозадачная модель была дополнительно проверена на предмет ее способности улучшать интерпретируемость. Grad-CAM++ использовался для визуализации областей внимания на ультразвуковых изображениях. Тепловые карты, созданные с помощью этой техники, показали, что многозадачная модель демонстрировала более сильный фокус на пораженных тканях по сравнению с однозадачной моделью. Внимание было направлено на синие или красные области, представляющие области с высокой прогностической ценностью, в то время как фиолетовые области с более низкой прогностической ценностью были менее подчеркнуты.
Анализ t-распределенного стохастического соседнего внедрения (t-SNE) дополнительно подчеркнул улучшенную дискриминационную способность многозадачной модели, особенно для PR и HER2. Визуализация показала четкую дифференциацию между положительными и отрицательными образцами для этих биомаркеров, в то время как однозадачная модель показала лучшие результаты в различении экспрессии ER. Эта улучшенная визуализация не только повышает прозрачность модели, но и помогает клиницистам понять базовый процесс принятия решений модели глубокого обучения.
Это исследование демонстрирует, что как однозадачные, так и многозадачные модели глубокого обучения могут эффективно предсказывать экспрессию биомаркеров рака молочной железы по изображениям 3DWBUS. Многозадачная модель, которая объединяет сегментацию опухоли с прогнозированием биомаркеров, демонстрирует превосходную общую производительность и улучшенную интерпретируемость. Способность этой модели фокусироваться на областях поражения при создании тепловых карт с помощью Grad-CAM++ обеспечивает четкую визуализацию процесса прогнозирования, что делает ее многообещающим инструментом для неинвазивной диагностики рака молочной железы и выбора целевой терапии. Хотя для обобщения модели на различные клинические условия необходима дальнейшая валидация, исследование устанавливает основополагающую структуру для объяснимого ИИ в визуализации рака молочной железы, прокладывая путь для улучшения рабочих процессов диагностики и лечения.
Источник: Insights Into Imaging