105203, г. Москва, ул. Нижняя Первомайская, д. 43А, офис 21.
Модель глубокого обучения U-Net для автоматизированной сегментации внутреннего уха

Модель глубокого обучения U-Net для автоматизированной сегментации внутреннего уха

Сложная трехмерная анатомия внутреннего уха представляет собой существенные проблемы для диагностики и хирургического планирования, требуя точной визуализации для навигации по его сложным структурам. Традиционная ручная сегментация структур внутреннего уха с помощью сканов компьютерной томографии (КТ) занимает много времени и может вносить изменчивость из-за человеческой ошибки. С ростом прогресса искусственного интеллекта (ИИ) и методов машинного обучения глубокое обучение (DL) показало себя многообещающим в автоматизации задач сегментации, повышая скорость и точность. Недавняя статья в European Radiology Experimental рассматривает исследование, в котором была разработана и проверена модель сверточной нейронной сети (CNN) с открытым исходным кодом U-Net для автоматизации сегментации внутреннего уха с помощью КТ. Основной целью исследования было достижение надежной сегментации как в нормальных, так и в патологических случаях, оптимизация клинических рабочих процессов и улучшение хирургического планирования.

Обучение модели U-Net для сегментации внутреннего уха

В исследовании использовалась архитектура на основе U-Net, медицинская модель визуализации, широко используемая благодаря своей способности выполнять сегментацию по пикселям. Модель U-Net состоит из симметричной структуры с кодером для захвата контекста и декодером для обеспечения точной локализации. Пропускные соединения между кодером и декодером используются для сохранения характеристик высокого разрешения, потерянных во время понижения частоты дискретизации, что повышает качество сегментации.

Набор данных включал 271 КТ-скан для обучения и 70 внешних КТ-сканов для проверки. Данные обучения включали здоровые височные КТ-сканы и сканы с аномалиями, что позволило модели обобщить широкий спектр анатомии внутреннего уха. Эти сканы были вручную сегментированы рентгенологами, и полученные сегментации служили основой для обучения модели. Набор данных обучения был обработан с использованием определенных параметров, включая фильтр анализа костей с шириной 4000 HU и центральным диапазоном от 600 до 800 HU, что обеспечивало четкие изображения структур височной кости.

Модель U-Net была оптимизирована в ходе нескольких итераций, что улучшило ее веса и общую производительность для сегментации структур внутреннего уха, включая преддверие, улитку и полукружные каналы. Окончательные веса модели были сделаны общедоступными для глобального использования, а исследование было направлено на проверку точности модели и ее полезности для клинического применения.

 

Количественная и качественная оценка модели

Для оценки производительности модели U-Net использовались количественные и качественные показатели. Для количественной оценки использовался коэффициент сходства Дайса (DSC), метрика, указывающая на перекрытие между автоматизированной сегментацией и ручной истинной версией. Среднее достигнутое значение DSC составило 0,83, что отражает высокую точность сегментации внутреннего уха у разных пациентов и анатомий. Более высокое среднее значение DSC в наборе данных проверки (по сравнению с набором данных обучения) дополнительно продемонстрировало надежность и внешнюю применимость модели. Более того, время автоматизированной сегментации было значительно сокращено до среднего значения 12 секунд на объем по сравнению с приблизительно 463 секундами для ручной сегментации.

Качественная оценка использовала четырехуровневую шкалу Лайкерта (LS) для оценки клинической полезности и точности сегментации, при этом оценка 1 указывала на полную и точную сегментацию, а оценка 4 представляла серьезные проблемы сегментации или потерю структур внутреннего уха. Модель достигла оценки Лайкерта 1 в 42% случаев проверки, что указывает на то, что почти половина автоматизированных сегментаций была точной. Однако 27% случаев получили оценку 4, что указывает на необходимость улучшения в определенных сценариях, особенно в сегментах со сложными аномалиями или анатомическими вариациями.

 

Сравнение производительности и значение для клинического использования

Результаты модели показали благоприятную производительность по сравнению с другими исследованиями сегментации на основе DL. В то время как другие исследования сообщили о более высоких значениях DSC (например, 0,91 при использовании архитектур AH-net или W-net), использование модели U-Net в этом исследовании продемонстрировало практические преимущества с точки зрения простоты, вычислительной эффективности и доступности для клинического применения. Качество сегментации модели U-Net было одинаковым для нормальных и патологических сканов, хотя определенные случаи, такие как отосклероз, представляли трудности, что приводило к немного более низкой точности.

Производительность модели предполагает, что она может быть очень полезной в клинической практике, особенно для предоперационного планирования отологических операций, процедур кохлеарной имплантации и лечения пороков развития уха. Быстрое время обработки обеспечивает быструю сегментацию, позволяя врачам визуализировать анатомию внутреннего уха в 3D без трудоемкого процесса ручного разграничения. Кроме того, открытый исходный код модели позволяет ее совершенствовать и адаптировать к различным клиническим условиям или протоколам КТ, что повышает ее полезность для различных поставщиков медицинских услуг.

Однако перед широким внедрением необходимо рассмотреть некоторые ограничения. Изменчивость протоколов КТ-сканирования, таких как толщина среза и размер вокселя, может влиять на точность сегментации. Кроме того, производительность модели нуждается в дальнейшей проверке в более широком диапазоне аномалий и редких пороков развития внутреннего уха для обеспечения надежного клинического применения. Дальнейшая разработка и оптимизация, особенно с более обширными и разнообразными наборами данных, повысят возможности сегментации модели.

Использование глубокого обучения для автоматизированной сегментации внутреннего уха с помощью КТ-сканов предлагает значительный потенциал для улучшения клинических рабочих процессов и точности в отологической помощи. Модель U-Net, разработанная в этом исследовании, достигла сильного баланса между точностью и эффективностью, достигнув высокого среднего DSC и продемонстрировав быстрое время сегментации. Хотя существуют некоторые ограничения при обработке сложных случаев, производительность модели подчеркивает ее перспективность как ценного инструмента в медицинской визуализации. Будущие усовершенствования и валидация в различных клинических условиях еще больше повысят ее применимость, что приведет к лучшим диагностическим и терапевтическим результатам для пациентов с заболеваниями уха.

 

Источник: European Radiology Experimental