Preview

Проблемы Эндокринологии

Расширенный поиск

Перспективы применения свёрточных нейронных сетей в цитологической диагностике узловых образований щитовидной железы

https://doi.org/10.14341/probl13475

Содержание

Перейти к:

Аннотация

АКТУАЛЬНОСТЬ. Цитологическое исследование очаговых образований щитовидной железы (ЩЖ) является золотым стандартом диагностической программы верификации доброкачественных и злокачественных поражений этого органа. Рост заболеваемости, недостаток специалистов и потребность автоматизации медицинской диагностики делают применение машинного обучения, особенно свёрточных нейронных сетей, перспективным направлением в цитологической диагностике патологии ЩЖ.

ЦЕЛЬ. Анализ и оценка роли свёрточных нейронных сетей в цитологической диагностике патологии ЩЖ, исследование их потенциала для повышения точности и автоматизации диагностических процессов.

МЕТОДЫ. Анализ литературы из баз данных Pubmed, Google Scholar и научной электронной библиотеки elibrary.ru с использованием ключевых слов «thyroid», «cytology», «cytopathology», «fine-needle aspiration biopsy», «neural network» и «convolutional neural network». Для анализа отобрано 12 статей, опубликованных с 2018 по 2023 гг.

РЕЗУЛЬТАТЫ. В работе рассмотрены основные принципы устройства свёрточных нейронных сетей и показатели, которые используются для оценки их качества. Выполнен анализ исследований по применению свёрточных нейронных сетей в цитологической диагностике патологии ЩЖ. В соответствии с результатами указанные нейронные сети классифицируют патологические состояния с высокой точностью и чувствительностью, сравнимой с работой опытного цитолога. Точность классификации папиллярного рака может достигать 99,7%. Однако отсутствие единых стандартов подготовки изображений для обучения нейронных сетей, недостаточное количество исследований с использованием многоцентровых данных и узкий диагностический спектр имеющихся нейросетевых моделей пока ограничивает внедрение таких систем искусственного интеллекта в цитологическую диагностическую практику.

ЗАКЛЮЧЕНИЕ. Имеющиеся результаты исследований разнообразных вариантов использования свёрточных нейронных сетей в цитологической диагностике патологии ЩЖ имеют все шансы стать инициатором серьезного сдвига парадигмы привычной цитопатологии в сторону цифровой и вычислительной цитопатологии, в которых основные функции будут выполнять системы на основе искусственного интеллекта.

Для цитирования:


Солопов М.В., Кавелина А.С., Попандопуло А.Г., Турчин В.В., Ищенко Р.В., Филимонов Д.А. Перспективы применения свёрточных нейронных сетей в цитологической диагностике узловых образований щитовидной железы. Проблемы Эндокринологии. 2025;71(3):4-13. https://doi.org/10.14341/probl13475

For citation:


Solopov M.V., Kavelina A.S., Popandopulo A.G., Turchin V.V., Ishchenko R.V., Filimonov D.A. Prospects for the application of convolutional neural networks in the cytological diagnosis of thyroid nodules. Problems of Endocrinology. 2025;71(3):4-13. (In Russ.) https://doi.org/10.14341/probl13475

ВВЕДЕНИЕ

При плановом ультразвуковом исследовании щитовидной железы (ЩЖ) могут выявляться очаговые образования, отличающиеся по сонографическим параметрам от остальной ткани и имеющие четкие границы. Обычно они обнаруживаются у 48% пациентов [1]. При этом по протоколу необходима оценка их размера, расположения, эхогенности, четкости границ и наличия кальцификатов. Однако сами по себе ультразвуковые характеристики несут незначительную информацию о морфологии зоны интереса и, соответственно, степени риска развития неопластического процесса. В связи с этим возникает необходимость морфологической верификации этих образований при помощи цитологического исследования. В большинстве случаев узловые образования ЩЖ являются доброкачественными, однако около 5% имеют онкологическую трансформацию различного характера.

Показаниями к проведению тонкоигольной аспирационной пункционной биопсии (ТАПБ) являются либо сонографические критерии, изложенные в различных модификациях классификации TIRADS [2][3], либо национальные клинические рекомендации по лечению патологии ЩЖ, например, клинические рекомендации «Диффренцированный рак щитовидной железы», утвержденные Минздравом России [4]. Цитологическое исследование ТАПБ щитовидной железы является золотым стандартом обследования, позволяя быстро диагностировать доброкачественные и злокачественные поражения, избавив пациента от ненужного хирургического вмешательства. Точность метода составляет 89–95% [5], чувствительность — 68–98%, специфичность — 56–100% [6]. Однако надежность метода вариабельна, а результат исследования зависит как от квалификации цитолога, так и от качества исследуемого препарата (материал может быть неинформативным из-за затемнения от форменных элементов крови, повреждения или недостаточного количества клеток), что впоследствии затрудняет идентификацию патологий. Для стандартизации в цитологической диагностике опухолевой и неопухолевой патологии ЩЖ используется система классификации Bethesda, которая разделяет результаты исследования на шесть групп различных категорий риска злокачественности образования (I–VI) и определяет дальнейшие действия, например, повторная биопсия, наблюдение или хирургическое вмешательство [7]. В 15–30% результатов диагностики по этой классификации имеется неопределенность в III (атипия фолликулярного эпителия неясного значения) и IV категориях (фолликулярная опухоль, вероятно, аденома или рак), т.е. определении доброкачественности или злокачественности опухоли. Результаты метаанализов свидетельствуют о риске наличия злокачественных новообразований в III и IV категориях в 30,5 и 28,9% соответственно [5][8].

Проведение хирургической резекции образований ЩЖ для окончательного гистологического анализа позволяет с высокой точностью определить характер патологического процесса, но не предполагает возможность принятия предоперационных решений, что подвергает пациента риску развития периоперацинного стресса и последствий самого оперативного вмешательства. Частота хирургической резекции ЩЖ составляет 20–25% для всех типов узловых образований, при этом менее половины из них оказываются действительно злокачественными при окончательном гистологическом исследовании [9]. Чтобы исключить неоправданные хирургические вмешательства, нужны быстрые и точные методы ранней диагностики рака. Стандартная/традиционная цитодиагностика трудозатратна и требует высокой квалификации специалиста-цитолога. Молекулярно-генетические анализы спорных узловых образований ЩЖ внедряются в практическую медицину, но в настоящее время их широкое применение ограниченно из-за недостаточной доступности и дороговизны. Кроме того, они демонстрируют различную чувствительность и специфичность с тенденцией к занижению вероятности наличия онкологической патологии [10]. За последние годы значительно продвинулась разработка и внедрение в цитодиагностику ЩЖ методов искусственного интеллекта (ИИ), которые привнесли новые возможности для повышения эффективности и точности диагностики [11][12].

Основной целью развития систем на основе ИИ является разработка таких компьютерных систем, которые способны решать проблемы, не будучи явно запрограммированными. В связи с накоплением в последние годы наборов данных из различных областей, улучшением вычислительных мощностей и доступностью программных библиотек с открытым исходным кодом, активно развивается и внедряется машинное обучение (МО) — одна из областей ИИ, специалисты которой занимаются разработкой «умных» алгоритмов для выполнения задач регрессии, классификации и кластеризации. Такие алгоритмы по мере обработки больших массивов данных (т.е. процесса обучения) улучшают показатели эффективности решения задачи. На основе маркировки обучающих данных МО подразделяется на контролируемое и неконтролируемое. При контролируемом обучении выходным данным присваивается специальная метка, которая отражает истинную характеристику анализируемого объекта, а входными данными являются параметры этого объекта. После многократного анализа данных с метками модель может правильно характеризовать новые входные данные без меток. В неконтролируемом обучении не требуется использование меток, т.е. алгоритм сам старается найти зависимости в представленных данных. Примером неконтролируемого обучения является кластеризация подгрупп рака молочной железы на основе гистологических признаков [13].

Одной из самых популярных областей МО является применение искусственных нейронных сетей (ИНС) в рамках так называемого глубокого обучения. Такие системы называют «глубокими», потому что они состоят из множества слоев, в каждый из которых включено определенное количество вычислительных единиц (нейронов). ИНС успешно решают задачи по анализу изображений и видео, распознаванию речи. В биомедицине ИНС находят применение для исследования взаимодействия разрабатываемых лекарств с потенциальными мишенями, прогнозирования побочных эффектов от лекарств, автоматизации интерпретации медицинских данных, прогнозирования госпитализации и смертности [14]. В диагностике заболеваний ЩЖ развиваются методы МО на основе анализа данных ультразвуковых, радиологических и цитологических исследований [15].

В этой работе будет рассмотрено использование сверточных нейронных сетей (СНС) для цитологической диагностики патологии ЩЖ. Такие нейронные сети хорошо распознают формы и текстуры на изображениях и выполняют классификацию с высокой точностью и чувствительностью. СНС автоматически анализируют важные детали изображений (признаки) без необходимости указания со стороны человека, на что обращать внимание, что делает процесс идентификации и классификации изображений более эффективным. Использование СНС в цитологической диагностике в будущем может снизить рабочую нагрузку цитологов, ускоряет сортировку и анализ изображений, выделяя наиболее значимые для специалиста случаи. Далее будут рассмотрены основы строения СНС, принцип их функционирования и наиболее распространенные показатели, используемые при классификации изображений.

МАТЕРИАЛЫ И МЕТОДЫ

С использованием комбинирования группы ключевых слов «thyroid», «cytology», «cytopathology», «fine-needle aspiration biopsy» с группой «neural network», «convolutional neural network» и их аналогов на русском языке нами выбрана и проанализирована литература из таких баз данных: Pubmed, Google Scholar и научная электронная библиотека elibrary.ru. Изначальная выборка содержала 42 статьи, из которых затем отбирались только те исследования, в которых применялись СНС для анализа цитологических изображений ЩЖ. Для анализа отобрано 12 статей, все из которых были опубликованы в период с 2018 по 2023 гг. Изучены аннотации и полнотекстовые версии публикаций.

ОСНОВЫ СНС

Основа для развития СНС была заложена экспериментальными исследованиями структуры зрительной коры головного мозга кошек и обезьян, которые проводили Дэвид Х. Хьюбел и Торстен Визель в 1950–60-х гг. За эти исследования они были удостоены Нобелевской премии по физиологии и медицине в 1981 г. [16]. Исследования показали, что многие нейроны зрительной коры обладают небольшими локальными рецептивными полями и активируются только при наличии стимулов в определенной области поля зрения. Перекрытие рецептивных полей различных нейронов обеспечивает покрытие всего поля зрения. Хьюбел и Визель обнаружили, что нейроны могут иметь одно и то же рецептивное поле, но отвечать на различные простые геометрические формы. Более того, были выявлены нейроны с более сложными рецептивными полями, реагирующие на комбинации базовых образов. Эти наблюдения привели к созданию модели организации зрительных нейронов, в которой нейроны более высокого уровня используют выходы соседних нейронов более низкого уровня.

Остановимся на том, как работают СНС (рис. 1), анализируя изображения на наличие определенных признаков. Это достигается путем применения набора фильтров к изображению, каждый из которых «смотрит» на определенный тип особенностей, таких как края, углы, текстуры или более сложные паттерны. Фильтр — это математическая матрица небольшого размера (например, 3x3 или 5x5), которая содержит весовые коэффициенты, определяющие, какие признаки фильтр будет извлекать из изображения. По сути, фильтр является моделью рецептивного поля нейрона. Фильтр перемещается по растровой сетке изображения и на каждой позиции определяет характерные паттерны из соответствующего участка изображения. Этот процесс называется свёрткой. После сканирования изображения каждым фильтром создается карта признаков. После свёртки следует процесс пулинга (pooling), который обеспечивает уменьшение пространственного объема карты признаков с селекцией наиболее значимых. Также пулинг помогает повысить устойчивость нейронной сети к незначительным изменениям в изображениях, таким как смещения или искажения. Операции свёртки и пулинга повторяются многократно, каждый раз все более уточняя и конкретизируя признаки, которые сеть может распознать. Карта признаков, полученная после операций свёртки и пулинга, представляет собой многомерный массив (тензор) числовых значений пикселей, который на финальном этапе извлечения признаков преобразуется в одномерный массив путем процедуры разворачивания многомерного массива (flattening). Затем этот массив передается в нейронную сеть с полносвязными слоями, которая выполняет классификацию изображения. В полносвязном слое каждый нейрон (его математическая модель) соединен со всеми нейронами предыдущего слоя. Значимость каждой связи определяется весовым коэффициентом. На каждом полносвязном слое массив признаков умножается на матрицу весовых коэффициентов, а результат передается функции активации, которая формирует нелинейные связи в нейронной сети, что способствует обнаружению сложных зависимостей данных. Последний полносвязный слой, называемый выходным слоем, создает конечные выходные значения сети, представляющие собой вероятности классов изображений (рак или доброкачественное узловое образование).

Рисунок 1. Алгоритм обучения СНС для цитологической диагностики патологии щитовидной железы.

Обучение СНС происходит с использованием метода, известного как обратное распространение ошибки. Сначала через сеть проходят данные изображения и делается прогноз. Затем выполняется сравнение прогноза сети и истинного значения, и на основе этого сравнения вычисляется ошибка. После этого ошибка распространяется обратно по сети, корректируя весовые коэффициенты связей между нейронами таким образом, чтобы минимизировать ошибку. Этот процесс повторяется множество раз на большом наборе обучающих данных, позволяя сети «научиться» распознавать и классифицировать изображения. Несмотря на то, что нейронные сети демонстрируют точные результаты, при обсуждении проблем их использования встречается понятие «черный ящик» [17]. Оно характеризует непонятный для человека процесс извлечения признаков внутри слоев нейронной сети путем сложных нелинейных операций над входными данными и отсутствие обоснования получаемых прогнозов.

Ключевым моментом для успешного обучения СНС является объем выборки тренировочных изображений. В зависимости от конкретной задачи, для решения которой будет использоваться обученная СНС, этот объем будет отличаться в зависимости от доступности данных и сложности паттернов классифицируемых изображений. По мнению Bakaev и соавт. [18], для эффективного обучения СНС должен использоваться датасет размером не менее 17 тыс. изображений. В случае применения СНС для классификации микрофотографий цитологических препаратов ЩЖ использовались датасеты размером от нескольких сотен [19] до 150 тыс. [11] изображений.

При использовании СНС в цитологической диагностике патологии ЩЖ распространенной практикой является извлечение изображений диагностических областей из цельнопрепаратных изображений (ЦПИ), полученных с помощью специального сканирующего оборудования [11]. Такой подход позволяет получить достаточного много изображений, подходящих для обучения СНС. Для расширения размера выборки изображений часто применяется аугментация — процесс искусственного увеличения разнообразия изображений посредством применения к ним различных трансформаций: поворотов, отражений, изменения масштаба, сдвигов, изменений яркости и контраста и т.д.

Для характеристики успешности обучения СНС используют ряд показателей, которые оценивают производительность модели. В рамках данной работы мы приводим характеристики основных показателей, которые используются в рассматриваемых далее исследованиях по применению СНС в цитологической диагностике патологии ЩЖ (табл. 1).

Таблица 1. Основные показатели, используемые для оценки производительности СНС

Показатель

Формула вычисления

Описание

Общая точность (accuracy)

Доля правильных прогнозов по отношению ко всем выполненным прогнозам

Точность (precision)

Доля правильных положительных прогнозов по отношению ко всем положительным прогнозам

Полнота (recall) / чувствительность (sensitivity)

Доля правильных положительных прогнозов по отношению ко всем положительным случаям

Специфичность (specificity)

Доля правильных отрицательных прогнозов по отношению ко всем истинным отрицательным случаям

Оценка F1
(F1-score)

Среднее гармоническое значение точности и чувствительности

AUC
(area under curve)

Площадь под графиком, который иллюстрирует соотношение между чувствительностью и специфичностью модели при разных порогах классификации. Значение варьирует от 0,5 (случайное угадывание) до 1 (идеальная модель)

Примечание. TP — количество истинных положительных прогнозов, TN — количество истинных отрицательных прогнозов, FP — количество ложных положительных прогнозов, FN — количество ложных отрицательных прогнозов, p — точность (precision), r — полнота (recall).

В машинном обучении за положительный случай принимается наиболее редкое явление, а более частое — за отрицательный.

Для конкретной задачи специалистами в области МО могут создаваться собственные уникальные архитектуры СНС, однако имеется уже ряд разработанных моделей, которые хорошо зарекомендовали себя для классификации цитологических изображений: EfficientNet, Inception, VGG, U-Net, SegNet, DenseNet, ResNet, GoogleNet, AlexNet [20]. Эти архитектуры предварительно обучены на естественных изображениях из базы данных ImageNet. Они точно и быстро обнаруживают признаки клеточной атипии на цитологических снимках, например, сеть AlexNet показала свою эффективность в выявлении рака шейки матки с точностью 99% [21].

ПРИМЕНЕНИЕ СНС В ЦИТОЛОГИЧЕСКОЙ ДИАГНОСТИКЕ ПАТОЛОГИИ ЩИТОВИДНОЙ ЖЕЛЕЗЫ

В последние годы был выполнен ряд исследований по применению СНС для классификации патологии ЩЖ, продемонстрировавших обнадеживающие результаты, которые могут заложить основу для разработки интеллектуальных инструментов для раннего выявления злокачественных новообразований. В таблице 2 представлена сводная информация по последним исследованиям в этом направлении.

Таблица 2. Исследования по использованию СНС для цитологической диагностики щитовидной железы

Год / ссылка

Цель

Тип СНС

Датасет

Результаты

2018 / Sanyal и соавт. [19]

Бинарная классификация папиллярного рака

Модель разработана авторами

370 изображений из 20 препаратов (184 — папиллярный рак, 186 — другие патологии)

Aсс. — 85,1%

Sen. — 90,5%

Spec. — 83,3%

2019 / Guan и соавт. [22]

Бинарная классификация папиллярного рака

VGG-16, Inception-v3

887 изображений из 279 препаратов (476 — папиллярный рак, 411 — доброкачественные)

Acc. — 97,7%

Sen. — 100%

Spec. — 94,9%

2020 / Elliott Range и соавт. [25]

Классификация злокачественных и доброкачественных поражений

2 СНС на основе VGG11

1000 изображений из 908 препаратов

Sen. — 92%

Spec. — 90,5%

AUC — 0,932

2022 / Dov и соавт. [26]

Оценка согласованности ИИ-системы с работой цитолога

2 СНС на основе VGG11

100 изображений из последовательных

109 ТАПБ

Коэффициент статистики Коэна (κ) 0,924

2022 / Duan и соавт. [27]

Классификация злокачественных и доброкачественных поражений

YOLOv4, EfficientNet

29 780 изображений для модели обнаружения и 63 356 изображений для модели классификации из 360 препаратов

Acc. — 97,9%

Prec. — 97,8%

Rec. — 98,1%

F1 — 97,9%

2022 / Duc и соавт. [28]

Бинарная классификация папиллярного рака

DenseNet

367 изображений (222 — папиллярный рак, 145 — доброкачественные)

Acc. — 99,7%

Sen. — 97,3%

Spec. — 94,1%

2023 / Alabrak и соавт. [17]

Классификация фолликулярной аденомы и фолликулярного рака

Модель разработана авторами

886 изображений из 43 клинических случаев (527 изображений фолликулярной аденомы и 359 изображений фолликулярного рака)

Acc. — 78%

Sen. — 88,4%

Spec. — 64%

AUC — 0,87

2023 / Hirokawa и соавт. [11]

Классификация 9 типов патологий щитовидной железы

EfficientNet

148 395 изображений из 393 узловых образований щитовидной железы

Для большинства категорий AUC>0,95 (кроме MTC и PDTC)

2023 / Jang и соавт. [31]

Распознавание неинформативных препаратов ТАПБ

FNA-Net, разработана авторами

287 изображений от 6 пациентов

F1 — 0,81

AUC — 0,84

Примечание. Acc. — общая точность (accuracy), Sen. — чувствительность (sensitivity), Spec. — специфичность (specificity), Prec. — точность (precision), Rec. — полнота (recall), F1 — оценка F1, AUC — площадь под ROC-кривой, MTC — медуллярный рак щитовидной железы, PDTC — низкодифференцированный папиллярный рак щитовидной железы, ТАПБ — тонкоигольная аспирационная пункционная биопсия.

Sanyal и соавт. разработали СНС для классификации папиллярного рака ЩЖ по микрофотографиям препаратов ТАПБ [19]. Из 20 цитологических препаратов (20 пациентов), полученных от двух разных медицинских центров Северной Индии, был сформирован датасет из 370 изображений с разрешением 512x512 пикселей, каждое из которых представляло область диагностического интереса. Для обучения СНС датасет был разделен на два класса: 184 цитологических изображения папиллярного рака, 186 изображений доброкачественных новообразований (коллоидного зоба, фолликулярных новообразований и лимфоцитарного тиреоидита). В исследование включали только цитологически подтвержденные случаи папиллярного рака, пограничные случаи не использовались. Для исследования обобщающей способности СНС анализировать данные, полученные разнородным образом, микрофотографии для формирования датасета были сделаны на двух моделях микроскопов с использованием объективов с разными увеличениями (10x и 40x). Наилучших показателей сеть достигла, когда общий прогноз о наличии рака формировался после комбинированного анализа фотографий, сделанных при двух увеличениях: общая точность — 85,1%, чувствительность — 90,5% и специфичность — 83,3%. Тем не менее авторы указывают на недостатки сети, когда расплывчатые папиллярные образования фолликулярных клеток ошибочно идентифицируются как папиллярный рак.

Guan и соавт. [22] использовали две архитектуры СНС VGG-16 и Inception-v3 для классификации папиллярного рака. Для исследования использовали 279 цитологических препаратов, полученных методом жидкостной цитологии, из которых 159 характеризовались как папиллярный рак, а 120 были охарактеризованы как неонкологическая патология. Все случаи рака по системе классификации Bethesda имели классы V или VI c гистологическим подтверждением. Доброкачественные случаи имели класс II, но так как пациентам не проводилась хирургическая операция, гистологического подтверждения не было. Исходные изображения были получены путем оцифровки препаратов при 400x увеличении. Затем изображения нарезали на фрагменты размером 224x224 пикселя, которые содержали фолликулярные клетки. В итоге датасет содержал 887 изображений (476 случаев рака и 411 доброкачественных новообразований). Посредством отражений и вращений изображений датасет был увеличен в восемь раз и разделен на обучающую и тестовую группы в соотношении 6:1. Из двух рассматриваемых архитектур СНС наилучшие показатели продемонстрировала VGG-16: общая точность — 97,7% (95% на уровне пациентов), чувствительность — 100% и специфичность — 94,9%. Дополнительно авторы исследовали характеристики клеточных ядер, которые автоматически извлекали из изображений и сравнивали по категориям. Полученные численные показатели, отражающие количество контуров, периметр и площадь клеток, а также средняя интенсивность пикселей были статистически больше у злокачественных клеток.

Заслуживает внимания цикл работ группы исследователей из США по автоматизации диагностики патологии ЩЖ. Dov и соавт. высказали идею о том, что Для цитологической диагностики узловых образований ЩЖ может использоваться тандем нейронных сетей [23]. Сначала идентифицируются области на ЦПИ, содержащих группы фолликулярных клеток, а затем эти области используются для прогнозирования злокачественных новообразований по категориям Bethesda [24]. Реализация этого подхода была изложена в работе Elliott Range и соавт. [25], в которой исследователи разработали систему из двух СНС на основе архитектуры VGG11. Первая сеть использовалась для определения на изображениях информативных областей фолликулярных клеток; вторая сеть анализировала эти области и прогнозировала классификационную категорию и ассоциированный прогноз о доброкачественности или злокачественности новообразований. Обучающие изображения были сформированы из 908 биопсий (от 659 пациентов) с гистологическим подтверждением, окрашенных по Папаниколау. Для обучения первой СНС патологоанатом вручную выделял области диагностического интереса, неинформативные участки выделялись случайным образом, так как большая часть площади ЦПИ не содержит клеточного материала. С использованием первой СНС из изображений было извлечено 1000 областей с наивысшей степенью информативности, которые впоследствии использовалась для обучения второй СНС, выполняющей роль классификатора. Система достигла общей точности 90,8%, чувствительности 92,0%, специфичности 90,5% и AUC 0,932. Последний показатель был сопоставим с уровнем первоначального диагноза цитолога (0,931). Для улучшения точности прогнозов злокачественности новообразований было создано правило, комбинирующее решения алгоритма СНС и цитолога. Алгоритм предоставлял прогнозы только для случаев, изначально классифицированных специалистом как неопределенные поражения, которые не являются доброкачественными или злокачественными и относятся к категориям III и IV по классификации Bethesda [7], а именно: атипия фолликулярного эпителия неясного значения, фолликулярная опухоль и подозрение на фолликулярную опухоль. Это привело к увеличению AUC с 0,931 до 0,962 и повышению специфичности с 90,5 до 92,9%. По мнению авторов, использование систем СНС в качестве вспомогательного инструмента для цитологической диагностики способствует устранению неоднозначностей при рассмотрении трудно классифицируемых случаев патологии ЩЖ [12].

На основе полученных результатов этот же коллектив [26] разработал программу для выделения информативных участков и диагностики по ЦПИ и протестировал ее в сравнении с работой цитолога. Для этого цитолог просматривал ЦПИ от 109 последовательных ТАПБ ЩЖ и записывал диагноз. В то же время алгоритм программы проводил скрининг и отбирал 100 информативных участков из каждого изображения, которые спустя 117 дней демонстрировались специалисту для постановки диагноза. Оценка соответствия между диагнозами с помощью метода κ-статистики Коэна продемонстрировала высокий уровень совпадений между диагнозами (κ=0,924). Среднее время, затраченное на постановку диагноза с использованием программы, составило 81,6 секунды, что указывает на потенциальную перспективность использования этого инструмента для снижения рабочей нагрузки цитолога. Однако недостатком этого исследования является участие в нем только одного цитолога.

Duan и соавт. предложили систему автоматизированной диагностики на основе двух модулей СНС для автоматического скрининга рака щитовидной железы по ЦПИ [27]. Для обучения нейронных сетей исследователи собрали 360 препаратов жидкостной цитологии ТАПБ из нескольких медицинских учреждений. Из исходного набора препаратов формировали два датасета изображений: первый — для обнаружения диагностических областей, второй — для бинарной классификации по категориям системы Bethesda (II — доброкачественные, III–VI — злокачественные). Для обнаружения диагностических областей использовалась архитектура YOLOv4 — производная сеть четвертого поколения сети YOLO, нацеленная на оптимальный баланс между количеством свёрточных слоев и количеством параметров. В качестве классификатора использовалась архитектура EfficientNet, которая обеспечивает более высокие значения точности по сравнению с другими моделями, благодаря использованию масштабирования по глубине, ширине и разрешению. После классификации система демонстрировала врачу 10 изображений с наибольшей вероятностью злокачественности. На обучающем наборе классификационный модуль достиг общей точности 97,9%, точности 97,8%, оценки F1 97,9%, полноты 98,1%. При этом на тестовом наборе изображений модуль EfficientNet продемонстрировал точность 78,7%, а в комбинации с YOLOv4 — 81,8%. Этот результат показывает способность предлагаемой системы избегать игнорирования истинно отрицательных прогнозов, когда случаи похожи на положительные.

Перспективная работа была проведена Alabrak и соавт., которые использовали собственно разработанную архитектуру СНС для диагностирования патологий ЩЖ IV категории Bethesda [17]. Эта категория включает как фолликулярную аденому, так и фолликулярный рак. Эти патологии сложно отличить друг от друга цитологическими методами, поэтому требуется резекция для проведения гистологического исследования и определения капсулярного и лимфо-васкулярного состояния опухоли. Так как фолликулярные аденомы клинически безвредны, особенную диагностическую ценность представляет выявление фолликулярного рака. Для обучения модели использовали 886 изображений, из которых 527 изображений (28 клинических случаев) характеризовали фолликулярную аденому, а 359 изображений (15 клинических случаев) — фолликулярный рак. Обученная модель при дифференциации фолликулярной аденомы от фолликулярного рака достигла общей точности 78,0%, чувствительности 88,4%, специфичности 64% и AUC 0,87.

Hirokawa и соавт. на момент написания статьи провели самое масштабное исследование по применению СНС для диагностики 9 типов патологии ЩЖ: доброкачественных образований, анапластического рака, фолликулярной аденомы, фолликулярного рака, медуллярного рака, оксифильной фолликулярной опухоли, папиллярного рака, низкодифференцированного рака и лимфомы ЩЖ [11]. Для обучения СНС на основе архитектуры EfficientNetV2-L использовали 148 395 фрагментированных изображений мазков ТАПБ из 393 узловых образований. Большинство категорий модель эффективно различала (AUC>0,95), однако при оценке низкодифференцированного и медуллярного рака показатели были ниже: 0,49 и 0,91 соответственно. Системе было трудно отличить низкодифференцированный онкологический процесс от папиллярного, медуллярного и фолликулярного рака, показатель полноты для этого случая был самым низким (35,4%). Также была выполнена правильная классификация для 16 из 35 новообразований, которые изначально были отнесены к группе атипии неопределенной значимости. При классификации злокачественности узловых образований этой группы показатели чувствительности, специфичности, положительной прогностической ценности и отрицательной прогностической ценности составили 94,4%, 15,4%, 60,7% и 66,7% соответственно. Отдельного внимания заслуживает возможность разработанной модели отличать фолликулярную аденому от фолликулярного рака, которые обычно дифференцируют по гистологическим и клиническим признакам. Показатель полноты для указанных патологий составил 86,7 и 93,9% соответственно. Несмотря на ограничения и недостатки разработанной системы, включающей снижение специфичности для узловых образований с неопределенными атипиями и худшие показатели для низкодифференцированных форм рака, полученные авторами результаты демонстрируют возможности применения систем на основе СНС для классификации широкого спектра патологий ЩЖ.

Наилучшие показатели точности прогнозирования папиллярного рака с применением СНС продемонстрировали в своем исследовании Duc и соавт. [28]. Цитологические изображения препаратов жидкостной цитологии ThinPrep автоматическим методом были разбиты на фрагменты, аннотированы двумя опытными цитологами, а затем разделены на обучающие, валидационные и тестовые подгруппы. Для формирования датасета использовали 367 оригинальных изображений, из которых 222 случая папиллярного рака и 145 случаев доброкачественных новообразований. Для классификации изображений сравнивали эффективность нескольких типов архитектур СНС: ResNet, DenseNet и Inception. Наилучшие показатели классификации рака по цифровым изображениям тестового набора были достигнуты с использованием архитектуры DenseNet161: общая точность — 95,6%, чувствительность — 97,3%, специфичность — 94,1%. За счет применения метода ансамблевого обучения путем комбинации с несколькими моделями СНС классификатора AdaBoost удалось повысить точность классификации до 99,7%. Повышение точности прогнозирования также было достигнуто посредством цветовой нормализации изображений по методу Рейнхарда [29].

Модели на основе СНС также могут использоваться для распознавания неинформативных препаратов ТАПБ, частота встречаемости которых может варьировать от 3 до 38% [30]. Jang и соавт. первыми разработали ансамблевую модель FNA-Net, которая позволяет in situ проводить оценку неокрашенных мазков аспиратов ткани ЩЖ для выявления препаратов, которые не несут диагностической ценности [31]. Система состоит из двух моделей глубокого обучения для обнаружения кластеров фолликулярных клеток: классификатора ЦПИ и сети Faster R-CNN. Датасет состоял из 205 обучающих изображений, по 41 изображению в валидационной и тестовой выборках. Для проверки способности модели идентифицировать полезные для диагностики препараты авторы создали 10 000 дополнительных наборов данных из исходной тестовой выборки путем многократного случайного отбора групп (по 41 изображению от 6 пациентов). Авторам удалось достичь оценки F1 0,81 и AUC 0,84 при обнаружении недиагностических препаратов, на которых содержалось меньше шести клеточных кластеров. Более высокие показатели достигались, когда порог достоверности был повышен до десяти кластеров — оценка F1 0,915 и AUC 0,953.

ОБСУЖДЕНИЕ

По прогнозам, к 2030 г. рак щитовидной железы может стать четвертым по распространенности среди онкологических заболеваний [32]. Разработка новых эффективных методов ранней диагностики папиллярного рака ЩЖ, как одной из ведущих причин оперативных вмешательств при онкологической патологии во многих странах, является актуальным и перспективным направлением для обеспечения оптимального лечения пациентов. В последние годы разработка и применение методов ИИ в медицинской диагностике значительно продвинулись, создавая новую парадигму цифровой и вычислительной цитопатологии [15]. Традиционная практика использования светового микроскопа и ручного анализа препаратов, остававшаяся неизменной на протяжении последнего века, начала трансформироваться под влиянием этих инноваций. В данном исследовании мы проанализировали случаи использования СНС для классификации цитологических изображений ЩЖ. Во всех исследованиях СНС классифицируют патологические состояния ЩЖ с высокой точностью и чувствительностью, сравнимой с работой опытного цитолога. Тем не менее имеется ряд проблем, изложенных ниже, которые ограничивают внедрение СНС в клиническую практику.

В первую очередь, необходима стандартизация методик получения датасетов обучающих изображений для корректного сравнения эффективностей разных нейросетевых моделей. В некоторых работах получение диагностических фрагментов осуществлялось ручным способом [19][22], однако для получения больших датасетов этот метод является трудоемким. Более перспективным способом является разработка интеллектуальных систем, в которых получение диагностических изображений будет происходить автоматическим способом (за счет возможности применения СНС для сегментации изображений) с последующей их диагностикой в нейросетевом модуле, ответственном за классификацию [26]. Для реализации такого подхода необходимо внедрение в работу организаций здравоохранения оборудования для сканирования цитологических препаратов и разработки программного обеспечения, которое из ЦПИ сможет выделять релевантные изображения для выполнения непосредственно диагностического этапа анализа.

Еще одним существенным недостатком текущих результатов использования СНС для цитологической диагностики является малое количество исследований, в которых обучающие изображения формировались из разных учреждений. Это может быть причиной неточных результатов при трансляции модели в других организациях, поскольку методики подготовки препаратов и изображений могут отличаться. Для решения этой проблемы необходимо проводить исследования с использованием многоцентровых наборов данных, которые будут включать изображения из различных лечебных учреждений и разнообразных групп пациентов. Для успешного развития данного направления необходимо, чтобы каждое учреждение, в котором выполняется цитологическая диагностика, имело базу данных цифровых фотографий цитологических препаратов.

Большинство исследований СНС в цитологической диагностике патологии ЩЖ было связано с классификацией папиллярного рака, фокусируясь на разделении препаратов на две категории: доброкачественные и злокачественные. Однако подобный фокус на бинарной классификации ограничивает способность моделей СНС различать другие, менее распространенные, но серьезные патологии ЩЖ: фолликулярные неоплазии, медуллярные и анапластические формы рака и другие атипичные или доброкачественные образования. Дальнейшие исследования должны стремиться к созданию более сложных моделей, способных классифицировать разные состояния ЩЖ, что позволит клиницистам принимать более обоснованные решения о лечении и последующем наблюдении пациентов.

Перед внедрением технологий на основе СНС в практику цитологической диагностики необходимо провести тщательную оценку их эффективности, переносимости и свободы от предвзятости. Процесс внедрения должен быть постепенным и поэтапным, даже после подтверждения эффективности СНС на тестовых наборах данных, чтобы обеспечить надлежащее доверие к этой технологии со стороны клиницистов и регулирующих органов. Для успешного и безопасного использования таких систем в медицинской практике будущие исследования должны быть направлены на изучение того, как они будут влиять на принятие решений врачами, учитывая как возможные улучшения точности диагностики, так и потенциальные риски. Эти исследования помогут создать безопасные и эффективные интеллектуальные решения, которые ускорят процессы диагностики патологии ЩЖ.

ЗАКЛЮЧЕНИЕ

В представленной работе мы рассмотрели значимые достижения последних лет в области применения СНС в цитологической диагностике патологии ЩЖ. Несмотря на то, что исследований в этом направлении пока немного, но все они демонстрируют высокую эффективность применения СНС для сегментации и классификации цитологических изображений. Полученные результаты имеют все шансы послужить инициатором серьезного сдвига парадигмы привычной цитопатологии в сторону цифровой и вычислительной цитопатологии. Для более быстрого внедрения интеллектуальных инструментов на основе СНС в клиническую практику необходимо проведение дополнительных многоцентровых исследований, которые помогут разрешить проблемы стандартизации изображений и расширения диагностического спектра нейросетевых моделей.

ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ

Источники финансирования. Работа выполнена по инициативе авторов без привлечения финансирования.

Конфликт интересов. Авторы декларируют отсутствие явных и потенциальных конфликтов интересов, связанных с содержанием настоящей статьи.

Участие авторов. Солопов М.В. — разработка концепции исследования, анализ литературы, написание основного текста статьи, подготовка рисунков; Кавелина А.С. — разработка концепции исследования, анализ литературы; Попандопуло А.Г. — написание вводной части статьи, научное консультирование; Турчин В.В., Ищенко Р.В., Филимонов Д.А. — научное консультирование и редактирование статьи. Все авторы одобрили финальную версию статьи перед публикацией, выразили согласие нести ответственность за все аспекты работы, подразумевающую надлежащее изучение и решение вопросов, связанных с точностью или добросовестностью любой части работы.

Список литературы

1. Tran NQ, Le BH, Hoang CK, Nguyen HT, Thai TT. Prevalence of thyroid nodules and associated clinical characteristics: findings from a large sample of people undergoing health checkups at a university hospital in Vietnam. Risk Manag Healthc Policy. 2023;16:899-907. doi: https://doi.org/10.2147/RMHP.S410964

2. Haugen BR, Alexander EK, Bible KC, et al. 2015 American Thyroid Association management guidelines for adult patients with thyroid nodules and differentiated thyroid cancer: the American Thyroid Association guidelines task force on thyroid nodules and differentiated thyroid cancer. Thyroid. 2016;26(1):1-133. doi: https://doi.org/10.1089/THY.2015.0020

3. Filetti S, Durante C, Hartl D, et al. Thyroid cancer: ESMO clinical practice guidelines for diagnosis, treatment and follow-up. Ann Oncol. 2019;30(12):1856-1883. doi: https://doi.org/10.1093/ANNONC/MDZ400

4. Министерство здравоохранения Российской Федерации. Клинические рекомендации «Дифференцированный рак щитовидной железы». Доступно по: https://cr.minzdrav.gov.ru/schema/329_1. Ссылка активна на 13.08.2024

5. Bongiovanni M, Spitale A, Faquin WC, Mazzucchelli L, Baloch ZW. The Bethesda system for reporting thyroid cytopathology: a meta-analysis. Acta Cytol. 2012;56(4):333-339. doi: https://doi.org/10.1159/000339959

6. Kezlarian B, Lin O. Artificial intelligence in thyroid fine needle aspiration biopsies. Acta Cytol. 2021;65(4):324-329. doi: https://doi.org/10.1159/000512097

7. Ali SZ, Baloch ZW, Cochand-Priollet B, Schmitt FC, Vielh P, Vanderlaan PA. The 2023 Bethesda system for reporting thyroid cytopathology. Thyroid. 2023;33(9):1039-1044. doi: https://doi.org/10.1089/THY.2023.0141

8. Vuong HG, Ngo HTT, Bychkov A, et al. Differences in surgical resection rate and risk of malignancy in thyroid cytopathology practice between Western and Asian countries: A systematic review and meta-analysis. Cancer Cytopathol. 2020;128(4):238-249. doi: https://doi.org/10.1002/CNCY.22228

9. Faquin WC, Wong LQ, Afrogheh AH, et al. Impact of reclassifying noninvasive follicular variant of papillary thyroid carcinoma on the risk of malignancy in the Bethesda system for reporting thyroid cytopathology. Cancer Cytopathol. 2016;124(3):181-187. doi: https://doi.org/10.1002/CNCY.21631

10. Van Den Heede K, Tolley NS, Di Marco AN, Palazzo FF. Differentiated thyroid cancer: A health economic review. Cancers (Basel). 2021;13(9):2253. doi: https://doi.org/10.3390/CANCERS13092253/S1

11. Hirokawa M, Niioka H, Suzuki A, et al. Application of deep learning as an ancillary diagnostic tool for thyroid FNA cytology. Cancer Cytopathol. 2023;131(4):217-225. doi: https://doi.org/10.1002/CNCY.22669

12. Dov D, Elliott Range D, Cohen J, et al. Deep-learning-based screening and ancillary testing for thyroid cytopathology. Am J Pathol. 2023;193(9):1185-1194. doi: https://doi.org/10.1016/J.AJPATH.2023.05.011

13. Harrison JH, Gilbertson JR, Hanna MG, et al. Introduction to artificial intelligence and machine learning for pathology. Arch Pathol Lab Med. 2021;145(10):1228-1254. doi: https://doi.org/10.5858/ARPA.2020-0541-CP

14. Ching T, Himmelstein DS, Beaulieu-Jones BK, et al. Opportunities and obstacles for deep learning in biology and medicine. J R Soc Interface. 2018;15(141):20170387. doi: https://doi.org/10.1098/RSIF.2017.0387

15. Habchi Y, Himeur Y, Kheddar H, et al. AI in thyroid cancer diagnosis: techniques, trends, and future directions. Systems. 2023;11(10):519. doi: https://doi.org/10.3390/systems11100519

16. Hubel DH, Wiesel TN. Receptive fields and functional architecture of monkey striate cortex. J Physiol. 1968;195(1):215-243. doi: https://doi.org/10.1113/JPHYSIOL.1968.SP008455

17. Alabrak MMA, Megahed M, Alkhouly AA, et al. Artificial intelligence role in subclassifying cytology of thyroid follicular neoplasm. Asian Pac J Cancer Prev. 2023;24(4):1379-1387. doi: https://doi.org/10.31557/APJCP.2023.24.4.1379

18. Bakaev M, Heil S, Khvorostov V, Gaedke M. How many data does machine learning in human–computer interaction need?: re-estimating the dataset size for convolutional neural network-based models of visual perception. IT Prof. 2023;25(2):23-29. doi: https://doi.org/10.1109/MITP.2023.3262923

19. Sanyal P, Dr TM, Barui S, Das A, Gangopadhyay P. Artificial intelligence in cytopathology: a neural network to identify papillary carcinoma on thyroid fine-needle aspiration cytology smears. J Pathol Inform. 2018;9:43. doi: https://doi.org/10.4103/JPI.JPI_43_18

20. Mall PK, Singh PK, Srivastav S, et al. A comprehensive review of deep neural networks for medical image processing: Recent developments and future opportunities. Healthc Anal. 2023;4:100216. doi: https://doi.org/10.1016/J.HEALTH.2023.100216

21. Mulmule PV, Kanphade RD. Classification of cervical cytology overlapping cell images with transfer learning architectures. Biomed Pharmacol J. 2022;15(1). doi: https://doi.org/10.13005/bpj/2364

22. Guan Q, Wang Y, Ping B, et al. Deep convolutional neural network VGG-16 model for differential diagnosing of papillary thyroid carcinomas in cytological images: a pilot study. J Cancer. 2019;10(20):4876. doi: https://doi.org/10.7150/JCA.28769

23. Dov D, Kovalsky SZ, Cohen J, Range DE, Henao R, Carin L. Thyroid cancer malignancy prediction from whole slide cytopathology images. Proc Mach Learn Res. 2019;106:553-570

24. Dov D, Kovalsky SZ, Assaad S, et al. Weakly supervised instance learning for thyroid malignancy prediction from whole slide cytopathology images. Med Image Anal. 2021;67:101814e. doi: https://doi.org/10.1016/J.MEDIA.2020.101814

25. Elliott Range DD, Dov D, Kovalsky SZ, Henao R, Carin L, Cohen J. Application of a machine learning algorithm to predict malignancy in thyroid cytopathology. Cancer Cytopathol. 2020;128(4):287-295. doi: https://doi.org/10.1002/CNCY.22238

26. Dov D, Kovalsky SZ, Feng Q, et al. Use of machine learning-based software for the screening of thyroid cytopathology whole slide images. Arch Pathol Lab Med. 2022;146(7):872-878. doi: https://doi.org/10.5858/ARPA.2020-0712-OA

27. Duan W, Gao L, Liu J, et al. Computer-assisted fine-needle aspiration cytology of thyroid using two-stage refined convolutional neural network. Electronics. 2022;11(24):4089. doi: https://doi.org/10.3390/ELECTRONICS11244089

28. Duc NT, Lee YM, Park JH, Lee B. An ensemble deep learning for automatic prediction of papillary thyroid carcinoma using fine needle aspiration cytology. Expert Syst Appl. 2022;188(4):115927. doi: https://doi.org/10.1016/j.eswa.2021.115927

29. Reinhard E, Ashikhmin M, Gooch B, Shirley P. Color transfer between images. IEEE Comput Graph Appl. 2001;21(5):34-41. doi: https://doi.org/10.1109/38.946629

30. Houdek D, Cooke-Hubley S, Puttagunta L, Morrish D. Factors affecting thyroid nodule fine needle aspiration non-diagnostic rates: a retrospective association study of 1975 thyroid biopsies. Thyroid Res. 2021;14(1). doi: https://doi.org/10.1186/S13044-021-00093-2

31. Jang J, Kim Y, Westgate B, et al. Screening adequacy of unstained thyroid fine needle aspiration samples using a deep learning-based classifier. Sci Rep. 2023;13(1):13525. doi: https://doi.org/10.1038/S41598-023-40652-1

32. Rahib L, Smith BD, Aizenberg R, Rosenzweig AB, Fleshman JM, Matrisian LM. Projecting cancer incidence and deaths to 2030: The unexpected burden of thyroid, liver, and pancreas cancers in the united states. Cancer Res. 2014;74(11):2913-2921. doi: https://doi.org/10.1158/0008-5472.CAN-14-0155


Об авторах

М. В. Солопов
Институт неотложной и восстановительной хирургии им. В.К. Гусака
Россия

Солопов Максим Витальевич, биолог лаборатории клеточного и тканевого культивирования, специалист по работе с системами искусственного интеллекта

283016, Донецк, ул. Аравийская, д. 4, кв. 158



А. С. Кавелина
Институт неотложной и восстановительной хирургии им. В.К. Гусака
Россия

Кавелина Анна Станиславовна, к.м.н., биолог лаборатории клеточного и тканевого культивирования, специалист по цитологической диагностике ТАПБ щитовидной железы

Донецк

Scopus Author ID: 57190676738



А. Г. Попандопуло
Институт неотложной и восстановительной хирургии им. В.К. Гусака
Россия

Попандопуло Андрей Геннадиевич, д.м.н., профессор, заведующий лабораторией клеточного и тканевого культивирования, врач-хирург

Донецк



В. В. Турчин
Институт неотложной и восстановительной хирургии им. В.К. Гусака
Россия

Турчин Виктор Васильевич, биолог лаборатории клеточного и тканевого культивирования 

Донецк



Р. В. Ищенко
Институт неотложной и восстановительной хирургии им. В.К. Гусака
Россия

Ищенко Роман Викторович, д.м.н., директор 

Донецк



Д. А. Филимонов
Институт неотложной и восстановительной хирургии им. В.К. Гусака
Россия

Филимонов Дмитрий Алексеевич, д.м.н., заместитель директора по научной работе 

Донецк



Дополнительные файлы

1. Рисунок 1. Алгоритм обучения СНС для цитологической диагностики патологии щитовидной железы.
Тема свёрточная нейронная сеть; цитодиагностика; щитовидная железа
Тип Прочее
Посмотреть (800KB)    
Метаданные ▾

Рецензия

Для цитирования:


Солопов М.В., Кавелина А.С., Попандопуло А.Г., Турчин В.В., Ищенко Р.В., Филимонов Д.А. Перспективы применения свёрточных нейронных сетей в цитологической диагностике узловых образований щитовидной железы. Проблемы Эндокринологии. 2025;71(3):4-13. https://doi.org/10.14341/probl13475

For citation:


Solopov M.V., Kavelina A.S., Popandopulo A.G., Turchin V.V., Ishchenko R.V., Filimonov D.A. Prospects for the application of convolutional neural networks in the cytological diagnosis of thyroid nodules. Problems of Endocrinology. 2025;71(3):4-13. (In Russ.) https://doi.org/10.14341/probl13475

Просмотров: 147


ISSN 0375-9660 (Print)
ISSN 2308-1430 (Online)