Differential diagnosis of benign, borderline, and malignant ovarian masses in pregnant women, by using logistic regression models

Gerasimova A.A., Shvyrev S.L., Stepanov K.I., Gus A.I., Klimenko P.A.

Russian State Medical University, Russian Agency for Health Care, Moscow; Center for Family Planning and Reproduction, Moscow Healthcare Department; Academician V. I. Kulakov Research Center of Obstetrics, Gynecology, and Perinatology, Ministry of Health and Social Development of Russia, Moscow
Objective: to enhance the accuracy of differential diagnosis of benign, borderline, and malignant ovarian tumors in pregnant women, by building a logistic regression model.
Material and methods. Regression logistic models were built to demonstrate that one can differentiate true tumors from tumor-like masses and benign neoplasms from malignant ones in 223 pregnant women on the basis of ultrasound signs of ovarian tumor-like masses and tumors.
Results. While diagnosing benign ovarian tumors in pregnant women, the sensitivity and specificity of the model were 97 and 95%, respectively. While diagnosing borderline and malignant tumors, the sensitivity of the model was 100% and its specificity was 92.3% with a total accuracy of 92.8%.
Conclusion. The performed studies demonstrated that the authors’ regression logistic models can help a practitioner make timely a differential diagnosis of ovarian tumors in pregnant women, thus using their rational treatment policy.

Keywords

tumor-like masses
ovarian tumors in pregnant women
accuracy
specificity
sensitivity of regression logistic models

Как известно, диагностика характера образований яичников до настоящего времени имеет
существенные трудности вообще, а у беременных в частности. Вместе с тем для выбора правильной
тактики лечения перед оперативным вмешательством необходимо с определенной долей вероятности знать характер образования [3–5, 8–10, 12, 13, 15, 17].

В 1990 г. I. Jacobs и соавт. [11] предложили «индекс злокачественности», впервые создав модель, анализирующую комбинацию клинических, ультразвуковых и биохимических маркеров. В дальнейшем были предприняты попытки создания моделей на основе логистической регрессии. Мы также проводили подобную работу у беременных [2], результативность которой составила около 65%. У небеременных точность субъективной оценки ультразвуковых данных высококвалифицированным специалистом существенно превосходила точность модели [16]. Отчасти, это было связано с недостаточным количеством ультразвуковых параметров у беременных с опухолевой патологией, а дифференциальная диагностика проводилась на разрозненных материалах. В дальнейшем была создана многоцентровая международная группа исследования опухолей яичников с обязательным
использованием единого протокола при проведении ультразвукового исследования (УЗИ). Мы продолжили набор клинических наблюдений в рамках данной проблемы.

Целью нашего исследования явилось улучшение качества дифференциальной диагностики доброкачественных, пограничных и злокачественных опухолей яичников с помощью построения логистической регрессионной модели.

Материал и методы исследования

В статистическое исследование вошли данные 223 проспективно обследованных в 12–39 нед
беременности пациенток, у которых при проведении УЗИ обнаруживали опухолевидные образования или опухоли яичников. У 14 пациенток в момент обследования гестационный возраст плода не достигал 12 нед, у 67 составлял от 12 до 24 нед, у 51 – от 24 до 36 нед и у 86 – более 37 нед. До 12 нед беременности использовали влагалищный датчик, от 12 до 24 нед – влагалищный и абдоминальный, после 24 нед – только абдоминальный. Оперативному вмешательству в I–II триместрах были подвергнуты 12 пациенток, в III – 4, кесарево сечение с удалением образования яичника было проведено 47 пациенткам, прооперированы в течение 3 мес после родов – 85, от трех мес до года – 63 пациентки. Полученные результаты сопоставлялись с морфологическими исследованиями.

На основании ультразвуковых и морфологических диагнозов все беременные были разделены
на две группы. Первую группу составили 83 беременные, у которых были констатированы опухолевидные образования, из них у 25 была киста желтого тела, у 1 – лютеома беременных, у 1 – фолликулярная киста, у 30 – параовариальная киста и у 26 – эндометриоидная киста. Вторую группу
составили 126 беременных, у которых выявили истинные опухоли яичников: 58 эпителиальных опухолей (46 серозных и 12 муцинозных цистаденом), у 6 пациенток – опухоли стромы полового тяжа (4 фибромы и 2 текомы), у 62 – тератомы.

Помимо этого, мы обследовали 13 пациенток, у 8 из которых были выявлены пограничные папиллярные серозные цистаденомы, у 2 – дисгерминомы, у 2 – незрелые тератомы и у 1 – андробластома.

Ультразвуковое исследование проводили на аппарате Сименс Х-300, модель СА 94043, США. При этом определяли размер яичниковых образований, одно- или двусторонность поражения, структуру, число камер, эхогенность, толщину стенки образования и ее наружные и внутренние контуры, толщину неизмененной ткани яичника, локализацию сосудов и показатели допплерометрии – индекс резистентности (RI) и пульсационный индекс (РI). Затем изучаемые показатели кодировали следующим образом:

Локализация: односторонняя – 1, двусторонняя – 2.

Ткань яичника: определяется – 1, не определяется – 2.

Величина неизмененной ткани яичника:
не визуализируется – 1, визуализируется менее 1 см – 2, визуализируется более 1 см – 3.

Число камер: однокамерное – 1, двукамерное – 2, многокамерное – 3.

Размер образования: 3–5 см – 1, 6–10 см – 2, более 10 см – 3.

Толщина стенки: 1–3 мм – 1, более 3 мм – 2.

Структура: кистозная – 1, кистозно-солидная – 2, солидно-кистозная – 3, солидная – 4.

Содержимое: однородное жидкостное – 1, неоднородное жидкостное со взвесью – 2, неоднородное жидкостное с перегородками – 3, неоднородное жидкостное с папиллярными разрастаниями – 4, иные структуры – 5, недифференцируемая ткань – 6, плотная ткань – 7.

Наружные контуры: четкие – 1, нечеткие – 2, бугристые – 3, ровные – 4.

Внутренние контуры: ровные – 1, неровные – 2, четкие – 3, нечеткие – 4, не определяются – 5.

Эхогенность: высокая – 1, средняя – 2, низкая – 3, анэхогенная – 4, анэхогенная с плотным компонентом – 5.

Локализация сосудов: в папиллярных разрастаниях – 1, в стенке – 2, в перегородках – 3,
в пристеночном компоненте – 4, другое – 5, не определяется – 6, в стенке и разрастаниях – 7,
в плотном компоненте – 8.

Кровоток: определяется – 1, не определяется – 2.

Характер кровотока: артериальный – 1, венозный – 2, мозаичный – 3.

Индекс резистентности (RI): высокий более 0,6 – 1, средний 0,4—0,6 – 2, низкий менее 0,4 – 3, нет – 4.

Пульсационный индекс (PI): – высокий более 1,5 – 1, средний 1–1,5 – 2, низкий менее 1 – 3. Ультразвуковые и допплерометрические данные, полученные при описании визуализируемых опухолевидных образований и опухолей малого таза, преобразовывали в коды. Для статистической обработки данных применяли прикладной пакет программ SPSS 15.0, использовали описательную статистику и корреляционный анализ по методу Спирмена. Для поиска достоверных различий между выборками использовали критерий Вилкоксона-Манна-Уитни, различия считались статистически значимыми при значении p<0,05. Кроме того, данные подвергали частотному анализу путем построения кросс-таблиц.

Прогностические модели создавали для дифференциальной диагностики 1) истинных опухолей от опухолевидных образований и 2) доброкачественных опухолей от пограничных и злокачественных.

Среди 223 пациенток истинные опухоли были у 139 (62,3%), опухолевидные образования – у 83 (37,2%), доброкачественные опухоли – у 126 (56,5%); в одном наблюдении диагноз установлен не был. Пациенток с пограничными и злокачественными опухолями было 13 (5,8%), злокачественная опухоль отсутстсвовала у 210 беременных. Для обоих прогнозируемых состояний было проведено разбиение (общепринятая терминология математиков) исходных данных на обучающую и тестовую выборки в соотношении 60%/40%. В группах сохранялось соотношение наблюдений исследуемому состоянию. Затем была произведена оценка значимости различий по всем входным параметрам. Оказалось, что ультразвуковые параметры имеют статистически значимые различия
(табл. 1).

Таблица 1. Значимость различий (р) ультразвуковых параметров по группе и типу образования
(критерий Манна-Уитни).

Для построения моделей использовали методы бинарной логистической регрессии и дискриминантного анализа. Бинарная логистическая регрессия – метод нелинейного регрессионного анализа, позволяющий прогнозировать параметры, имеющие два состояния. Этот метод активно используется для построения прогностических моделей в биологии и медицине. Для логистической регрессии вероятность попадания в исследуемую группу рассчитывается по формуле:

Формула 1

где ηi=многочлен Bi*xi I=0…n

Построение модели сводится к нахождению коэффициентов B[i](I=0…n, B[0] – регрессионная константа).

Оценка переменных происходит методом минимизации логарифмической функции подобия (Log likehood function), являющейся аналогом расстояния в линейных регрессионных моделях. Log likehood function:

Формула 2

где y – наблюдаемые значения.

Для проверки точности построенных моделей использовались методы скользящего экзамена и метод
bootstrap.

Скользящий экзамен позволяет проверить качество обучающей выборки. Для проведения анализа из обучающей выборки исключалось одно наблюдение и строилась требуемая модель. Затем проверялась точность диагностики для исключенного наблюдения. Так делалось для определенного числа (или для всех) наблюдений в обучающей выборке. Затем считалось число верных срабатываний модели. Это число являлось уточняющей точности модели, построенной на всей обучающей выборке.

Метод bootstrap заключается в повторяющемся разбиении массива данных на обучающую и тестовую выборки и проверке построенных моделей. Распределение значений точности показывает случайность разбиения исходных данных на обучающую и тестовую выборки, то есть исключает возможность случайного (и неверного) увеличения точности построенных моделей. В исследовании при проверке методом bootstrap повторение разбиения проводилось 1000 раз.

Для оценки точности моделей, помимо собственно процента верных отнесений, учитывались
параметры чувствительности и специфичности. Чувствительность равна доле верно определенных случаев более тяжелого состояния среди всех наблюдений с более тяжелым состоянием. Специфичность рассчитывается аналогично для менее тяжелого состояния. Необходимость использования именно этих параметров наиболее актуальна для моделей с неравным разделением по наблюдениям, что имеется в нашем исследовании в части диагностики злокачественных новообразований.

Результаты исследования

1. Модель для диагностики пограничных и злокачественных опухолей у беременных.
С помощью пошагового метода в модель были включены четыре параметра: ткань яичника, RI, PI, расположение сосудов (табл. 2). Включенные параметры незначительно коррелируют друг с другом, за исключением пары «RI» – «Расположение сосудов». Однако при удалении любого из этой пары точность модели снижается. Это касается всех последующих моделей. Полученная модель на тестовой выборке продемонстрировала чувствительность 100% и специфичность 92,3% при суммарной точности модели 92,8%. Проверка с помощью скользящего экзамена и методом bootstrap показала устойчивость модели. Следует учитывать, что при оценке модели приоритет остается за чувствительностью, а вовсе не за точностью модели в сумме.

Таблица 2. Коэффициенты корреляции между параметрами, включеными в регрессионную модель.

Построение дискриминантной функции осуществлялось на основе тех же параметров, что и модели регрессии. Незначительная разница коэффициентов позволяет перейти от сложной
функции к модели балльной оценки. Наибольшую значимость имеет коэффициент при параметре
RI, поэтому его высокое значение приравнивается к 2 баллам, каждый из остальных параметров дает один балл. Дискриминантная функция в таком виде приобретает форму суммы баллов. Cумма баллов до 2 включительно означает низкую вероятность злокачественной опухоли, более 2 баллов – высокую вероятность (табл. 3).

Таблица 3. Дискретная модель для диагностики злокачественных и пограничных образований.

На имеющихся данных правило определяет все случаи со злокачественными образованиями и 94% случаев с отсутствием злокачественного образования.

Модель имеет преимущество перед непрерывными моделями, в частности в связи с неоднозначностью расположения кодов для расположения сосудов. Простое умножение кода, используемое в непрерывных моделях, уступает по точности определению диагностически важных параметров.

Дискретная модель обладает сравнимой точностью с непрерывной моделью, при этом имея большую практическую ценность, поскольку может применяться в клинических условиях без необходимости использования вычислительной техники.

Площадь под графиком ROC-кривой для суммы баллов составляет 0,988 (рис. 1). Это очень высокий результат, характеризующий высокую эффективность модели для дифференцирования наблюдений со злокачественными образованиями.

ROC-кривая диагностической модели злокачественных и пограничных опухолей у беременных

2. Модель для диагностики доброкачественных опухолей у беременных.
Аналогично модели для диагностики злокачественных образований на первом этапе строилась
модель логистической регрессии с целью отбора параметров, имеющих максимальное прогностическое значение.

Для диагностики доброкачественных опухолей были отобраны следующие параметры: ткань яичника, структура, число камер и неизмененная ткань яичника. Корреляция между параметрами незначительная, максимальное значение не превышает 0,3 (табл. 4).

Таблица 4. Коэффициенты корреляции между параметрами, включаемыми в регрессионную модель.

Таблица 5. Дискретная модель для диагностики доброкачественных опухолей яичников.

Построенная модель на основе бинарной логистической регрессии имела чувствительность 97% и специфичность 96%. Проверка с помощью скользящего экзамена и методом bootstrap показала устойчивость модели. При скользящем экзамене неправильно диагностировано было лишь одно наблюдение из правильно определенных моделью.

Случайные модели, построенные при проверке методом bootstrap, в среднем были точны на 96,7%
(рис. 2). В отличие от предыдущей модели, общая точность определяет качество модели.

Гистограмма распределения точности случайных моделей диагностики доброкачественных опухолей у беременных (среднее значение - 96,7%, минимум - 85,2%, максимум - 100,0%)

Значения коэффициентов одного порядка, отрицательное значение коэффициента для параметра «Величина неизмененной ткани яичника» означала то, что принятая кодировка обратно пропорционально диагностическому значению параметра. В результате мы можем построить дискретную диагностическую функцию, как и в случае со злокачественными новообразованиями. По каждому параметру добавляется один балл. Истинная опухоль вероятна при любой сумме баллов выше 0 (табл. 5).

Чувствительность и специфичность модели составляют 97 и 95% соответственно (рис. 3). Это
превышает точность непрерывной дискриминантной модели.

ROC-кривая диагностической модели истинных опухолей яичников у беременных

Площадь под графиком ROC-кривой для суммы баллов составляет 0,98. Это очень высокий результат, характеризующий высокую эффективность модели для диагностики опухолей.

Обсуждение результатов

Проведенные исследования показали, что предложенные нами логистические регрессионные модели для дифференциальной диагностики доброкачественных, пограничных и злокачественных опухолей чичникову беременных высоко воспроизводимы, обладают высокой чувствительностью и специфичностью. При диагностике доброкачественных опухолей яичников у беременных чувствительность и специфичность модели составляют 97 и 95% соответственно. При диагностике пограничных и злокачественных опухолей яичников у беременных чувствительность модели составляет 100%, а специфичность – 92,3% при суммарной точности 92,8%. В нашей стране при субъективной оценке ультразвуковых параметров, полученных высококвалифицированными специалистами, работающими в области онкологии, возможность выявления пограничных опухолей яичников составила более 50% [6, 7]; в других исследованиях эта патология выявлялась в 72,6% [1] и в 89% наблюдений[4]. Исследования проводились у небеременных. Зарубежные авторы считают, что у высококвалифицированных врачей при диагностике рака яичников на основании субъективных данных, чувствительность диагностики достигает 96%, специфичность 90%. У менее квалифицированных врачей эти показатели составляют 86 и 80% соответственно [14].

Таким образом, проведенные нами исследования продемонстрировали возможность с помощью
созданных нами регрессионных логистических моделей помочь практическому врачу своевременно
проводить дифференциальную диагностику опухолей яичников у беременных и тем самым использовать рациональную тактику их лечения.

References

1. Gromova M.A., Tabakman Ju.Ju. i dr. Opuholevye markery v diagnostike pogranichnyh opuholej jaichnikov// Materialy Mezhdunarodnogo kongressa po onkohirurgii. Krasnodar, 28 maja – 1 ijunja 2007. – S. 1.
2. Gerasimova A.A., Gus A.I., Klimenko P.A. Sposob differencial'noj diagnostiki opuholepodobnyh obrazovanij i opuholej jaichnikov u beremennyh. – Pat. na izobretenie 2325118 ot 5 ijunja 2007.
3. Demidov V.N., Gus A.I., Adamjan L.V. Jehografija organov malogo taza u zhenwin: Prakticheskoe posobie. Vyp.2. Kisty pridatkov matki i dobrokachestvennye opuholi jaichnikov. – M.: NC AGiP RAMN, 1999.
4. Demidov V.N., Gus A.I., Adamjan L.V., Lipatenkova Ju.I. Jehografija organov malogo taza u zhenwin: Prakticheskoe posobie. Vyp. 4. Pogranichnye opuholi, rak i redkie opuholi jaichnikov. – M.: NC AGiP RAMN, 2005.
5. Krasnopol'skij V.I. i dr. Metod lechenija dobrokachestvennyh opuholej jaichnikov u beremennyh i rodil'nic. Medicinskaja tehnologija. – M., 2006.
6. Novikova E.G., Batalova G.Ju. i dr. Algoritm differencial'noj diagnostiki i ocenki rasprostranennosti opuholej jaichnikov// Ros. onkol. zhurn. – 1996. – № 2. – S. 40–43.
7. Novikova E.G., Batalova G.Ju. Sovremennye predstavlenija o pogranichnyh opuholjah jaichnikov // Vopr. onkol. – 2005. – № 2. – S. 57–59.Cannistra S. Ovarian cancer // N. Engl. J. Med. – 2004. – Vol. 351. – Р. 2519–2529.
8. Carley M.E., Klingele C.J. et al. Laparoscopy versus laparotomy in the management of benign unilateral adnexal masses // J. Am. Assoc. Gynecol. Laparosc. – 2002. – Vol. 9. – Р. 321–326.
9. Granberg S., Wikland M., Jansson I. Macroscopic characterization of ovarian tumors and the relation to the histological diagnosis: criteria to be used for ultrasound evaluation // Gynecol. Oncol. – 1989. – Vol. 35. – Р. 139–144.
10. Jacobs I., Oram D. et al. A risk of malignancy index incorporating CA 125, ultrasound and menopausal status for the accurate preoperative diagnosis of ovarian cancer // Br. J. Obstet. Gynaecol. – 1990. – Vol. 97. – Р. 922–929.
11. Medeiros L.R., Stein A.T. et al. Laparoscopy versus laparotomy for benign ovarian tumours // Cocbrane Database Syst. Rev. – 2005. – № 20: CD 004751.
12. Tailor A., Jurkovic D. et al. Sonographic prediction of malignancy in adnexal masses using multivariate logistic regression analysis // Ultrasound Obstet. Gynecol. – 1997. – Vol.10. – Р. 41–47.
13. Timmerman D., Testa A.C., Bourne T. Logistic regression model to distinguish between the benign and malignant adnexal mass before surgery. A Multicenter Study by the International Ovarian Tumor Analysis Group // J. Clin. Oncol. – 2005. – Vol. 23. – Р. 8794–8801.
14. Van Calster B., Timmerman D., Lu C. et al. Preoperative diagnosis of ovarian tumors using Bayesian kernel-based methods // Ultrasound Obstet. Gynecol. – 2007. – Vol. 29. – Р. 496–504.
15. Valentin L., Hagen B. et al. Comparison of pattern recognition and logistic regression models for discrimination between benign and malignant pelvic masses. A prospective cross-validation // Ultrasound Obstet. Gynecol. – 2001. – Vol. 18. – Р. 357–365.
16. Vergote I., De Brabanter J. et al. Prognostic importance of degree of differentiation and cyst rupture in stage I invasive epithelial ovarian carcinoma// Lancet. – 2001. – Vol. 357. – Р. 176–182.

About the Authors

Professor KLIMENKO Petr Afanasyevich, MD, Department of Obstetrics and Gynecology, Faculty of Pediatrics, Russian State Medical University, Russian Agency for Health Care, Moscow
Address: 24A, Sevastopolsky Pr., Moscow
Telephone: 332-21-69, 8 (903) 154-03-32

Similar Articles

By continuing to use our site, you consent to the processing of cookies that ensure the proper functioning of the site.