Информационные технологии в доказательной медицине 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Информационные технологии в доказательной медицине



В последние годы значительное внимание уделяется принципам доказательности во всех сферах деятельности медицинской практики. В основу этого направления положены современные технологии работы с медицинской информации.

Доказательная медицина – это концепция организации медицинских знаний, основанная на строгих научных данных. При этом личный опыт, авторитет коллег и литературные данные имеют вторичное, подчиненное значение. Главенствующим принципом принятия врачебного и управленческого решения является только объективный факт. Отсюда другое (зарубежное) название этой науки – evidence-based medicine – медицина, основанная на фактах.

Предпосылками для введения медицины как научного знания явились несколько факторов, присущных медицинской деятельности и управлению этой отраслью знаний. В частности главенствующими факторами выступают несколько специфичных для данной области знаний обстоятельств.

1. Диагноз, прогноз и результаты лечения конкретного заболевания всегда неопределенны и поэтому должны выражаться через вероятности. Они зависят от места и условий работы медицинского персонала, эпидемиологической ситуации в районе пребывания больного, стадии и формы заболевания, социальных особенностей здравоохранения.

2. В любом клиническом наблюдении заложена предвзятость и, следовательно, выраженные в той или иной степени систематические ошибки.

3. В любом клиническом наблюдении обязательно присутствуют случайные, или рандомизированные, ошибки. Они снижают достоверность получаемых данных и могут быть скорректированы статистически.

4. Принятие управленческого решения в организации здравоохранения всегда сопряжено с учетом политических и экономических обстоятельств, а также личностных свойств руководителя. Наслоение этих факторов деформирует клиническую ситуацию и неизбежно приводит к искажению истинных клинических данных.

5. Информационные потоки медицинских данных и знаний, как правило, слабо структурированы и, следовательно, всегда подвержены личностным оценкам.

В доказательной медицине можно выделить 4 основных ее раздела:

· доказательная медицинская диагностика,

· доказательное лечение,

· доказательная организация и управление здравоохранением,

· доказательный анализ медицинской литературы.

Доказательная диагностика

Для того, чтобы оценить диагностическую эффективность медицинских исследований, сравнивают его информативность, т.е. способность распознавать заболевание, с так называемым референтным, или эталонным, диагнозом. В качестве референтного медицинского диагноза обычно выступает так называемый «золотой стандарт», который базируется на безупречно доказанном диагнозе.

В качестве такового следует рассматривать, прежде всего, данные патоморфологического исследования. Однако это положение является далеко не правилом. Золотым стандартом могут быть другие методы диагностики, которые по своему характеру дают максимально возможную и точную характеристику патологического процесса. Так, например, золотым стандартом в диагностике ишемической болезни сердца может быть коронарография, в диагностике окклюзирующих поражений периферических сосудов успешно, с максимально допустимой точностью выступает цветное допплеровское картирование.

В практической деятельности любого врача-диагноста (им может стать радиолог, лаборант, биохимик или лечащий врач) при анализе любого теста могут встретиться только четыре варианта ответов:

1. Интерпретация «положительный» у больных с наличием заболевания. Это – истинно положительные случаи (TP, true positive).

2. Интерпретация «отрицательный» у пациентов без заболевания. Это – истинно отрицательные случаи (TN, true negative).

3. Интерпретация «положительный» у пациентов с отсутствием заболевания (у здоровых лиц). Это ложноположительные случаи (FP, false positive) (ошибки I типа, α–ошибки, «ложные тревоги») В практической медицине риск совершить такого рода ошибки каждой врач устанавливает по-своему. Однако общепринятой критической величиной ложной тревоги является величина α-риска, равная 0,05, или 5%. Этот уровень обозначается в медицинской статистике как уровень статистически значимого показателя. Он обозначается как p ≤ 0,05. Практически это означает, что врач ошибается в 1 случае из 20.

4. Интерпретация «отрицательный» у больных с заболеваниями.

Это – ложноотрицательные случаи (FN, false negative) (ошибки

II типа, пропуски, β-ошибки).

Как ложноположительные, так и ложноотрицательные ошибки представляют собою совокупность ошибок диагностики и выдвигают основное требование перед врачом-диагностом – их минимизации.

Для характеристики информативности диагностического метода исследования служат объективные параметры, именуемые операционными характеристиками теста.

К операционным характеристикам метода диагностики относятся:

· чувствительность (Se, sensitivity),

· специфичность (Sp, specificity),

Другая группа показателей информативности относится к вспомогательным критериям, так как их значимость непостоянна и зависит от распространенности заболевания (преваленса).

Преваленс (Ps) – это вероятность определенного заболевания, или проще, его частота встречаемости среди изучаемой группы людей или популяции в целом.

От преваленса следует отличать инцидент (In) – вероятность нового заболевания в рассматриваемой группе людей (популяции) за определенный промежуток времени, чаще за один год.

К вспомогательным критериям информативности относятся:

· точность (Ac, accuracy),

· прогностичность положительного результата (+VP, positive predictive value),

· прогностичность отрицательного результата (-VP, negative predictive value).

Чувствительность (Se ) – это пропорция правильных положительных результатов теста среди всех больных. Определяется по формуле:

,

где Se – чувствительность, TP – верно положительные случаи, D+ число больных туберкулезом.

Чувствительность априори показывает, какова будет доля больных, у которых данное исследование даст положительный результат. Чем выше чувствительность теста, тем чаще с его помощью будет выявляться заболевание, тем, следовательно, он более эффективен. В то же время, если такой высокочувствительный тест оказывается отрицательным, то наличие заболевания маловероятно. Поэтому их следует применять для исключения заболеваний. В силу этого высокочувствительные тесты нередко именуют идентификаторами. Тесты с высокой чувствительностью рекомендуются применять на ранних этапах диагностического процесса, когда требуется сузить круг предполагаемых заболеваний. Необходимо также отметить, что высокочувствительный тест дает много «ложных тревог», что требует дополнительных финансовых затрат на дальнейшее обследование.

Специфичность (Sp) – это пропорция правильных отрицательных результатов теста среди здоровых пациентов. Данный показатель определяется по формуле

,

где Sp – специфичность, TN – истинно отрицательные случаи, D- здоровые пациенты.

Определивспецифичность, можно априори предполагать, какова доля здоровых лиц, у которых это исследование даст отрицательный результат. Чем выше специфичность метода, тем надежнее с его помощью подтверждается заболевание, тем, следовательно, он более эффективен. Высокоспецифичные тесты называются в диагностике дискриминаторами. Тестирование эффективно на втором этапе диагностики, когда круг предполагаемых заболеваний сужен и необходимо с большой уверенностью доказать наличие болезни. Отрицательным фактором высокоспецифичного теста является тот факт, что его использование сопровождается весьма значительным числом пропусков заболевания.

Из сказанного следует очень важный практический вывод, который состоит в том, что в медицинской диагностике желателен тест, который был бы априорно как высокоспецифичен, так и высокочувствителен. Однако в реальности этого достичь нельзя, так как повышение чувствительности теста неизбежно будет сопровождаться потерей его специфичности и наоборот, повышение специфичности теста сопряжено со снижением его чувствительности. Отсюда следует вывод: чтобы создать оптимальную диагностическую систему нужно найти компромисс между показателями чувствительности и специфичности, при которых финансовые затраты на обследование будут оптимально отражать баланс между рисками «ложных тревог» и пропуска заболеваний.

Точность (Ac) – это пропорция правильных результатов теста среди всех обследованных пациентов. Она определяется по формуле:

,

где Ac – точность, TP – истинно положительные решения, TN – истинно отрицательные решения, D+ – все здоровые пациенты, D- – все больные пациенты.

Точность, таким образом, отражает, сколько всего правильных ответов получено в результате испытаний данного теста. Иногда этот критерий называют показателем диагностической эффективности и обозначают как De – diagnostic efficiency, диагностическая эффективность.

Для правильного понимания диагностической эффективности методов исследования важную роль играют критерии апостериорной вероятности – прогностичность положительного и отрицательного результатов. Именно эти критерии показывают, какова вероятность заболевания (или его отсутствия) при известном результате исследования. Нетрудно видеть, что апостериорные показатели имеют большее значение, чем априорные.

Прогностичность положительного результата (+VP) это пропорцияправильно положительных случаев среди всех положительных значений теста. Данный показатель определяется по формуле

где +PV-– прогностичность положительного результата, TP – истинно положительные случаи, FN – ложно отрицательные случаи.

Прогностичность положительного результата, таким образом, напрямую показывает, насколько велика вероятность болезни при положительных результатах исследования.

Прогностичность отрицательного результата (-VP) – это пропорция верно отрицательных случаев среди всех отрицательных решений. Этот критерий определяется по формуле

,

где -PV – прогностичность отрицательного результата, TN – истинно отрицательные случаи, FP – ложно положительные случаи.

Данный критерий, таким образом, показывает то, насколько велика вероятность того, что пациент он здоров, если результаты теста отрицательные.

Если операционные характеристики – чувствительность и специфичность – не зависят от частоты заболевания, то прогностичность теста – положительная и отрицательная – напрямую связана с преваленсом. Чем выше преваленс, тем выше прогностичность положительного результата. Прогностичность тестов также связана с их операционными характеристиками – чувствительностью и специфичностью. Чем выше чувствительность теста, тем выше прогностическая ценность его отрицательного результата. Прогностичность положительного результата в основном зависит от специфичности. Низкоспецифичные методы сопровождаются возникновением большого числа ложно положительных решений. Это приводит к снижению прогностичности положительных результатов теста.

Отдельного рассмотрения требует вопрос сочетанного применения ряда тестов, что является обычной практикой лечебных учреждений. При этом параллельное применение нескольких тестов обеспечивает их большую чувствительность, а следовательно, и более высокую прогностическую ценность отрицательного результата. Вместе с тем, снижается специфичность и прогностическая ценность положительного результата теста.

При последовательном применении диагностических тестов снижаются чувствительность и прогностическая ценность отрицательного результата, но вместе с тем повышаются специфичность и прогностическая ценность положительного результата. Таким образом, комбинация различных методик исследования, изменение их последовательности меняют совокупность операционных характеристик каждого теста в отдельности и общую прогностичность их результатов.

Из сказанного следует важный вывод доказательной медицины: прогностические характеристики любого теста нельзя автоматически, без учета преваленса и ряда других обстоятельств переносить на все лечебные учреждения. Например, прогностическая ценность маммографии, полученной в онкологическом центре, будет иной, чем в поликлинике или при реализации массового обследования населения – скрининга.

Теория доказательной медицины показала, что разграничение групп пациентов по состоянию здоровья на норму и патологию условно и зависит от точки разделения этих состояний в зависимости от субъективных качеств исследователя – его решительности или осторожности (рис.9.1), а также от других предпосылок – внешних и внутренних. Если точка X на оси принятия решений сместится в сторону большей решительности или в противоположную сторону – осторожности, то изменятся взаимоотношения между всеми четырьмя показателями информативности: истинно положительными, истинно отрицательными, ложно положительными и ложно отрицательными результатами.

 

Рис.9.1. Связь между четырьмя состояниями – истинно положительными, истинно отрицательными, ложно положительными - (β) (зона помечена значками) и ложно отрицательными (α) результатами. X -точка на оси критерия принятия решения для разделения больных на норму и патологию, утолщенная прозрачная стрелка – – диапазон (зона) принятия решений для разделения нормы и патологии, d – критерий распознавания сигнала (болезни).

 

С целью определения операционных характеристик теста результаты его применения сводят в определенную таблицу, называемую матрицей решений (табл. 9.1). При этом в структуре исследуемых пациентов должны быть обязательно представлены две группы наблюдений. Первую группу составляют пациенты с точно установленным (референтным) диагнозом. Вторую группу должны составить пациенты, у которых это заболевание, безусловно, отсутствует. Поясним сказанное следующим примером.

Предположим, разрабатывается новый метод электронной (цифровой)

 

 

флюорографии. Следует дать оценку его информативности, т.е. определить его операционные характеристики. Для этой цели подбираются больные с безупречно и точно установленным диагнозом какого-либо заболевания (например, туберкулеза). Допустим, всего подобрано по 100 пациентов каждой группы. В первой группе больных туберкулезом флюорографический тест оказался положительным у 88 пациентов, а у 12 человек он отрицательный. Из второй группы пациентов здоровыми признаны 94 человека, у 6 пациентов возникло подозрение на туберкулез, и они отправлены на дальнейшее обследование. На основании полученных данных составляется матрица решений (табл.9.1).

Таблица 9.1

Распределение пациентов по наличию у них заболевания и результатам теста

 

Данные флюорографии Туберкулез   Всего
Присутствует Отсутствует
Положительные      
Отрицательные      
Всего      

 

Результаты вычислений по данным, изложенным в таблице, позволяет определить диагностическую информативность, т. е. определить чувствительность (Se), специфичность (Sp), точность (Ac), вероятность положительного (+VP) и отрицательного ответов (-VP):

 

 

, , ,

 

, .

 

 

ROC-анализ

 

В доказательной медицине значительное распространение получил метод анализа ROC-кривых – операционных кривых наблюдателя (Receiver Operation Characteristic curves). Этот метод позволяет провести сравнительную оценку показателей различных способов визуализации органов (например, КТ, МРТ. УЗИ), сопоставить между собою технические характеристики различных устройств для получения медицинских изображений (например, мониторы), сравнить эффективность выявления патологического состояния организма при использовании различных альтернативных диагностических систем. Принципом ROC-анализа является сопоставление чувствительности и специфичности по уровню ложно положительных решений.

ROC-кривые представляют собою график зависимости истинно положительных от ложно положительных решений, принимаемых наблюдателем при оценке результатов тестов; диагностическими тестами могут быть также медицинские диагносйические изображения, когда часть их содержит в себе искомый сигнал (патологию), а часть – не содержит (норма).

Наиболее распространенным способом построения ROC-кривых, создающим условия для количественной их оценки, является группировка полученных данных по 5-балльной оценке. С этой целью подбираются две группы пациентов: 1) без патологических изменений (здоровые лица) и

2) содержащие их (больные).

В качестве примера обратимся к флюорографии больных туберкулезом условно создадим две группы пациентов: в одной из них будут 100 здоровых лиц, в другой – 100 больных туберкулезом. Маркировка флюорограмм закрыта для исследования (слепой рандомизированный метод). Наблюдатели дают оценку обнаруженным изменениям по следующим категориям:

1. Туберкулез абсолютно отсутствует.

2. Туберкулез, вероятно, отсутствует.

3. Равновероятное наличие или отсутствие туберкулеза.

4. Вероятное наличие туберкулеза.

5. Определенно наличие туберкулеза.

Затем составляется таблица, содержащая в себе категории оценок относительно истинного положения дел (табл. 9.2).

Таблица 9.2

Распределение больных и здоровых по категориям решений

Фактическое состояние Категории решений Всего
         
Туберкулез имеется            
Туберкулез отсутствует            

 

Для построения точек кривой необходимо вычислить их ординаты. При этом ось ординат будет соответствовать вероятности истинно положительных решений, ось абсцисс – вероятности ложно положительных решений. После некоторых преобразований параметров ось абсцисс можно обозначить как «чувствительность» метода, ось ординат – как «1 - специфичность».

Для построения первой точки на оси ординат в качестве истинно положительного решения рассматривается решение с максимальной уверенностью (категория 5), т.е. 20 наблюдений. Это число относится к числу всех патологических изменений, т. е. к 100. Получается значение первой точки ординаты – 0,2. Вероятность ложно положительного решения по этой же 5-й категории получается отнесением числа 4 (из второй строки) к числу всех здоровых людей, т.е. к 100. Получается значение точки на оси абсцисс, равное 0,04, т.е. начало графика ROC-кривой. Подобным образом строим точки ординаты и абсциссы для остальных категорий решений. Каждая последующая ячейка таблицы рассчитывается как сумма текущей и всех предыдущих категорий. Иными словами значение в 4-й категории рассчитывается как сумма 5-й и 4-й: 3-й категории – сумма 5-й, 4-й и 3-й и т.д. В итого получаем таблицу (9.3) со значением всех точек для построения ROC-кривой.

Таблица 9.3

Расчет точек построения ROC-кривой

Ось Значение точек ROC-кривой
Ордината 0,2 0,6 0,8 0,96 1,0
Абсцисса 0,04 0,17 0,26 0,7 1,0

 

ROC-кривая, полученная в результате такого анализа, представлена на

рис 9.2.

 

 

Рис.9.2 ROC-кривая

 

При анализе ROC-кривых придерживаются следующего принципа: чем ближе к левому верхнему углу координатной сетки расположена кривая, тем выше информативность исследуемого метода диагностики или лучше качество системы отображения данных. Если кривая прилежит к диагонали (или совпадает), то информативность метода ничтожна. Необходимо отметить, что вкачестве истинно положительных решений может выступать критерий «чувствительность», а в качестве ложно положительных – критерии «1 - специфичность».

Табличный принцип составления ROC-кривых не является единственным. В настоящее время некоторое статистические пакеты (например, NСSS) содержат программы для выполнения автоматизированного ROC-анализа. Особенно удобно пользоваться компьютерным ROC-анализом при большом количестве опорных точек для построения кривых или при сравнении значительных по объему выборок данных. На рис.9.2 показаны две выборки данных, каждая из которых содержит концентрацию натрия в крови, определенную двумя различными способами (Sodium 1 и Sodium 2). При этом у ряда больных имеется лихорадка (Fever) – референтный тест, который помечен знаком «1» при наличии лихорадки и «0» при ее отсутствии. Необходимо ответить на вопрос, какой из методов более достоверен?

Рис.9.3. База данных с концентрацией натрия в крови натрия, определенной двумя различными способами (Sodium 1 и Sodium 2). Fever - референтный тест.

 

В модуле статистического пакета выбирается закладка ROC-кривая (рис.9.4):

 

Рис.9.4. Модуль программы для выполнения ROC-анализа.

 

Итоговая картина полученных результатов представлена на рис.9.5.

 

 

Рис.9.5. ROC-кривые, полученные компьютерным способом. Заметно, что кривая Sodium 1 расположена ближе к левому верхнему углу координатной сетки, что указывает на ее бо́льшую информативность.

Дополнительным критерием эффективности сравниваемых методов диагностики является площадь под ROC-кривыми, которая определяется с помощью математических формул или компьютера. Диапазон таких площадей колеблется от 0,5 (метод неэффективен) до 1,0 (метод абсолютно эффективен.



Поделиться:


Последнее изменение этой страницы: 2016-09-20; просмотров: 1342; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.119.104.238 (0.056 с.)