Анализ взаимозависимости качественных признаков (установление взаимосвязи между воздействием и исходом)
Качественные признаки не имеют количественной размерности, но можно учесть в числовой форме сам факт их наличия либо отсутствия (1 – есть, 0 – нету), а также подсчитать частоту встречаемости качественного признака в анализируемой выборке («риск») и сравнительную вероятность его обнаружения («шанс»).
Напомним, риск определяется как отношение количества лиц в выборке, имеющих изучаемый признак, к общему количеству лиц под наблюдением (т.е. к размеру выборки), выражаемое в долях единицы либо процентах. Соответственно, величина риска выражается неким числом в интервале от 0 до 1 (или от 0 до 100%).
Риск в общем случае соответствует частоте встречаемости либо вероятности развития изучаемого признака. Именно риск обычно используется в отечественной научной литературе как характеристика вероятности наступления события либо распространенности признака.
Шанс определяется как отношение количества лиц в выборке, имеющих изучаемый признак, к количеству лиц в той же выборке, не имеющих данного признака. Соответственно, шанс – некоторое число между 0 и бесконечностью. Шанс приблизительно равен риску, если частота исследуемого признака либо события невелика.
Шанс с величиной N означает, что вероятность наступления некоего события в N раз выше, чем того, что данное событие не наступит.
Для оценки влияния каких-либо факторов на развитие интересующего исследователей исхода можно определять и шанс, и риск.
Вначале составляется четырехпольная таблица, или таблица 2×2 (как описано в разделе 9 настоящей главы, см. таблицу 5):
Группа
| Признак есть
Эффект есть
Исход наступил
| Признака нет
Эффекта нет
Исход не наступил
| Экспонированные
Вмешательство
Опытная группа (1)
| А (n=…)
| В (n=…)
| Неэкспонированные
Нет вмешательств
Контрольная группа (2)
| C (n=…)
| D (n=…)
|
Затем подсчитываются величины шансов и рисков по формулам:
Сравнение частоты развития исхода в различных группах (в общем случае – опытной и контрольной) производится путем вычисления относительных характеристик – относительного риска (relative risk, risk ratio, RR) и отношения шансов (odds ratio, OR) по формулам:
Подставляя в данные уравнения формулы для расчета величин рисков и шансов, приведенные выше, получаем:
В связи с характерным видом формулы для вычисления отношения шансов его еще называют «перекрестным отношением». Отношение рисков показывает, во сколько раз риск некоего события («исхода») в опытной группе больше или меньше, чем в контрольной. Соответственно, отношение шансов показывает, насколько шанс некоего события в опытной группе больше или меньше, чем в контрольной.
При простом сравнении между опытной (экспериментальной) и контрольной группами:
1. Отношение рисков либо шансов, равное 1, означает, что между опытной и контрольной группами нет разницы в вероятности либо, соответственно, шансе события;
2. Отношение рисков либо шансов, меньшее 1, означает, что в опытной группе изучаемые событие либо параметр встречаются реже, чем в контрольной;
3. Отношение рисков либо шансов, большее 1, означает, что в опытной группе изучаемые событие либо параметр встречаются чаще, чем в контрольной;
Поскольку логика научного эксперимента предполагает, что в опытной группе имело место некое исследуемое воздействие, отсутствующее в контрольной группе, RR или OR, превышающее 1, свидетельствует о наличии статистической взаимосвязи между данным воздействием (фактором) и учитываемым исходом, причем воздействие увеличивает вероятность развития исхода.
Соответственно, RR или OR, меньшее 1, также свидетельствует о наличии статистической взаимосвязи между воздействием (фактором) и учитываемым исходом, причем воздействие уменьшает вероятность развития исхода. В такой ситуации можно сказать, что исследуемый фактор оказывает на подопытных лиц протективное воздействие, уменьшая у них вероятность развития соответствующего исхода.
В том случае, если RR или OR равны 1, статистическая взаимосвязь между воздействием и исходом отсутствует.
Расчет отношений рисков и/или шансов широко используется при выполнении т.н. исследований вида «случай-контроль» (case-control studies), где как раз и требуется доказать либо опровергнуть взаимосвязь между неким воздействием и неким исходом (см. Главу III настоящего руководства, раздел 4). При этом принципиальной разницы, что именно вычислять – отношение рисков или отношение шансов, нет, но в западной научной литературе отношение шансов (odds ratio, OR) прижилось в качестве стандарта de facto, вероятно, вследствие многолетних культурных традиций западного общества, где смысл шанса близок и понятен всем, кто делает ставки любого рода (например, играет на бирже).
При этом расчет отношений шансов либо рисков является простым, но одновременно и довольно грубым способом установления статистической взаимосвязи между воздействием и исходом, поскольку он не учитывает изменения объема исследуемой группы (выборки) в ходе исследования. Существуют гораздо более сложные, точные и изящные методы для выявления такой взаимосвязи и оценки ее выраженности – например, анализ выживаемости признака по Каплану-Мейер (product limit Kaplan-Meier estimation), который будет подробно рассмотрен в следующей главе настоящего руководства (именно, в Главе III, пункте 5).
Для установления статистической значимости отношений шансов и рисков необходимо вычисление верхнего и нижнего пределов их доверительного интервала (как правило – 95%).
1. Вычисление доверительного интервала для отношения рисков (RR, ОР):
Вначале подсчитывают фактор ошибки относительного риска по формуле:
Здесь 1,96 – константа, необходимая для расчета 95% доверительного интервала (см. раздел 5 настоящей главы). Для 99% ДИ эта константа будет равна 2,58, а для 99,9% – 3,28.
Затем вычисляют верхний и нижний пределы доверительного интервала по формулам:
2. Вычисление доверительного интервала для отношения шансов (OR, ОШ):
Вначале подсчитывают фактор ошибки отношения шансов по формуле:
Здесь 1,96 – константа, необходимая для расчета 95% доверительного интервала (см. раздел 5 настоящей главы). Для 99% ДИ эта константа будет равна 2,58, а для 99,9% – 3,28.
Затем вычисляют верхний и нижний пределы доверительного интервала по формулам:
В том случае, если отношение шансов либо рисков >1, а нижний предел рассчитанного доверительного интервала ≤1, изучаемый фактор не может быть статистически значимой причиной интересующего нас исхода.
Обратно этому, если отношение шансов либо рисков >1, но при этом нижний предел доверительного интервала также >1, данный фактор (воздействие) может быть причиной изучаемого исхода, поскольку их взаимосвязь статистически значима.
Если же отношение шансов либо рисков <1, и верхний предел вычисленного ДИ также <1, то изучаемый фактор оказывает статистически значимое протективное влияние, предотвращая появление интересующего нас события (исхода).
Когда отношение шансов либо рисков <1, а верхний предел вычисленного ДИ >1, то изучаемый фактор не оказывает статистически значимого протективного влияния на развитие интересующего исследователей события (исхода).
Вывод о наличии клинически значимого влияния изучаемого фактора (воздействия) на интересующий исследователей исход делается, если вычисленные величины OR или RR достаточно велики (обычно >2 или <0,5).
Анализируя отношения шансов и рисков, полученные для различных воздействий, предположительно связанных с изучаемыми исходами, необходимо помнить о т.н. «смешивании эффектов» (confounding). Данный феномен наблюдается в том случае, если изучаемое воздействие (А) и интересующий исследователей исход (В) вместе определяются каким-либо неизвестным фактором С. Указанный фактор называется «вмешивающийся» (confounder). При этом интересующий нас исход очевидным образом не связан с изучаемым воздействием, но проведение вышеописанных вычислений может показать не только значительную величину OR (RR), но и пределы соответствующих им доверительных интервалов, отвечающие критериям статистической значимости (см. выше), что приведет к ложному заключению о наличии прямой взаимосвязи; иногда выявляемые таким образом «зависимости» поражают исследователей своей неожиданностью, парадоксальностью и «необъяснимостью».
Как пример курьезных выводов, получаемых из-за «смешивания эффектов», можно привести исследование, где доказывается, что частота урогенитального хламидиоза у скейтбордистов достоверно выше, чем у лиц, не имеющих скейтборда [28]. На самом деле наличие скейтборда не оказывает никакого влияния на заболевания, передаваемые половым путем; просто оба факта «наличие скейтборда» и «инфицирование урогенитальным хламидиозом» зависят от не включенного в исследование критерия «изучаемое лицо – молодой мужчина с физической активностью выше средней». Если провести аналогичный анализ, набрав в контрольную группу только молодых, физически здоровых и активных мужчин в возрасте от 18 до 23 лет, не имеющих скейтборда, всякая разница в заболеваемости хламидиозом исчезнет.
|