Обратная связь

Выбор методов статистической обработки и анализа результатов РКИ

Аналитическая ценность любого РКИ напрямую зависит от полноты и качества регулярного сбора мониторируемых показателей у всех его участников. При анализе необходимо брать в расчет показатели всех пациентов, рандомизированных в ходе исследования. При публикации результатов РКИ необходимо указывать количество его участников: 1) прошедших рандомизацию, 2) получивших сравниваемые вмешательства и 3) покинувших исследование до его завершения. В идеале, должны анализироваться все пациенты, которые при отборе добровольцев в РКИ подошли по критериям включения (включая сюда и анализ документированных причин отказа от участия). Для каждой из сравниваемых групп необходимо представить баланс важных мониторируемых факторов (ковариат) на момент начала исследования (пример см. в таблице ниже):

Медиана признака:	Кормление грудью n=212	Кормление смесями n=213
возраст
образование, лет
гемоглобин (г/л)
CD4+ (в 1 мкл)
копий РНК ВИЧ в плазме /мл
Субтип А ВИЧ, %
Субтип D ВИЧ, %
Замужем, %

Основа анализа данных РКИ – непосредственное сравнение частоты / выраженности исходов в сравниваемых группах. Поскольку считается, что рандомизация «выравнивает» сравниваемые группы по всем принципиально важным показателям, для их сравнения рекомендуется использовать простые статистические тесты (см. таблицу с рекомендациями ниже). При этом в сложных методах анализа нет необходимости, поскольку вся разница между группами на момент окончания исследования считается проистекающей исключительно из различий в применяемых вмешательствах. Соответственно, нет смысла учитывать прочие факторы, кроме собственно сравниваемых схем терапии.

При публикации результатов необходимо представить читателю «эффективность лечения» (разницу в исходах между сравниваемыми группами), ее 95% доверительный интервал (ДИ) и величину р (т.е. вероятность достоверности нулевой гипотезы).

Обычно при анализе результатов РКИ используется принцип «каждая попытка засчитывается» (intention to treat). Данный принцип включает 2 положения:

1. При анализе результатов учитываются все участники РКИ, прошедшие рандомизацию. Указанное положение может потребовать использования в ходе исследования допущений вида «неявка = неудача вмешательства» и «данные последнего (перед исчезновением больного) обследования = данные на момент окончания исследования»;

2. Даже если доброволец, рандомизированный в одну из сравниваемых групп, в дальнейшем отказался от участия в исследовании до его завершения либо настоял на смене схемы терапии (т.е. переходе в другую группу), анализ производится так, как если бы данный больной входил в ту группу, в которую он был исходно распределен.

Следование принципу «каждая попытка засчитывается» (т.е. «попытка = пытка») позволяет оценить эффект вмешательства в условиях, приближенных к реальным.

Альтернативный, реже используемый принцип учета результатов клинических испытаний носит название «в соответствии с протоколом» (“per protocol”), или «пролеченные» (“on treatment”). В этом случае финальному анализу подвергаются только данные, полученные от пациентов, идеально соответствующих всем требованиям утвержденного протокола РКИ. Добровольцы, прошедшие рандомизацию, но отказавшиеся в дальнейшем от участия в исследовании по любой причине, а также лица, настоявшие на смене терапии на альтернативную (перешедшие в другую группу сравнения), удаляются из анализируемого массива; при этом изучаемая выборка уменьшается, а мощность исследования падает. Данный подход полезен в том случае, когда необходимо изучить особенности действия принципиально нового препарата либо эффекта от впервые вводимого в практику вмешательства; при этом очень важно, чтобы анализировались только данные, полученные от лиц, действительно получивших данные препарат / вмешательство, причем полным курсом / в полном объеме.

Следует учесть, что принцип “on treatment” не позволяет оценить реальные клинические перспективы нового препарата либо вмешательства, связанные с возможными неудобствами при его приеме, побочными эффектами, снижением качества жизни и т.п.; эти факторы поддаются учету только при использовании подхода “intention to treat”.

Для непосредственного сравнения эффективности вмешательств в анализируемых группах рекомендуются следующие статистические методы:

Вид данных	Параметрический тест	Непараметрический тест
Непрерывный ряд данных (количественные и порядковые переменные)
Попарные сравнения (н-р, параметр до- и после вмешательства) в пределах одной группы испытуемых	Парный (одновыборочный) t-тест	Ранговый знаковый тест Уилкоксона (Wilcoxon)
Непарные данные (одна и та же переменная, две независимые выборки)	Непарный (двухвыборочный) t-тест	U-тест Манна-Уитни (Mann-Whitney)
Непарные данные (одна и та же переменная, три и более независимые выборки)	ANOVA (дисперсионный анализ)	Тест Краскела-Уоллиса (Kruskal-Wallis)
Бинарные данные (номинальные переменные)
Сравнение двух и более групп	Тест по критерию Chi-квадрат (χ²), точный тест Фишера

Параметрические тесты применимы только для сравнения нормально (по Гауссу) распределенных данных (во всех сравниваемых группах!), непараметрические тесты могут использоваться для сравнения выборок данных с любым характером распределения. В то же время параметрические тесты более чувствительные (менее строгие), а непараметрические - существенно менее чувствительные (т.е. более строгие); при сравнении нормально распределенных данных непараметрическими методами можно не найти значимых различий там, где они в реальности имеются. Ввиду этого перед статистической обработкой данных необходимо выполнять анализ нормальности их распределения (н-р, по методу Колмогорова-Смирнова-Лиллиефорса (Lilliefors)), и, если во всех рассматриваемых группах сравниваемые данные окажутся нормально распределенными, необходимо использовать для сравнения именно параметрические методы, в противном случае (т.е. если хотя бы в одной из сравниваемых групп распределение данных окажется отличным от нормального) – только непараметрические. Подробный анализ методов статистической обработки данных выходит за рамки данной главы; интересующимся рекомендуется обратиться к Главе II, а также [6] и [9].

Важный аспект проблемы – расчет оптимального размера выборки исходя из ожидаемого характера распределения сравниваемых данных. Поскольку параметрические методы сравнения являются менее строгими, они требуют меньшего размера сравниваемых групп для нахождения заданных различий (т.е. для обеспечения требуемой разрешающей способности исследования) – по сравнению с непараметрическими методами. Соответственно, если заранее известно, что исследуемый параметр нормально распределен в популяции, можно достичь экономии времени и средств за счет некоторого уменьшения размеров сравниваемых групп; неоправданное же увеличение формируемой выборки (и, соответственно, расходов) нередко крайне болезненно (вплоть до судебных исков) воспринимается спонсорами РКИ.

Вообще, в РКИ преимущественно встречаются следующие подходы к статистической обработке данных:

1) Доказать превосходство схемы А над схемой В или наоборот (superiority test),

2) Доказать эквивалентность (сопоставимость) схем/препаратов А и В (equivalence test),

3) Доказать, что схема А не хуже схемы В или наоборот (non-inferiority test).

Тест на превосходство является наиболее типичным случаем анализа данных РКИ. При этом в ходе исследования необходимо доказать, что доверительный интервал эффективности любого из испытуемых препаратов целиком лежит над аналогичным доверительным интервалом другого препарата, что подтверждается вышеприведенными статистическими тестами.

Тест на эквивалентность обычно используется при сравнении лекарств-генериков с оригинальными препаратами, а также при сравнении нового препарата с заданным эффектом с ранее существующим «эталонным» препаратом с аналогичным эффектом. В этом случае предполагается приблизительное равенство терапевтического эффекта, но меньшая токсичность, стоимость либо большее удобство приема нового препарата по сравнению с уже существующим. При таком подходе важен расчет доверительного интервала показателя эффективности, который должен быть как можно более узким, что обеспечивается большим размером сравниваемых групп. Необходимо заранее оговорить «рамки эквивалентности» лечебного эффекта, т.е. такую разбежку его показателей, внутри которой разница между сравниваемыми препаратами будет несущественна для клинициста. В случае эквивалентной эффективности сравниваемых препаратов их доверительные интервалы будут полностью укладываются в диапазон «эквивалентности», а узкие рамки доверительных интервалов в обоих группах при этом гарантируют определенность сделанного вывода о равенстве эффектов.

Тест на эквивалентность обычно требует примерно вдвое большего размера групп сравнения по сравнению с тестом не превосходство.

Тест на отсутствие неполноценности (non-inferiority) идейно схож с тестом на превосходство. Он используется в случае, когда предполагается, что вновь созданный препарат может несколько уступать в эффективности ранее существующему, но будет дешевле, менее токсичен и/или более удобен при приеме. Цель РКИ в данной ситуации – доказать, что эффективность нового препарата не ниже некоторой заранее оговоренной приемлемой планки. Данная цель требует, чтобы доверительный интервал эффективности испытуемого препарата полностью находился над минимально допустимым ее уровнем – «планкой»; соответственно, ДИ должен быть достаточно узким, вследствие чего размер выборки в тесте на отсутствие неполноценности нередко существенно больше, чем в тесте на превосходство.

При проведении любого РКИ всегда имеется вероятность того, что какая-либо из сравниваемых схем лечения окажется существенно хуже другой (т.е. терапевтический ее эффект будет менее выражен, либо частота побочных эффектов значительно выше). Естественно, с того момента, как значимое превосходство одного из сравниваемых вмешательств над другим окажется очевидным для исследователей, лечить больных менее эффективной схемой терапии станет неэтично, и можно поднять вопрос о преждевременном прекращении РКИ. Чтобы сделать такой ход событий возможным, в протоколе РКИ предусматривается промежуточный анализ результатов, проводимый по тем же принципам и теми же методами, что и окончательный. В случае получения статистически высокозначимых (р<0,0001) различий между эффективностью сравниваемых вмешательств исследование может быть преждевременно прекращено. При этом промежуточный анализ должен определенно продемонстрировать, что:

1. новое лечение явно лучше стандартного, либо

2. новое лечение явно хуже стандартного, либо

3. новое лечение явно не лучше стандартного/контрольного (т.н. «остановка вследствие тщетности»). С этической точки зрения, принять решение об остановке РКИ (при наличии обоснованных поводов) необходимо как можно быстрее, особенно в случае (3).

Фазы РКИ с параллельным дизайном схематично показаны на рис. 24. Уменьшение размера шрифтов символизирует уменьшение размеров сравниваемых групп к моменту окончательного анализа полученных данных.

Рис. 24. Фазы РКИ с параллельным дизайном (пояснения см. в тексте).

Предыдущая 3 4 5 6 7 8 9 10 11 12 13 14 151617 18 Следующая

ТОП 5 статей:

Экономическая сущность инвестиций - Экономическая сущность инвестиций – долгосрочные вложения экономических ресурсов сроком более 1 года для получения прибыли путем...
Тема: Федеральный закон от 26.07.2006 N 135-ФЗ - На основании изучения ФЗ № 135, дайте максимально короткое определение следующих понятий с указанием статей и пунктов закона...
Сущность, функции и виды управления в телекоммуникациях - Цели достигаются с помощью различных принципов, функций и методов социально-экономического менеджмента...
Схема построения базисных индексов - Индекс (лат. INDEX – указатель, показатель) - относительная величина, показывающая, во сколько раз уровень изучаемого явления...
Тема 11. Международное космическое право - Правовой режим космического пространства и небесных тел. Принципы деятельности государств по исследованию...