Неужели плацебо ничего не может? Анализ клинических испытаний,в которых плацебо сравнивалось с отсутствием назначений
Асбьёрн Робьяртссон и Питер Гёцше
Кафедра Медицинской философии и клинической теории Копенгагенского
Университета,Институт Panum и Северный институт Cochrane, Копенгаген, Дания
Обоснование. Известно, что применение плацебо помогало больным с различными недугами, но до сих пор не проводилось строгой оценки того, насколько такие наблюдения доказательны.
Методы. Мы сделали систематический обзор клинических испытаний, в которых пациентам, посредством рандомизации, назначалось плацебо или не назначалось ничего. Плацебо могло быть фармакологическим (например, таблетка), физическим (например, какая-либо манипуляция) или психологическим (например, беседа).
Результаты. Мы обнаружили 130 исследований, которые отвечали нашим квалификационным критериям. После исключения 16 испытаний, в которых отсутствовали требуемые данные о результатах, остались 32 работы с бинарной оценкой результата (они включали 3795 пациентов, с медианным числом 51 пациент на одно исследование) и 82 работы с оценкой результата как конкретного значения из континуума (они включали 4730 пациентов, с медианным числом 27пациента на одно исследование). По сравнению с отсутствием назначений, плацебо существенно не повлияло на бинарные результаты, - как в случае субъективных, так и в случае объективных результатов. В исследованиях с результатами из континуума плацебо приносило благотворный эффект, но этот эффект сокращался при увеличении изучаемой популяции, что указывает на возможное искажение результатов за счет малого размера выборки. Пуловая стандартизированная средняя разница была достоверной для субъективных результатов и недостоверной для объективных результатов. В 27 испытаниях, в которых изучалось лечение боли, плацебо имело благотворный эффект, что отражалось в снижении величины боли на 6,5 мм на 100-миллиметровой визуально-аналоговой шкале.
Выводы. В общем, у нас мало оснований говорить о выраженном клиническом действии плацебо. Хотя плацебо не имело значительного влияния на объективные или бинарные результаты, оно, очевидно, оказывало небольшое благоприятное влияние на субъективные результаты из континуума, в частности, при лечении боли. За пределами сферы клинических испытаний нет оснований для применения плацебо.
Сообщалось, что плацебо улучшает субъективные и объективные результаты с частотой до 30-40% у больных с широким спектром клинических нарушений, таких, как боль, астма, повышенное артериальное давление и даже инфаркт миокарда [1—3]. В своей статье от 1955 г. "Мощь плацебо" Beecher пришел к заключению: "Имеются данные, говорящие о высокой действенности плацебо, что выражается в уменьшении субъективных реакций и в существенном улучшении клинических состояний. Такие факты расценивались как реальный лечебных эффект с неизвестным механизмом, и их частота достигала 35,2+2,2% случаев" [1].
Статья Beecher и цифра 35% часто цитируются как свидетельство способности плацебо играть важную лечебную роль. В подавляющем большинстве статей по плацебо, в том числе, в статье Beecher, оценивалось действие плацебо по изменениям, отмечаемым у пациента по завершению рандомизирован-но назначенного курса плацебо, по сравнению с исходным уровнем при данной патологии. Но при таком подходе нельзя разграничить действие плацебо от естественного течения болезни, от регрессии к средней величине или от воздействия других факторов [4-6]. Поэтому, опубликованные данные о сильном влиянии плацебо, могли быть, по крайнеймере, частично, артефактами неадекватных методов исследования.
Несмотря на сдержанность многих врачей [7], применение плацебо рекомендовалось в редакционных статьях и в других публикациях ведущих журналов [3, 8, 9]. Для лучшего понимания плацебо как лечебного фактора, мы сделали систематический обзор клинических испытаний, в которых пациентам с различной патологией по рандомизации либо назначалось плацебо, либо не назначалось ничего. Нас, прежде всего, интересовала роль плацебо как фактора лечения болезней, мы не занимались его функцией средства сравнения в клинических испытаниях. Вторичной задачей было определение возможных различий влияния плацебо на субъективные и объективные показатели.
Методы
Определения плацебо
Трудно дать удовлетворительное определение плацебо [5]. В клинических испытаниях плацебо - это обычно средство, назначаемое в группе контроля, выглядящее так же, как исследуемые средства, но лишенное их специфической активности. Имея это в виду, мы, с практической целью, относим к плацебо все воздействия на пациентов, которые обозначаются этим термином в клинических испытаниях.
Поиск публикаций
В системах данных Medline, EMBASE, PsycLIT, Biological Abstracts и в Регистре контролированных исследований Cochrane мы провели поиск публикаций, вышедших в свет до конца 1998 г. Поиск велся по повторениям понятий "плацебо", "без назначений" и "рандомизированные клинические испытания" (стратегия поиска дана в деталях, вместе с полным текстом статьи на http://www.njem.org/, она основана на ранее опубликованном протоколе [10]). Мы внимательно просмотрели списки работ, цитируемых в испытаниях, которые мы включили в наше исследование, а также в избранных книгах и обзорных статьях. Мы также попросили исследователей в данной области предоставить нам список испытаний по теме.
Отбор работ
Мы включали исследование в наш обзор, если пациентов распределяли в группу с плацебо и в группу без назначений (часто при этом имелась еще одна группа, в которой проводилось активное лечение). Мы исключали работы, если принципы рандомизации явно не выполнялись, например, если внесение пациента в ту или другую группу можно было предсказать [11] (например, если пациенты распределялись по группам, в зависимости от чисел месяца). Мы также исключали исследования, в которых пациентам платили за участие или в которых исследовались здоровые добровольцы, а также если исследователь, оценивавший объективные результаты, знал о принадлежности пациента к группе, а также если частота досрочного прекращения участия превышала 50%, или если заявленное плацебо, на самом деле, выходило за пределы имитации лечения, так как имело очевидное клиническое действие (например, методики движений при лечении постоперационной боли). Все исследования, отобранные для включения в обзор, полностью прочитывались обоими авторами. Разногласия по вопросу включения конкретных работ разрешались путем дискуссии.
Отбор данных
Мы отбирали данные из публикации о каждом исследовании, применяя при этом методики, опробованные в пилотных работах. Когда опубликованные итоговые данные не подходили для мета-анализа, мы связывались с авторами этого исследования. Мы отмечали: каким образом проводилась рандомизация, был ли специалист-лечебник (он не должен был совмещать функцию наблюдателя) осведомлен о распределении пациента в конкретную группу. Кроме того, мы отмечали цель исследования, частоту досрочного выхода из него, сочетания плацебо со стандартным лечением и ясность заявления о главном итоговом показателе.
Мы фиксировали информацию о виде плацебо: Фармакологическое (например, таблетка), физическое (например,
манипуляция) или психологическое (например, беседа). Важно было определить, насколько симптомы, беспокоившие пациента, были доступны для оценки со стороны (то есть, можно ли было наблюдать за результатами лечения, как, например, за кашлем). Мы отмечали, каким образом определялись объективные результаты - лабораторными методами, либо при исследовании, которое требует участия пациента (например, определение объема форсированного выдоха), либо при обследовании, не требующем такого участия (например, оценка отеков).Оба автора настоящего обзора, независимо друг от друга, выявляли виды итоговых показателей только на основании разделов "методы" в указанных статьях. В качестве ведущего конечного показателя мы выбирали главный субъективный или объективный результат (предпочтительно, динамика главной жалобы). Если главный итоговый показатель в публикации не указывался, мы выбирали то, что имело, по нашему мнению, наибольшее значение для самих пациентов. Бинарные результаты (например, процентное соотношение курильщиков и некурящих) имели, в наших глазах предпочтение перед вариациями параметра из континуума (например, среднее число выкуриваемых сигарет). Данные, зафиксированные сразу после испытания, были предпочтительнее данных динамического наблюдения, хотя не всегда имелись данные на конец курса воздействия. В случае с перекрестными испытаниями, мы отбирали только данные периода первого курса, а когда это было невозможно, мы использовали суммарные показатели, что соответствует испытанию с параллельной группой (то есть, с использованием стандартного отклонения между группами и общего числа исследуемых в обеих группах).
Синтез данных
Для всех исследований с бинарным результатом мы вычисляли относительный риск нежелательного результата, под которым понимается отношение числа пациентов с неблагоприятным результатом к общему числу пациентов в группе плацебо, разделенное на такое же отношение в группе без лечения. Таким образом, относительный риск меньше 1,0 указывает на благоприятное действие плацебо.
В исследованиях с результатами из континуума мы рассчитывали стандартизированное среднее отличие, под которым понималась разница между средним значением для нежелательного результата в группе с плацебо и соответствующей величиной в группе без назначений, деленная на стандартное отклонение по пулу [12]. Величина -1 означает, что средняя в группе плацебо на одно стандартное отклонение меньше, чем в группе без назначений, что указывает на благоприятный эффект плацебо.
Мы вычисляли совокупный относительный риск неблагоприятных результатов для исследований с бинарной оценкой и стандартизированную среднюю разницу пула для исследований с результатами из континуума [13]. Ввиду различий в клинических условиях и в типе учреждений, мы предполагали, что набор данных будет гетерогенным, то есть, что разница результатов разных испытаний будет большей, чем при действии одного фактора случайности. Поэтому различия и статистическая достоверность рассчитывались по рандом-эффекту [13]. Мы рассчитывали совокупные величины для субъективных и объективных результатов и для отдельных клинических проблем, если они рассматривались в минимум трех исследованиях, проведенных разными группами [14].
Мы провели запланированные вычисления для подгрупп, чтобы убедиться, насколько наши находки были чувствительны к типу плацебо или к типу рассматриваемых клинических результатов. Более того, для каждого исследования мы на графике отмечали значение эффектов вдоль оси с обратными значениями стандартной ошибки (которые повышаются с увеличением числа пациентов). Так как вариации расчетного эффекта уменьшаются с увеличением размера выборки,
полученный график должен напоминать симметричную опрокинутую воронку. Если такой график окажется несимметричным, то это вызывается, обычно, информацией небольших исследований об эффектах, в среднем более значительных, чем в крупных исследованиях, и такая асимметрия отражает искажения, обусловленные характером публикации [15] или другие искажения. Мы также выполнили ряд запланированных вычислений чувствительности, чтобы определить, насколько наши находки были чувствительны к изменениям качества исследований.В исследованиях с результатами из континуума мы использовали метод F для того, чтобы проверить, насколько достоверны были различия стандартных отклонений в группе плацебо и в группе без назначений [16]. Мы считали распределения в каждой из групп негауссовским, если 1,64 стандартных отклонений превышали среднюю для благоприятных результатов [17]. Вычисления методом Chi-square применялись для оценки гетерогенности на основании статистик ДерСимоняна и Laird Q [13, 18]. Итоговые величины даются с 95%-ными доверительными интервалами. Все значения Р даны в обе стороны.
Результаты
Отбор исследований и их характеристика
Мы выявили 727 исследований, которые, как мы надеялись, отвечали нашим критериям. Мы в последующем исключили 597 исследований по следующим причинам: 404 были неклиническими и нерандомизированными, в 129 не было группы плацебо или группы без назначений, по 29 число публикаций превышало 1, в 11 была явно неслепая оценка объективных результатов, а 24 отвечали другим критериям исключения, например, частота досрочного прекращения участия превышала 50%. В 16 из оставшихся 130 исследований не было адекватной информации о результатах. Таким образом, в наш анализ вошло 114 исследований [19-132].
Имелось 10 перекрестных исследований, для 7 из них (они включали в сумме 182 пациента) вычисления проводились как для параллельных исследований. В 112 работах, помимо группы плацебо и группы без назначений, имелась третья группа, пациентам которой назначалось активное лечение. В 88 из этих 112 исследованиях авторы не ставили цель оп-ределить эффект плацебо. Работы, вошедшие в обзор, были опубликованы на 5 языках в период 1946-1998 гг. Результаты были бинарными в 32 исследованиях [19-50] и результатами из континуума - в 82 [51-132]. В 76 работах выделенный нами клинический результат был оценен как главный показатель авторами этих исследований. Если принимать во внимание только группы с плацебо и без назначений, то исследования с бинарными результатами включали 3795 пациентов, медианное среднее число пациентов на одно исследование составляло 51 (разброс между квартилями - от 26 до 72), а исследования с результатами из континуума -4730 пациентов, с медианным числом 27 пациентов на одно исследование (разброс между квартилями от 20 до 52).
Типичным фармакологическим плацебо была таблетка из лактозы. Типичным физическим плацебо было проведение процедуры при выключенном аппарате (например, бутафорская чрескожная стимуляция нервов). Типичным психологическим плацебо была нейтральная беседа без определенного направления между пациентом и лечащим лицом, такая беседа именуется "плацебо для внимания". При отсутствии назначений обычно проводилось только наблюдение, либо при этом проводились стандартные лечебные мероприятия, в последнем случае все пациенты в исследовании получали стандартное лечение, плацебо давали в соответствующей груп пе, как дополнительное средство.
С результатами отдельных исследований можно ознакомиться, вместе с полным текстом настоящей статьи на сайте: http://www.nejm.org/. В данных исследованиях рассматривались 40 разных клинических состояний: гипертония, астма, анемия, гипергликемия, гиперхолестеринемия, морская болезнь, болезнь Рейно, злоупотребление алкоголем, курение, ожирение, плохо санированная полость рта, инфекция простого герпеса, бактериальная инфекция, ОРЗ, боль, тошнота, непроходимость, бесплодие, дилятация шейки матки, роды, менопауза, про-статизм, депрессия, шизофрения, бессонница, тревога, фобия, компульсивное кусание ногтей, слабоумие, дисгармония в браке, боязнь стоматологических вмешательств, нарушения оргазма, каловое загрязнение, энурез, эпилепсия, болезнь Паркинсона, болезнь Альцгеймера, расстройство с дефицитом внимания и гиперактивностью, синдром карпаль-ного тоннеля, и заболевания без диагноза.
Бинарные результаты
При сравнении с отсутствием назначений оказалось, что плацебо не оказывало сколько-нибудь значительного влияния на бинарные результаты (общий риск неблагоприятного результата, с поправкой на пул, =0,95 при 95%-ном доверительном интервале разброс 0,88-1,02). Для исследований с субъективными показателями относительный риск, с поправкой на пул, составил 0,95 (при 95%-ном доверительном интервале, 0,86-1,05), и 0,91 для исследований с объективными показателями (при 95%-ном доверительном интервале 0,80-1,04) (таблица 1).
Таблица 1. Эффекты плацебо в исследованиях с результатами типа бинарных и из континуума*.
Результаты | Число участников | Число исследований | Пуловый относительный риск (95% Cl) ** |
Бинарные | |||
Всего | 3795 | 32 | 0,95 (0,88-1,02) |
Субъективные | 1928 | 23 | 0,95(0,86-1,05) |
Объективные | 1867 | 9 | 0,91 (0,80-1,04) |
Пуловая стандартизированная средняя разница (95% С I) ** | |||
Из континуума | |||
Всего | 4730 | 82 | -0,28 (-0,38—0,19) |
Субъективные | 3081 | 53 | -0,36 (-0,47—0,25) |
Объективные | 1619 | 29 | -0,12 (-0,27—0,03) |
*С1 - доверительный интервал;
** Под относительным риском понималась доля числа пациентов с неблагоприятным результатом в общем числе пациентов группы плацебо, разделенная на такую же долю в группе без лечения. Относительный риск меньше 1,0 указывает на благоприятное действие плацебо.
*** Под стандартизированным средним отличием понималась разница между средним значением нежелательного результата в группе с плацебо и соответствующей величиной в группе без назначений, деленная на стандартное отклонение по пулу [12]. Отрицательная величина указывает на благоприятный эффект плацебо.
Среди испытаний с бинарными результатами отмечалась значительная гетерогенность (Р=0,003), что указывает на более значительные вариации эффекта плацебо от исследования к исследованию, чем при действии фактора случайности. Гетерогенность нельзя было объяснить тем, что меньшие по масштабу исследования демонстрировали больший эффект плацебо, чем крупные исследования (Р=0,56) [15].
Ваш комментарий