• Стройка и ремонт с нуля до успешного финиша
  • Пошаговые мастер-классы с фото и видео
  • Контролируем рабочих или делаем своими руками
  • Калькуляторы для расчета материалов

Основные методы исследований в эпидемиологии

Опубликовано: 06.02.2017

Основные методы исследований в эпидемиологии

Основные методы исследований в эпидемиологии.

Из книги : Campbell M. Machin D. Medical Statistics. A commonsense approach. John Wiley Sons, Ltd, Chichester, 2003. 203 p.

Целью данной главы является анализ различных исследовательских дизайнов и описание слабых и сильных сторон различных видов исследовательских планов. Значительные усилия, затраченные на стадии планирования, могут позволить избежать потенциальных проблем при проведении исследования, указать четкие направления для удовлетворительного анализа и суммирования результатов.

Определение целей исследования.

Таблица 2.1 суммирует основные положения, которые следует принимать во внимание при планировании исследования или при чтении научно-исследовательского отчета. Таким образом, прежде чем проводить клиническое испытание, вначале необходимо определить на какие вопросы оно будет пытаться дать ответ. В большинстве ситуаций достаточно сложным является идентификация одного единственного вопроса. Например, если бы нас попросили изучить эффективность нового лекарственного средства, то вопрос звучал бы таким образом: «Является ли новое лекарственное средство лучшим по сравнению с лекарственными средствами, которые используются в настоящий момент для лечения данного заболевания?» Второй вопрос может указывать на необходимость обнаружения нежелательных побочных эффектов (если они вообще существуют), кроме того, могут быть еще другие дополнительные, но в то же время важные вопросы. Однако всегда желательно иметь основную цель. Вторичные цели должны быть также четко определены, но их должно быть настолько мало, насколько это только возможно. Кроме того, необходимо также продумать насколько основные вопросы стоят того, чтобы на них искать ответы. Например, если тестовое лекарственное средство является всего лишь небольшой модификаций стандартного лекарственного средства, любые различия в эффективности, скорее всего, будут небольшими и, соответственно, они не будут иметь клинической значимости . Исследование нового лекарственного средства может показать, что эффективность нового лекарственного средства является статистически значимой по сравнению со стандартным лекарственным средством, однако очень незначительно. Подобные результаты, по всей вероятности, не приведут к изменению клинической практики. Вопросы, которые уже ставились, четкие и понятные из медицинской литературы ответы, как правило, не должны ставиться в новых исследованиях.

Таблица 2.1 Планирование исследования – определение целей.

(1) Что является основной целью исследования.

(2) Насколько однозначно она определена.

(3) Насколько значима она с клинической точки зрения.

(4) Насколько четко описаны дополнительные цели исследования.

На ранней стадии необходимо определить соответствующие конечные точки. Например, в исследовании по изучению нового лекарственного средства необходимо четко определить, что мы понимаем под эффективностью, причем таким образом, чтобы это было легко проверить у каждого пациента, вошедшего в данное исследование.

Медицинское исследование требует внимательного планирования и выполнения исследования, поэтому в формальном протоколе исследования описание дизайна является обычным. В протоколе необходимо определить все аспекты исследования — от дизайна, до указания формы конечного анализа. Протокол является документом, к которому можно обращаться по мере того, как исследование продвигается вперед. Более четко детали, связанные с содержанием протокола, описаны в разделе 8.3. Необходимо подчеркнуть, что форма статистического анализа определяется типом использованного дизайна.

Во многих случаях бывает важно отделить исследовательскую активность от повседневной клинической практики. Например, для перегруженной клиники не всегда является правилом очень аккуратно записывать артериальное давление пациента, да еще и удостоверяться в том, что до измерения артериального давления, пациент определенное количество времени находится в покое, поскольку в обычных условиях, целью измерения, в основном, является установление наличия выраженной гипертензии у пациента. Однако если пациент участвует в клиническом исследовании, в котором определяются изменения уровня артериального давления, вызванные лечением, потребуется значительно больше внимания к стандартизации техники измерения артериального давления и детализации записи этих измерений. Для клинических исследований обычно имеет смысл создавать специальные формы сбора данных, которые запрашивают от исследователя всю соответствующую информацию, вне зависимости от того, находится ли пациент в лаборатории, амбулатории, клинике или больничной палате.

Иногда прежде, чем будет продолжено чтение литературы, оказывается достаточно полезным провести классификацию исследовательских отчетов в типы исследования. Это поможет указать исследователям на важные вопросы, которые могут быть для них незнакомыми и указать на то, как правильно проводить соответствующий анализ. Сообщение, которое сложно классифицировать, может быть не смогло адекватно описать дизайны исследования, являющиеся неотъемлемой частью оценки и понимания исследования. Bailar и Mosteller (1986) создали классификацию биомедицинских исследований, представленную в таблице 2.2.

Таблица 2.2. Классификация биомедицинских исследований.

С. Изучение процесса заболевания.

Основное разделение в этой классификации проводится между лонгитюдными и кросс секционными исследованиями. Лонгитюдные исследования изучают процесс на протяжении некоего периода времени. Примерами являются клинические испытания, когортные исследования, или исследования по типу случай-контроль. Кросс секционные исследования описывают феномен на данный момент времени. Примером может служить описание различных стадий рака молочной железы. Большинство исследований, которые изучают эффекты внешних факторов на человека, являются лонгитюдными, в то время как лабораторные исследования биологических процессов очень часто являются кросс секционными. Лонгитюдные исследования делятся на проспективные и ретроспективные исследования. В проспективных исследованиях обследуемые группируются в соответствии с «воздействием» некоего фактора. Таким образом, общий период использования пероральных контрацептивов женщиной может определяться как «воздействие», а интересующим результатом может быть развитие (или какие-то другие формы диагностики) рака молочной железы у этой женщины. В ретроспективных исследованиях пациенты вначале делятся по результатам, например на женщин с раком молочной железы (случай) и женщин, у которых нет рака молочной железы (контроль). Эффекты «воздействия», такие как период использования пероральных контрацептивов, определяются ретроспективно.

Рандомизированные клинические испытания.

Клинические испытания определяются как проспективное исследование, которое изучает относительную эффективность лечения, или каких-либо других вмешательств на людях. Во многих случаях одним из воздействий является стандартная терапия (контрольная группа), а в других – новая терапия (тестовая группа). Рандомизация – это процедура, во время которой за счет случайных факторов происходит разделение обследуемых на изучаемые группы таким образом, чтобы то, в какую группу попадет тот или иной исследуемый не могло быть предсказано заранее. Основной причиной рандомизации является то, что она приводит к формированию исследуемых групп, сравниваемых по неизвестному, так же как и по известным факторам, которые могут воздействовать на результаты лечения. Рандомизация также гарантирует, что вероятности, полученные от статистических тестов, являются достоверными, хотя это скорее техническая характеристика. Необходимость рандомизации очень часто недооценивается, и поэтому важно отличать рандомизацию от неопределенного разделения и систематического разделения. Типичным систематическим методом разделения является разделение пациентов на группу вмешательства или группу контроля по мере того, как они появляются в клинике. Исследователь может утверждать, что факторы, которые определяют когда тот, или иной человек придет в клинику в данный момент времени, являются случайными и поэтому разделение на группы вмешательства, тоже случайно. Проблемой, однако, является то, что можно предсказать какое лечение будут получать пациенты сразу же после, или даже до того, как они прошли исследование для включения в клиническое испытание. Это знание может затем воздействовать на исследователя, который определяет, какие пациенты будут допущены к исследованию, а какие нет. Это, в свою очередь может привести к ошибкам при сравнении групп воздействия.

Рисунок 2.1 Клиническое испытание с параллельным дизайном. ( Population – популяция, Assessment – обследование, Eligible and willing subjects – подходящие и согласные на участие пациенты, Randomisation – рандомизация, Test – испытываемое лечение, Control – контрольная группа.

При параллельном дизайне одна группа получает тестовое лечение, другая группа является контрольной. Подобные характеристики представлены на рисунке 2.1.

Пример из литературы . Thomas (1987) случайным образом разделил пациентов, которые консультировались с ним по поводу незначительных заболеваний: на либо «положительную», либо «отрицательную» консультацию. Через две недели он обнаружил, что 64% из тех, кто получил «положительную» консультацию почувствовали себя лучше, в то же время среди тех, кто получил «отрицательную» консультацию только 39% почувствовали себя лучше, несмотря на тот факт, что обе группы получали одинаковое лечение. Был использован статистический анализ для того, чтобы продемонстрировать, что мало вероятно, чтобы эти различия возникли в результате действия случайных факторов. Вывод заключается в том, что те пациенты, которые получили «положительную» консультацию с большей вероятностью чувствуют себя лучше.

При перекрестном дизайне пациенты получают как контрольное, так и тестовое воздействие в рандомизированном порядке. Это противоположно дизайну с параллельными группами, при этом дизайне каждый пациент является основой для получения оценки различий между тестовым воздействием и контрольным воздействием. Ситуации, когда перекрестные исследования могут оказаться полезными, включают в себя хронические заболевания, остающиеся стабильными на протяжении длительного периода времени (такие, например, как диабет или артрит), и где целью лечения является палеативное воздействие, а не излечение.

Пример из литературы . Scott и соавторы (1984) провели исследование Акарбозы и плацебо (неактивного лечения) у больных с инсулин-независимым диабетом. После двухнедельного периода подготовки для того, чтобы пациенты познакомились с деталями исследования, 18% были случайно разбиты на группы, которые получали либо плацебо, либо активный препарат. Через один месяц пациенты поменялись местами, и одни стали получать активный препарат (вместо плацебо), а другие стали получать плацебо (вместо активного препарата) на протяжении еще одного месяца. В последнюю неделю каждого месячного периода измерялся процент гликозилированного гемоглобина ( HbA 1.

Двухпериодный дизайн с перекрестом приведен на рисунке 2.2. Различия между процентом HbA 1% после приема плацебо и Акарбозы были подсчитаны для каждого пациента. В среднем различия между активным периодом и периодом плацебо составляли 0,3% и стандартным отклонением 0,5%, что продемонстрировало крайне незначительный эффект Акарбозы на HbA 1.

Рисунок 2.2. Двухпериодное клиническое испытание с перекрестным дизайном. ( Population – популяция, Assessment – обследование, Eligible and willing subjects – подходящие и согласные на участие пациенты, Randomisation – рандомизация, Test – испытываемое лечение, Control – контрольная группа.

Двухпериодный дизайн с перекрестом и двумя воздействиями (2х2) при тестировании той же самой гипотезы имеет преимущество по сравнению с дизайном с параллельными группами, поскольку испытуемый действует как собственный контроль, и поэтому количество пациентов, которое требуется для проведения подобного исследования значительно меньше.

Однако имеется некоторое количество проблем. Одна из проблем испытания с перекрестными дизайнами заключается в возможности эффекта определенного воздействия лечения, используемого в первый период лечения, который будет сохраняться во втором периоде и поэтому может вмешиваться в действия, проводимые во втором периоде лечения. (И таким образом будет мешать финальному сравнению между двумя методами лечения). Для того чтобы исключить эту возможность используется период «вымывания», в который не дается никакого лечения, (он вставляется между двумя периодами воздействия). Другие сложности заключаются в том, что заболевание может и не оставаться стабильным на протяжении времени клинического испытания, поскольку существует достаточно длительный период лечения, большее количество пациентов будут выходить из исследования, по сравнению с дизайном параллельных групп. Senn (1993) обсудил эти вопросы с большей подробностью.

Перекрестные исследования приводят к тому, что проводится парный анализ. Неправильно будет анализировать исследование, игнорируя эти пары, поскольку такой анализ не будет принимать во внимание всю информацию, которая содержится в дизайне исследования. Дальнейшие вопросы дизайна и анализа рандомизированных клинических испытаний обсуждаются в 8 главе.

Кластерные рандомизированные исследования.

В виду природы планируемых вмешательств, в некоторых случаях может оказаться не возможным рандомизировать индивидуумов в данном исследовании. Например, исследователь может рандомизировать общины для того, чтобы протестировать различные типы методов профилактики и укрепления здоровья, или различные типы вакцины, когда проблема переноса эффекта на других означает, что лучше рандомизировать группу, а не индивидуума. С другой стороны кто-то может захотеть протестировать различные способы консультирования пациентов в соответствии с планом рандомизации, и профессионалу здравоохранения, который получил подготовку по новому подходу, сложно будет переключаться на различные методы для различных пациентов. Например, десять сотрудников здравоохранения могут стать участниками подобного исследования, а затем они будут рандомизированы по пять в каждой группе для того, чтобы получить обучение (или не получать обучения) по новой технике проведения консультаций. Затем эти профессионалы рекрутируют определенное количество пациентов, которые формируют соответствующие кластеры, и они все получают консультирование в соответствии с обучением, которое было у данного специалиста. Простейшим способом анализа этих исследований будет их анализ по группам, а не на основе каждого индивидуума ( Bland и Kerry. 1997.

Пример из литературы. Kinmonth и соавторы (1998) описали исследование «пациент центрированного ухода» для пациентов, у которых недавно был поставлен диагноз сахарного диабета. Сорок один врач общей практики были рандомизированы для того, чтобы: либо пройти трехдневный курс по новому пациент центрированному методу, или получить только руководство, выпущенное ассоциацией по борьбе с сахарным диабетом. В качестве результата измерялся индекс массы тела у пациентов, и уровень HbA 1с через один год после проведения вмешательства. В данном случае для врача общей практики было невозможно вернуться к старым методам ведения пациента, после того как он получил соответствующее обучение, и поэтому был выбран кластерный дизайн с единицей рандомизации в виде единицы обще врачебной практики.

Факториальные исследования используются для того, чтобы оценить два или более вмешательства одновременно. Обратите внимание на то, что факториальные исследования – это не исследования, которые балансирует прогностическими факторами, такими как возраст и пол, не являющиеся вмешательствами.

Пример из литературы. McMaster и соавторы (1985) описывают исследование, которое использовалось для оценки материалов по обучению женщин само обследованию молочных желез. В комнатах ожидания центров здоровья, в которых женщины ожидали приема у своего врача общей практики, были оценены четыре различных экспериментальных условия. Использовались следующие методы.

(А) Никаких брошюр, никаких записей или картинок (контрольная группа.

(В) Представлены брошюры.

(Д) Брошюры и видеопрограмма.

Два метода вмешательства – это брошюры и видеопрограмма. Оценка четырех экспериментальных условий проводилась на протяжении четырех рабочих дней (с понедельника по четверг), на протяжении трех недель. Для того чтобы удалить возможные ошибки, использовалась экспериментальная процедура с Латинскими квадратами, в которых каждое экспериментальное условие оценивалось в один из четырех рабочих дней.

Воздействия, которые известны под названием факторы, обычно применяются только на одном уровне (т.е. некое воздействие либо присутствует, либо отсутствует, и нет различных уровней одного и того же воздействия). Эти методы полезны в двух случаях: во-первых, клиницист может считать, что два воздействия вместе могут приводить к появлению эффекта, превышающего тот, который мы бы получили, если бы просто добавили два эффекта по отдельности ( синергия ) и очень часто подобная ситуация статистически выражается как взаимодействие . С другой стороны клиницист может считать, что взаимодействие является маловероятным. В данном случае для того, чтобы оценить эффект двух воздействий, потребуется меньше пациентов, чем количество пациентов из двух исследований с параллельными группами, каждая из которых изучает эффект одного из этих двух лечений.

Использование факториального дизайна 2х2 позволяет получить ответ сразу же на два вопроса. Таким образом группы А и В против С и Д измеряют значимость видеопрограммы, в то время как группы А и С против В и Д измеряют значимость брошюр.

Не рандомизированные исследования.

В обсуждении, связанном с клиническими испытаниями, мы указали на необходимость рандомизированного разделения людей на группы воздействия. В некоторых случаях, однако, рандомизация невозможна. Одним из подобных экспериментов является исследование, включающее трансплантацию сердца и последующее изучение выживаемости пациентов. Будет очень сложно вообразить рандомизацию между трансплантацией сердца и какой-то другой альтернативой, поэтому в подобной ситуации максимум, что можно сделать – это сравнить выживаемость после трансплантации, с предыдущим опытом от пациентов, которые страдали от того же самого заболевания, когда метод трансплантации отсутствовал. Подобные пациенты называются историческим контролем . Второй возможностью является выполнение сравнений с теми, кому не удалось найти донора до того, как пациент умер. Проблемы имеются с обоими подходами. Одной проблемой является то, что люди, с наиболее тяжелыми заболеваниями умирают быстрее. Наличие любого времени ожидания для соответствующего донора предполагает, что те люди, у которых имеется менее тяжелое заболевание, переживут это время ожидания. Это явно смещает результаты при сравнении кривых выживаемости в группе получивших трансплантацию, по сравнению с группой не получивших трансплантации.

Исследования пре тест / пост-тест.

Исследования пре тест / пост-тест – это исследование, в котором группы индивидуумов проходят через какое-то измерение, затем она подвергается воздействию, и показатели вновь измеряются. Целью этого исследования является выявление размера эффекта от лечения. Основной проблемой является то, что изменения в измерениях приписываются к воздействию, несмотря на то, что за временной интервал, который прошел между двумя измерениями, могли измениться и другие факторы.

Пример из литературы . Christie (1979) описывает пример, в котором сравнение до-и-после оказывается неправильным. Он описывает последовательную серию пациентов, которые были госпитализированы с инсультом в 1974 году и наблюдались проспективно до смерти, а затем подсчитывалось время их выживания. Затем, когда был установлен компьютерный томограф, в 1978 году исследование было проведено повторно с целью оценки эффективности томографа.

Таблица 2.3 Пример ошибочного исследования до-и-после.

Последовательная группа пациентов 1978 года, подвергнутая компьютерному сканированию, была сравнена с подобранной (по возрасту, диагнозу и уровню сознания) с группой пациентов в серии 1974 года. В качестве результата измерялась продолжительность выживания от момента развития заболевания. Результаты, приведенные в таблице 2.3 во втором столбце, как кажется, демонстрируют значительное улучшение у пациентов 1978 года, по сравнению с теми, кто принял участие в исследовании 1974 года. Предполагалось, что это является следствием применения компьютерного томографа, поскольку из 29 пар в 31% пациенты 1978 года имели лучший прогноз, чем пациенты 1974 года, в то время как в другой группе, лучший прогноз пациенты 1978 года имели только в 7% случаев.

Однако исследование было расширено, и в анализ были включены пациенты 1978 года, которые не были подвергнуты компьютерному томографическому сканированию (таблица 2, столбец 3) и они были сравнены с соответствующей группой 1974 года, с использованием идентичных критериев подбора групп. Это исследование снова обнаружило улучшение в 1978 году, поскольку при сравнении пар, 38% пациентов 1978 года имели лучший прогноз, чем пациенты 1974 года и только у 19% прогноз был хуже. Формальный статистический анализ обнаружил значительное улучшение в 1978 году в обоих случаях. Таким образом, вне зависимости от того, проходили или нет пациенты компьютерную томографию, на протяжении лет результаты улучшились.

В отсутствии исследования с группой контроля при сравнении пациентов, которые не подвергались компьютерной томографии, исследователи могли бы придти к выводу, что установка компьютерного томографа привела к увеличению выживаемости. Имеется два возможных объяснения этой кажущейся аномалии. Одно – это предположить, что между 1974 и 1978 годами в практику были введены другие методы улучшения лечения, не связанные с внедрением компьютерной томографии. Другим возможным объяснением является ответ на вопрос: «Как бы клиницист поступил с пациентом с инсультом, если бы он знал результаты компьютерной томографии?» Ответ, обычно, звучит так: «это бы мало что изменило». Поэтому возможно, что, несмотря на все попытки подобрать адекватные группы, пациенты 1978 года были на самом деле менее серьезно больны и поэтому жили дольше, чем пациенты, госпитализированные в 1974 году. Однако в некоторых случаях исследование до-и-после без контрольной группы являются незаменимыми.

Пример из литературы. Mills и соавторы (1986) оценили насколько образовательная кампания британского правительства увеличила знания общественности по вопросам СПИДа. Случайной выборке лиц, имеющих право на голосование, были разосланы опросники в Саутгемптоне, до-и-после кампании рекламных объявлений в газетах.

Исследователи обнаружили, например, что 33% популяции знали, как расшифровывается аббревиатура СПИД до начала кампании, и только 34% узнали об этом после кампании. Исследователи пришли к выводу, что по всей вероятности, кампания оказала небольшое воздействие на знание о СПИДе в популяции в целом, а поскольку правительственная кампания покрывала всю страну целиком, контрольную группу найти было невозможно.

Пример из литературы. Campbell и соавторы (1985а) оценивали кампанию по укреплению здоровья, которая организовывалась врачом общей практики. Случайной выборке пациентов до-и-после проведения данной кампании, были разосланы опросники, которые запрашивали информацию о количестве физической нагрузки, как в деревне, где данный врач работал, так и в контрольной деревне, в которой подобная кампания не проводилась.

В деревне, которая подверглась «воздействию», процент людей, увеличивающих физические нагрузки на протяжении более чем одной недели до того, как у них появлялась одышка, возрос с 39% до 51%. Однако и в контрольной деревне процент увеличился — с 38% до 45%. Вывод, к которому можно было придти — имелось некоторое увеличение физической нагрузки, по всей вероятности, в результате общей информации, которая была получена в обеих деревнях. Эффект влияния врача общей практики, если он и присутствовал, был достаточно небольшим. Из данного примера становится понятным, что данный дизайн исследования не позволял рандомизировать индивидуумов в деревне, которая подвергается некой кампании, и в контрольной деревне.

Проспективные исследования, имеющие как тестовую группу, так и контрольную группу, но в которых разделение на группы не осуществляется за счет закона случайных чисел, называется квази-экспериментальным дизайном. Этот дизайн очень часто используется для получения дополнительной информации о характеристиках нового лечения, применяемого в одной группе пациентов, когда рандомизация сложна или невозможна.

Основным недостатком квази экспериментального исследования является то, что в самом начале лечения невозможно установить сравнимость пациентов двух групп, поскольку воздействия не рандомизированы. Таким образом, например, при сравнении выживаемости у пациентов, которые подвергались различным типам хирургических вмешательств, выполненными различными хирургами, невозможно быть уверенным в том, что разные хирурги имеют одинаковые критерии для отбора пациентов на хирургию. Как следствие этого, любые различия в смертности, наблюдаемые между типами хирургических вмешательств, будут затушеваны систематическими различиями между пациентами, и поэтому они не будут отражать относительную смертность, связанную с данными хирургическими альтернативами.

Пример из литературы. Heartbeat Wales ( Tudor — Smith и соавторы, 1998) изучили большое количество координированных видов воздействий для укрепления здоровья в Уэльсе. Сравниваемая группа, сформированная на северо-востоке Англии, достаточно далеко для того, чтобы не произошло эффекта «загрязнения» рекламной кампанией Уэльса, служила контрольной группой (она не получала никаких дополнительных материалов, посвященных укреплению здоровья). В каждом районе были проведены два независимых кросс секционных опроса – первый был проведен до того, как началась кампания в Уэльсе, второй через шесть лет. Хотя в обоих регионах было обнаружено улучшение, однако, не было выявлено дополнительного улучшения в той области, которая подверглась воздействию.

Когорта – это часть популяции, которая идентифицирована так, что ее характеристики, например, причины смерти или количество людей, заболевших неким заболеванием, могут быть установлены с определенной степенью точности по мере того, как эта группа стареет.

Термин «когорта» очень часто используется для того, чтобы описать тех, кто родился в определенном году, но он может быть расширен для того, чтобы описать любую группу лиц, которые наблюдаются на протяжении определенного периода времени. Например, мы можем описывать когорту, рожденную в 1900 году или когорту людей, которые когда бы то ни было, работали на определенном заводе. Когортное исследование, (которое иногда также называется лонгитюдным или проспективным исследованием) – это исследование, в котором некие группы из определенной популяции идентифицируются на основании того, что они были подвергнуты воздействию некоего фактора, имеющего в свою очередь возможность воздействовать на вероятность возникновения данного заболевания, или на какие-то другие исходы. В данном исследовании можно наблюдать за двумя группами пациентов: одна группа, подвергшаяся потенциальному воздействию токсического вещества, а другая – не подвергшаяся, и затем посмотреть насколько данное воздействие влияет, например, на развитие определенных типов рака. Обычно когортные исследования используются в тех случаях, когда необходимо определить и изучить этиологические факторы, и они не имеют эквивалентного воздействия. Эти исследования очень часто называются обсервационными исследованиями . поскольку в них часто наблюдается за тем, что происходит с индивидуумами по мере их старения. Дизайн и развитие когортного исследования показан на рисунке 2.3.

Рисунок 2.3 Когортное исследование. ( Population – популяция, Disease – есть заболевание, Without disease – нет заболевания, Exposed – подвергшиеся воздействию, Not exposed – не подвергшиеся воздействию, Exposed with disease – заболевшие среди тех, кто подвергался воздействию, Exposed without disease – здоровые среди тех, кто подвергался воздействию, Not exposed with disease – заболевшие среди тех, кто не подвергался воздействию, Not exposed without disease – здоровые среди тех, кто не подвергался воздействию.

Интерпретация когортных исследований часто значительно более сложная, чем рандомизированного исследования, поскольку на интересующие нас показатели может оказывать воздействие систематическая ошибка. Например, для того чтобы определить в когорном исследовании насколько увеличивается частота сердечно-сосудистых заболеваний у мужчин, которые были стерилизованы при помощи операции вазэктомии, необходимо иметь сравнимую группу мужчин, не подвергшихся вазэктомии. Однако сравнение между этими двумя группами мужчин могут оказаться ошибочными, поскольку невозможно совершенно четко рандомизировать мужчин в группу стерилизации и не стерилизации. Мужчины, которые хотят, чтобы их стерилизовали, явно не будут принимать идею о том, что их «не будут стерилизовать». Таким образом, сравнение, которое делается на самом деле — это сравнение между теми людьми, которые хотят, чтобы их стерилизовали и теми, кто не хочет, чтобы их стерилизовали и при такой ситуации возможно большое количество систематических ошибок. Например, вазэктомированные мужчины могут оказаться лучше образованными или более спортивными, чем не вазэктомированные мужчины, что в свою очередь может оказать воздействие на частоту сердечно-сосудистых заболеваний.

В дизайне когортных исследований должен быть проведен внимательный анализ всех условий до проведения исследования для того, чтобы идентифицировать и, соответственно, измерить важные прогностические переменные, которые могут приводить к различиям между группами воздействия. Если все прогностические переменные регистрируются, различия в характеристиках между группами могут быть откорректированы для выполнения финального анализа.

Пример из литературы . Schatzkin и соавторы (1987) изучили 7188 женщин 25-74 лет, которые в 1971-1975 годах являлись обследуемыми в Национальном центре изучении здоровья и питания ( NHANES 1) в C ША. Были включены вопросы по потреблению алкоголя, затем за пациентками наблюдали с 1981 по 1984 годы и устанавливали все случаи рака молочной железы.

Исследователи обнаружили, что среди тех, кто пил значительное количество алкоголя, риск рака молочной железы был на 50% выше, чем среди тех, кто не пил. Даже предположив, что другие факторы риска такие, как менопаузальный статус, ожирение и курение могут воздействовать на риск развития рака молочной железы, исследователи, тем не менее, сумели установить связь между потреблением алкоголя и последующей заболеваемостью раком молочной железы.

В данном случае основной целью статистического анализа являлось установление факта, насколько в действительности потребление алкоголя вызывает увеличенное количество случаев рака молочной железы, или оно связано с большим количеством других факторов, связанных с потреблением алкоголя.

Пример из литературы. Campbell и соавторы (1985в) изучили 1438 женщин в возрасте 45-74 года, которые были обследованы в 1967 году и в момент обследования у них был определен уровень гемоглобина; после этого до 1979 года были зарегистрированы все случаи смерти от рака. Соответствующая информация имелась на 99%женщин.

Исследователи обнаружили, что средний уровень гемоглобина во время первого опроса у женщин, которые затем умерли от рака, составил 12,3 г/дл, по сравнению с12,8 г/дл у тех, кто к моменту окончания исследования был жив. Авторы сумели установить, что взаимоотношения между гемоглобином и раком с очень малой вероятностью было вызвано случайными факторами, оно не могло быть объяснено другими известными факторами риска, такими, например, как курение.

Ретроспективные когортные исследования.

Ретроспективные когортные исследования – это исследования, в которых группа пациентов, идентифицированная в прошлом, наблюдается до настоящего момента. Например, скажем, мы выявляем всех детей с низкой массой тела при рождении, которые были рождены в данном родильном доме 60 лет назад. Затем мы просматриваем их жизненный путь до настоящего момента, используя официальную информацию, такую как свидетельства о смерти. Затем сравнивается смертность от сердечно-сосудистых заболеваний детей, рожденных с низкой массой тела, с национальной частотой смертности.

Пример из литературы . Shaheen и соавторы (1996) изучили 391 ребенка в возрасте от 3 до 13 лет, которые жили в Гвинея-Вессау во время эпидемии кори. Спустя четыре года у этих детей авторы изучили клеточный иммунитет и сравнили тех, кто был инфицирован корью, с теми, кто был вакцинирован. Авторы продемонстрировали, что инфицированные дети в два раза чаще (по сравнению с вакцинированной группой) не реагировали на антигены.

Требуемые размеры когортного исследования не зависят не только от размера риска, не только от того, какой риск изучается, но и от распространенности определенного изучаемого состояния. В примере с вазэктомией, сердечно-сосудистые заболевания, которые не очень редко встречаются в группе мужчин в возрасте 40-50 лет, могут привести к тому, что изучаться будет группа мужчин среднего возраста. С другой стороны, если исследуется редкое состояние, когда среди большого количества пациентов наблюдается только небольшое количество случаев, вне зависимости от того были ли они подвергнуты воздействию или нет. Это обычно не позволяет использовать когортные исследования для изучения этиологических факторов при редких заболеваниях.

Когда формируется когорта из работающих людей, риск смерти в первые несколько лет наблюдения обычно несколько ниже, чем в популяции в целом. Это известно как эффект «здорового работника». Он появляется вследствие того факта, что больные люди с меньшей степенью вероятности работают. Известно также, что люди, которые отвечают на опросники, обычно более здоровы, чем те, кто не отвечает. Оба эти эффекта могут привести к проблемам с интерпретацией риска в работающей популяции. Еще одна проблема появляется, когда имеется не достаточно тщательное наблюдение за когортой, более внимательным оно проявляется за людьми, подвергавшимися воздействию, чем за людьми контрольной группы. Здесь мы должны задать вопрос: «Что произошло с теми людьми, которые потеряны при наблюдении, и не может ли повлиять плохое отслеживание пациентов на наши выводы.

Пост-маркетинговое наблюдение – это определенный тип когортного исследования, который проводится в популяции людей, получающих разрешенное лицензированное лекарство. В данном примере лекарство, которое обычно используется по всей стране, может мониторироваться не по причине своей эффективности, а по причине возможных побочных эффектов, которые возникают у пациентов, получающих испытуемое лекарственное средство. Частота подобных побочных эффектов у пациентов, получающих новое лекарство, затем сравнивается с частотой побочных действий у пациентов, получающих лекарственные средства, альтернативные этому новому лекарственному средству.

Исследования по типу случай-контроль.

Исследования по типу случай-контроль, известные также как ретроспективные исследования, начинаются с того, что выявляются люди, имеющие некое заболевание (или иную переменную результата), и затем к ним подбирается контрольная (референтная) группа лиц без данного заболевания. Связь между фактором риска и заболеванием изучается сравнением больных и здоровых по отношению к тому, насколько часто в обеих группах присутствует фактор риска. Если анализируемая переменная является количественной, то тогда анализируются средние уровни факторов риска у больных и у здоровых людей.

Дизайн и организация исследования по типу случай-контроль показаны на рисунке 2.4.

Рисунок 2.4 Исследование по типу случай-контроль ( Subjects with disease ( cases ) – больные (случаи), Subjects without disease ( controls ) – здоровые (контроль), Exposed – подвергавшиеся воздействию, Not Exposed – не подвергавшиеся воздействию.

Имеется два основных варианта дизайна. Пациенты контрольной группы могут быть выбраны таким образом, чтобы соответствовать больным пациентам по целому ряду важных переменных, таких как пол и возраст и, соответственно, тогда формируется то, что известно как парный дизайн. С другой стороны можно подобрать контрольную группу, которая будет являться выборкой из соответствующей популяции здоровых людей, что приводит к использованию не парного дизайна. Довольно часто ошибочно считается, что во всех исследованиях по типу случай-контроль должны быть критерии формирования пар, но это не так. Чрезвычайно важно, чтобы статистический анализ отражал выбранный дизайн.

Пример из литературы. Olsen и соавторы (1987) изучили семь женщин с синдромом Рейно и 10 здоровых женщин, кроме того, семь мужчин с вибрационным поражением рук и восемь здоровых мужчин. В качестве контроля выступали студенты медики. Сравнивался вазоконстрикторный отклик у больных пациентов и у пациентов контрольной группы. Авторы использовали статистические методы, которые позволяют суммировать данные для того, чтобы продемонстрировать усиленный отклик у пациентов, по сравнению с контролем, и мало вероятно, что подобное усиление возникло в результате действия случайных факторов.

Основным вопросом, на который надо ответить при анализе подобной работы является вопрос: насколько различия между пациентами и контролем связаны с заболеванием, или эти различия могут быть объяснены другими факторами? Насколько тот факт, что студенты медики моложе или здоровее, чем обычные люди в популяции, может объяснить размеры обнаруженных различий.

Основной принцип при выборе контролей (Rothman и Greenland, 1998) – это выбор пациентов, которые могли бы быть случаем (пациентами для данного исследования) и то, что отбор надо производить независимо от переменной воздействия. Таким образом, если все случаи лечатся в определенной больнице, контроли должны представлять людей, которые в случае развития у них данного заболевания, были бы госпитализированы в ту же самую больницу. Обратите внимание на то, что это не означает, что мы должны выбирать больничные контроли (смотри пример ниже). Поскольку исследования по типу случай-контроль разработаны для того, чтобы оценивать относительный, а не абсолютный риск, нет необходимости, чтобы контроли являлись репрезентативными относительно всех пациентов без заболевания, как это иногда предполагается (смотри раздел 9.4). Также неправильно требовать, чтобы контрольная группа была аналогичной пациентам по всем возможным параметрам, за исключением того, что у них нет заболевания. Пример подобного чрезмерного сравнения дается Horwitz и Feinstein (1978) в исследовании взаимосвязи между эстрогенами и раком эндометрия. Случаи и контроли были взяты из группы женщин, которые были оценены на основании результатов выскабливания. Подобная контрольная группа является неадекватной, поскольку препараты, которые вызывают заболевание в данном органе, очень часто вызывают другие заболевания или симптомы в том же самом органе. В данном случае было возможно, что эстрогены вызывали другие заболевания эндометрия, которые приводили к тому, что пациенты чаще проходили процедуру выскабливания и поэтому смогли попасть в контрольную группу.

Выбор соответствующей контрольной популяции является важным для корректной интерпретации результатов. Типичная проблема возникает тогда, когда случаями являются пациенты, госпитализированные в больницу и, соответственно, появляется проблема контрольной группы — необходимо ли выбирать контроль из больницы, или из популяции? Пример из литературы. В исследовании Oleinick и соавторов (1966) изучалась роль семейного окружения на развитие психических заболеваний у детей. При этом использовались два типа контроля для каждого случая, который был выявлен в психиатрической клинике. Одним из них был больничный контроль – дети, которые были госпитализированы в педиатрическую клинику по поводу аппендэктомии или тонзиллоэктомии; другим был популяционный контроль – дети, отобранные из местной общины. Исследователи изучали такие этиологические факторы, как плохие взаимоотношения между родителями, и измеряли силу взаимоотношения этого показателя с психическими заболеваниями. Они обнаружили, что сила связи этого показателя с психическими заболеваниями для больничного контроля была посередине, между той, что была выявлена для случаев и для популяционного контроля. Это предполагает, что больничный контроль имел некоторые характеристики, которые делали их более близкими пациентам с психическими заболеваниями, чем это было справедливо для популяционного контроля.

Вмешивающиеся переменные ( confounding ) возникают, когда существует взаимосвязь между воздействием и результатом, но при этом как результат, так и воздействие сильно связаны с третьей переменной. Крайним примером влияния третьей переменной является «парадокс Симпсона», когда третий фактор переворачивает кажущуюся связь между воздействием и результатом ( Simpson. 1951.

Пример из литературы. В качестве иллюстрации парадокса Симпсона Julious и Mullee (1994) приводят следующий пример, (представленный в таблице 2.4), описывая когортные исследования пациентов с диабетом.

Таблица 2.4 Пример парадокса Симпсона.

При взгляде на верхнюю часть этой таблицы создается впечатление, что умерла более высокая пропорция пациентов (40%) с инсулин-независимым сахарным диабетом, что заставляет нас предположить, что инсулин-независимый диабет имеет более высокий риск смерти. Однако инсулин-независимый диабет обычно развивается у лиц после 40 лет; и действительно, когда мы разбиваем группу с учетом возраста – на лиц моложе 40 лет, и лиц старше 40 лет, обнаруживаем, что в обеих возрастных группах пропорция умерших пациентов с инсулин — независимым диабетом меньше, по сравнению с пациентами, имеющими инсулин-зависимый диабет (0% против 1% и 41% против 46%). Таким образом, если мы и можем что-то сказать, это только то, что пациенты с инсулин-зависимым сахарным диабетом имеют более высокую смертность.

Парные исследования.

Основной целью формирования парных исследований является использование более мощных аналитических методов для того, чтобы контролировать вмешивающиеся перемеренные. В дополнение к этому, формирование пар может привести к более четкой идентификации соответствующего контроля. Однако формирование пар может оказаться достаточно дорогостоящим, если критерии формирования пар приводят к тому, что большое количество возможных контролей не используются, поскольку они не соответствуют критериям при формировании пар. На самом деле, если контроли слишком сильно напоминают случаи, относительный риск может быть недооценен. Обычно имеет смысл формировать пары только по двум или трем переменным, которые влияют на результаты. Наиболее частыми переменными являются возраст, пол и социальный класс.

Пример из литературы. Brown и соавторы (1987) изучали все случаи рака яичек в определенном регионе с 1 января 1976 до 30 июня 1986 года. В качестве контроля были выбраны мужчины, находящиеся в тех же самых больницах, в которые были госпитализированы пациенты с раком; их возраст находился в диапазоне двух лет от возраста пациентов, больных раком яичка; они принадлежали к той же самой этнической группе, но страдали от иного злокачественного образования, а не от рака яичек. Благодаря этому исследованию авторам удалось придти к выводу, что пациенты с яичками, не опущенными на момент рождения, имели более высокий риск развития рака яичка.

Ограничения исследований по типу случай-контроль.

Установление факта воздействия в исследованиях по типу случай-контроль полагается на раннее зарегистрированные данные или на память, и очень сложно обеспечить отсутствие случаев смещения между пациентами и контрольной группой. Случаи обычно более мотивированны, поскольку все пациенты страдают от заболевания, то они лучше и подробнее вспоминают возможные факторы риска. Одной из основных сложностей, которые возникают при проведении исследования по типу случай-контроль – это отбор соответствующей контрольной группы, что обычно и является основным источником критики опубликованных исследований по типу случай-контроль. Это привело к тому, что некоторые исследователи начали рассматривать исследования по типу случай-контроль просто как инструмент генерирования гипотез, которые затем должны быть подтверждены когортным исследованиями.

Предположим, исследователь хочет определить распространенность менструальных приливов у женщин в возрасте 45-60 лет (смотри Smith и Waters, 1983). Тогда соответствующим дизайном исследования может оказаться опрос женщин этой возрастной группы при помощи почтового опросника. В подобной ситуации данный тип опроса может быть проведен, например, в городе, графстве или на национальном уровне. Однако при проведении подобного опроса обязательным требованием является наличие списка женщин соответствующих возрастных групп. После того как подобный список будет получен, станет возможным разослать почтовый опросник женщинам из данного списка. Обычно может появиться желание сделать выборку из этого списка и разослать опросник только выборке. Пропорция для формирования подобной выборки должна быть выбрана достаточно аккуратно. Важно, чтобы те, кого отбирают, отбирались бы при помощи соответствующей адекватной методики формирования случайной выборки.

В некоторых ситуациях более адекватным подходом может оказаться приход интервьюера к тем, кто включен в выборку. Однако в то же время это может оказаться и более дорогостоящим, как с точки зрения времени, так и денег, и потребует обучения персонала. Ввиду этого подобные исследования чаще всего включают в себя меньшую выборку, чем выборка, которую можно охватить при помощи почтового опросника. С другой стороны, процент отклика на опросники может быть достаточно низким: например Smith и Waters (1983) указывают 68% отклик. Низкий отклик может вызвать значительные сложности в интерпретации результатов, поскольку всегда можно заявить (вне зависимости от того, так это или нет), что люди, отказавшиеся от исследования, являются атипичными по отношению к изучаемой проблеме, поэтому, например, оценки распространенности, полученные только от тех, кто ответил на почтовый опрос, получены с ошибкой. Таким образом, при хорошо разработанном опросе должны прилагаться все усилия для того, чтобы количество людей, отказавшихся от участия в исследовании, являлось минимальным, а соответствующий отклик принимался бы во внимание при оценке размера выборки.

При использовании одномоментных исследований часто также значительную проблему представляют собой волонтеры. Когда объектом интереса являются взаимоотношения неких показателей человека, например, физиологического отклика на увеличивающуюся дозировку лекарства, без использования волонтеров нельзя обойтись. Однако предположим, кто-то заинтересован в изучении распространенности гипертензии в общине. Одним из вариантов будет попытка подобрать волонтеров, у которых можно было бы измерить артериальное давление, например, путем публикации объявления в местной газете. Сложность этого подхода, однако, заключается в том, что не исключена возможность того, что люди, решившиеся стать добровольцами, могут оказаться ими только в связи с тем, что они беспокоятся по поводу своего более высокого артериального давления. При этом варианте подбора волонтеров нет никакого способа определить отклик, а также изучить причины, по которым люди отказались становиться добровольцами. В этой ситуации наилучшим подходом будет отбор случайной выборки из общины с помощью использования списков для голосования, или списков врачей общей практики, либо с помощью телефонного справочника, и последующего приглашения каждого человека по отдельности для измерения артериального давления. Таким образом, будет известен процент отклика, и будут идентифицированы люди, отказавшиеся от участия в исследовании.

Исследовательские организации, которые занимаются маркетингом, имеют достаточно сложные системы получения выборок, которые часто содержат элементы рандомизации. Однако очень часто они относятся к выборкам «удобства», в том смысле, что опрашиваются только те люди, которые доступны для интервьюера. Так называемые квотные выборки предполагают, что выборка репрезентативна популяции в целом по возрасту, полу или, например, социальному классу. Проблемы интерпретации квотных выборок в деталях обсуждается Moser и Kalton (1971). В основном они не рекомендуют использование квотных выборок для медицинских исследований.

В одномоментных исследованиях, по сравнению с когортными исследованиями, выше вероятность возникновения большего количества систематических ошибок. Предположим, что у нас есть одномоментное исследование, которое обнаружило отрицательную связь между ростом и возрастом. Возможные интерпретации этого факта: по мере старения у людей уменьшается рост, более молодые становятся выше или высокие люди имеют более высокую смертность, чем коротышки.

Одно из отличий когортного исследования от исследования по типу случай-контроль, или от одномоментного исследования, заключается в том, что в последний пациенты включаются вне зависимости от того, подвергались они некому воздействию, или нет. Одномоментные исследования обычно направлены на изучение воздействий, которые не меняются очень быстро, такие как, например, группа крови или курение. Однако в профессиональных исследованиях одномоментное исследование может применяться, например, когда мы хотим включить всех сотрудников фабрики, и воздействие будет определено при помощи данных отдела кадров с учетом того, как долго человек работает. Одномоментные исследования напоминают исследования по типу случай-контроль, за исключением того, что до начала исследования количество случаев не известно, они просто определяется тем, какое количество случаев существует в данной группе.

Пример из литературы. Wynne и соавторы (1987) изучили эффективность реанимационных знаний и навыков у 53 медицинских сестер, которые пришли на курсы повышения квалификации. Одной из целей исследования явилось оценить взаимосвязь между действительно существующими навыками, и навыками, которые человек считает, что у него есть.

Для того чтобы определить, может ли оказаться так, что найденная связь между навыками, оцененными самостоятельно, и навыками, измеренными на курсах повышения квалификации, возникла в результате действия случайных факторов, было необходимо использование статистических методов. Wynne и соавторы обнаружили, что нет взаимосвязи между самостоятельно оцененными и измеренными навыками, и на этом основании они пришли к выводу, что отмечаемая связь могла возникнуть в результате действия случайных факторов. Они также обнаружили, что 57% медицинских сестер абсолютно не могли выполнить реанимационные мероприятия, результат аналогичный тому, что был получен в исследовании, выполненном в США. Исследователи проинтервьюировали всех медицинских сестер, которые принимали участие в курсе повышения квалификации и на этом основании они не стали делать определенной выборки. Однако использование их результатов другими авторами требует допущения, что группа медицинских сестер, принимавшая участие в курсах повышения квалификации, является репрезентативной (или типичной) для других групп медицинских сестер, т.е. иными словами, что эта группа в целом является выборкой из популяции больших размеров.

Достаточно часто встречающейся проблемой, например, в клинической биохимии является определение допустимых значений для определенного теста. Поскольку когда определяется диапазон допустимых значений, иногда еще называемый нормальными значениями, любой пациент с подозрением на некое заболевание, может быть подвергнут этому тесту, и результаты будут сравнены с допустимыми значениями. Если результаты находятся за пределами допустимых значений, тогда это можно рассматривать, как подтверждение наличия данного заболевания у пациента. При определении допустимых значений вначале необходимо протестировать метод на лицах, у которых нет интересующей нас патологии. Для этой цели используется «нормальные здоровые волонтеры». Волонтерами очень часто являются коллеги в лаборатории исследователя или студенты медики. На самом деле подобные группы могут и не соответствовать адекватной «нормальной» группе. Например, сотрудники лаборатории все находятся под воздействием «одинакового рабочего окружения», что может оказывать воздействие на содержание различных химических веществ в их крови таким образом, что может не наблюдаться у других пациентов, а это в свою очередь может привести к неадекватному диапазону допустимых значений.

Пример из литературы. Sherry и соавторы (1988) собрали образцы крови 76 здоровых детей, у которых не было повышенной температуры, и возраст которых находился в диапазоне от 2 до 36 месяцев, затем они определили у этих детей концентрацию сывороточного пре-альбумина. Все дети были госпитализированы с вирусным менингитом на протяжении 10 дней, за один или два месяца до этого исследования. Авторы указали, предоставив при этом достаточно малое количество доказательств, что уровень пре-альбумина является репрезентативным для нормальных детей. Они указали, что нормальный диапазон находится в диапазоне двух стандартных отклонений от среднего значения. В результате они пришли к выводу, что нормальный диапазон составляет от 160 мг/л до 282 мг/л.

Основной задачей использования статистики в данном случае является определение диапазона так, чтобы в будущем при анализе нормальных детей только фиксированное их количество оказывалось вне этого нормального диапазона. Использование двух стандартных отклонений на каждой стороне от среднего предполагает, что авторы сделали предположение об определенном распределении концентрации сывороточного пре-альбумина. К сожалению, добавляя ко всему этому путаницу, данное распределение очень часто называется «нормальным». Статистические проблемы, связанные с расчетами нормальных диапазонов, обсуждается в работе Tango (1986). Еще одна дополнительная информация об интерпретации лабораторных результатов дается Fraser и Fogarty (1989.

Исследования по сравнению методов.

Еще одной дополнительной характеристикой лабораторной работы является оценка новых инструментов. Обычно именно в этих исследованиях сравниваются результаты, полученные от нового оборудования, с результатами, полученными от некоего стандартного оборудования. С другой стороны могут быть предложены два различных устройства для того, чтобы определять показатель, но при этом мы хотим посмотреть, какой из этих двух методов лучше определяет показатель.

Пример из литературы. Balsey и соавторы (1987) сравнили результаты настольного биохимического анализатора с результатами, которые получаются при использовании стандартной лабораторной техники. Они обнаружили, что для шести или семи проб ошибка, которую давала новая машина, находилась в пределах допустимой аналитической ошибки для того, чтобы принять адекватное решение о лечении. Они пришли к выводу, что настольный анализатор достаточно точен. В качестве критерия определения адекватности они использовали корреляции с различными референтными инструментами.

Bland и Altman (1986) дают достаточно хорошие рекомендации для оценки согласия между двумя методами клинических измерений, но они считают, что нельзя использовать корреляционный коэффициент, как было сделано авторами в примере, приведенном выше.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

gepatit.otvali.ru