← Модуль 4. Методы и статистика

Калькулятор размера выборки

Сколько пациентов включить в исследование, чтобы результат был достоверным? Введите параметры — получите число и готовую фразу для раздела «Методы».

Пример: как это работает
Вы сравниваете два метода фиксации переломов лодыжки по шкале AOFAS (0–100 баллов). По данным литературы: MCID для AOFAS = 8 баллов, стандартное отклонение ≈ 15. Вводите: тип исхода — «число», разница = 8, отклонение = 15, α = 0,05, мощность = 80%. Результат: 56 пациентов в каждой группе (112 всего). С учётом 15% потерь: 112 / 0,85 ≈ 132 пациента.
Что вы сравниваете?
Минимальная разница между группами, важная для пациента (MCID)
Справочник MCID — какую разницу вводить для вашей шкалы

MCID (Minimal Clinically Important Difference) — минимальная разница, значимая для пациента. Используйте как δ.

Боль
ШкалаДиапазонMCID
ВАШ / VAS0–100 мм15–20 мм
ЧРШ / NRS0–101,0–1,5
Качество жизни
ШкалаДиапазонMCID
SF-36 PCS/MCS0–1003–5
EQ-5D index0–10,05
EQ-5D VAS0–1007–10
Ортопедия — нижняя конечность
ШкалаДиапазонMCID
AOFAS0–1008–15
WOMAC0–10010
KOOS (боль)0–10010–15
HOOS (боль)0–1008–9
Oxford Knee Score0–485–7
Oxford Hip Score0–488
Harris Hip Score0–10010–15
FFI0–1007–10
Ортопедия — верхняя конечность
ШкалаДиапазонMCID
DASH0–10010–13
Constant-Murley0–10010–15
Онкология
ШкалаДиапазонMCID
EORTC QLQ-C300–1005–10
FACT-G0–1085–6
Неврология
ШкалаДиапазонMCID
NIHSS0–424
mRS0–61
EDSS0–100,5–1,0
MDS-UPDRS III0–1323,25
Кардиология и пульмонология
ШкалаДиапазонMCID
6-мин. ходьбаметры25–35 м
SGRQ0–1004
CAT0–402
ОФВ1 / FEV1литры100 мл
Психиатрия
ШкалаДиапазонMCID
PHQ-90–273–5
GAD-70–214
BDI-II0–635
Реабилитация
ШкалаДиапазонMCID
Barthel Index0–1005
FIM18–12622

Важно: MCID зависит от патологии и метода расчёта. Если MCID для вашей шкалы не установлен — используйте 0,5 SD от исходных данных (правило Нормана).

SD из похожих исследований (ищите M±SD в таблице результатов)

Минимальный размер выборки
Важно: калькулятор даёт ориентировочную оценку. Для грантовых заявок и регистрации исследования рекомендуется подтвердить расчёт в специализированном ПО (G*Power) или с помощью биостатистика. Добавьте 10–20% к результату на потери при наблюдении (dropout).
Теория: что стоит за этими числами
Зачем считать размер выборки?

Рецензент спросит: «Почему в исследовании именно 47 пациентов? Достаточно ли этого, чтобы обнаружить разницу?» Если ответ — «столько было в клинике», статью отправят на доработку.

Расчёт выборки — это ответ на вопрос: сколько пациентов нужно, чтобы с заданной вероятностью обнаружить клинически значимую разницу между группами. Если пациентов мало — вы можете не заметить реальный эффект. Если слишком много — вы тратите ресурсы и подвергаете лишних пациентов вмешательству без необходимости.

Что означает каждый параметр
α (альфа) — уровень значимости

Вероятность ложноположительного результата. При α = 0,05 вы допускаете 5%-ный шанс увидеть разницу там, где её нет. Стандарт в медицине — 0,05. Для множественных сравнений используют 0,01.

Мощность (1 − β) — шанс обнаружить реальную разницу

Если мощность = 80%, это значит: при реально существующей разнице вы обнаружите её в 80% случаев (и пропустите в 20%). Стандарт — 80%. Для грантов и регуляторных исследований — 90%.

Аналогия: мощность — это чувствительность вашего исследования. Как чувствительность диагностического теста: чем выше, тем реже пропускаете болезнь. 80% мощности = 20% шанс пропустить реальный эффект.
δ (дельта) — ожидаемая разница средних

Минимальная клинически значимая разница между группами. Не статистическая, а клиническая — та, которая имеет значение для пациента.

Пример: вы сравниваете два метода обезболивания. Разница в 0,5 балла по ВАШ (визуальная аналоговая шкала, 0–10) — статистически может быть значимой, но клинически бессмысленна. Минимально значимая разница по ВАШ — обычно 1,5–2,0 балла. Именно это число вы вводите в δ.
σ (сигма) — стандартное отклонение

Разброс данных в вашей выборке. Чем больше разброс — тем больше пациентов нужно, чтобы «рассмотреть» разницу на фоне шума. Берётся из пилотных данных, похожих исследований или литературы.

Где взять σ: откройте 2–3 похожих статьи по вашей теме. В Таблице 1 или в Results найдите M±SD для вашего основного исхода. SD — это и есть σ.
p₁ и p₂ — доли в группах (для сравнения долей)

Если ваш исход — да/нет (осложнение, рецидив, выздоровление), используйте сравнение долей. p₁ — ожидаемая доля в контрольной группе, p₂ — в экспериментальной.

Пример: частота осложнений при стандартном методе — 30% (p₁ = 0,30). Вы ожидаете, что новый метод снизит её до 15% (p₂ = 0,15).
Размер эффекта (d Коэна)

Отношение разницы к разбросу: d = δ / σ. Показывает, насколько разница «видна» на фоне вариабельности данных. Калькулятор считает его автоматически.

• d < 0,2 — очень малый эффект (нужна огромная выборка)
• d = 0,2–0,5 — малый
• d = 0,5–0,8 — средний
• d > 0,8 — большой (хватит небольшой выборки)

Односторонний или двусторонний тест

Двусторонний (стандарт): вы проверяете, есть ли разница в любую сторону — лучше ИЛИ хуже. Односторонний: вы заранее уверены, что эффект может быть только в одну сторону. В медицине почти всегда используют двусторонний тест — рецензенты ожидают именно его.

Как интерпретировать результат

Калькулятор показывает минимальное число пациентов. На практике добавьте 10–20% на потери при наблюдении (dropout): пациенты выбывают, данные теряются, кто-то не приходит на контрольный визит.

Калькулятор показал 64 на группу (128 всего). С учётом 15% dropout: 128 / 0,85 ≈ 151. Значит, включайте минимум 151 пациента.