Синтетический язык
- 1 year ago
- 0
- 0
Синтетический контроль ( англ. Synthetic control method , SCM ) — эконометрический метод анализа данных в рамках , позволяющий проводить в сравнительных кейс-стади . Метод направлен на оценку эффектов исследуемого воздействия (например, экономической реформы ) на примере небольшого числа кейсов с помощью моделирования их количественных показателей в гипотетической ситуации, где воздействие не было оказано, на основе ограниченного круга похожих наблюдений посредством присвоения этим переменным определённых весов.
Рассмотрим -й регион, или какой-то другой объект наблюдения, причём , где — число регионов, среди которых 1 испытал на себе исследуемое воздействие, а остальные — нет, являясь контрольной группой (их совокупность называется «пулом доноров», англ. donor pool ), в период времени , где .
Пусть исследуемое воздействие будет оказано в период , где , и тогда — число периодов до воздействия. Обозначим отклик показателя в регионе в период времени в отсутствие исследуемого воздействия через , а в его присутствие — . Сделаем допущение о том, что при , : до наступления исследуемого воздействия, оно не оказывает эффекта на отклик в выбранном регионе. Также допустим, что воздействие, имевшее место в рассматриваемом регионе, не оказывает влияния на регионы из контрольной группы. Эффект исследуемого воздействия обозначим как . Поскольку воздействие имеет место только в и , целью SCM является определение , где — собственно, наблюдаемый в рассматриваемом регионе показатель, а — ненаблюдаемый отклик, который можно представить в качестве следующей факторной модели :
где — общий для всех регионов фактор, — вектор наблюдаемых, независимых от воздействия ковариат, — вектор их оценённых для данной выборки регионов коэффициентов, — вектор ненаблюдаемых латентных факторов, — вектор соответствующих им факторных нагрузок и — специфичности, или шум. Эту модель можно переписать в виде:
где — это -тое значение вектора , такого, что . Метод синтетического контроля заключается в подборе такого набора весов , что при , (то есть до воздействия веса сохраняют наблюдаемое значения отклика неизменным) и (и при этом эти веса позволяют точно моделировать ковариаты рассматриваемого региона через ковариаты регионов контрольной группы).
В литературе было показано, что если отклонения специфичностей незначительны при данном , размере периода до воздействия, , то есть разница между моделируемым, ненаблюдаемым откликом в отсутствие воздействия и взвешенным, но наблюдаемым в его присутствии, в таких условиях ничтожно. Соответственно, предлагается такая оценка эффекта воздействия ( ) :494-495 :
С вычислительной точки зрения, расчёт искомых весов связан с минимизацией по вектору весов нормы , где — вектор значений ковариатов для исследуемого региона до момента , а — матрица значений ковариатов для контрольных регионов. Вне зависимости от выбора исследователем положительно определённой матрицы , оптимизируемая норма раскрывается как :496 .
Для того, чтобы получить конечное значение , проводят по параметру с использованием коэффициентом дисконтирования , повышающим вес недавних наблюдений. Эту оптимизацию можно описать следующим образом: , где — вектор минимальных весов, полученный на предыдущем этапе :616 .
Определение статистической значимости полученных оценок может быть проведено посредством различных техник. В статье 2003 года, оценивающей влияние терроризма и прочих проявлений политического насилия на экономику Страны Басков , рассчитанный эффект был подвергнут т. н. плацебо -тесту (placebo test), заключавшемуся в осуществлении идентичного алгоритма синтетического контроля к Каталонии , также известной своим значительным сепаратистским движением , но не испытывавшей проблем с террористическими проявлениями этого движения .
Плацебо-тесты в литературе, использующей метод синтетического контроля, являются примером непараметрических пермутационных тестов . Моделирование синтетического отклика для всех контрольных кейсов в выборке позволяет в явном виде работать с вероятностным распределением и проверять нулевую гипотезу об отсутствии казуальных эффектов в рассматриваемом кейсе. При этом нет необходимости асимптотически приближать распределение этих эффектов у контрольных кейсов к тому или иному распределению, что и делает тесты подобного типа пермутационными .
В литературе было предложено использовать SCM не только для оценки причинно-следственных связей, но и построения прогнозов. В рамках пилотного исследования была предпринята попытка спрогнозировать экономический рост в Соединённых Штатах Америки , однако использующийся для получения весов «пул доноров» состоял уже не из стран с похожими характеристиками, но из показателей экономического роста с определённым временным лагом :616 .
Синтетический контроль совмещает элементы других каузальных статистических методов:
и .По сравнению с разностью разностей синтетический контроль предлагает более упорядоченную процедуру подбора весов для наблюдений из контрольной группы, использует больший временной промежуток перед воздействием и требует максимально возможного приближения характеристик контрольной группы к характеристикам исследуемого объекта в ходе подбора весов.
Метод синтетического контроля обладает набором сходств с линейной регрессией . Так и синтетический контроль, и регрессионный анализ предполагают линейную комбинацию весов и переменных (в последнем веса, как правило, называются регрессионными коэффициентами), причём сумма весов равняется 1. Основным различием является то, что в SCM значения этих весов заключены в , тогда как в регрессионном анализе такого ограничения нет и коэффициенты практически не интерпретируются как веса :498-499 Так контрфактуальная Германия из исследования 2015 года была «синтезирована» на основании подушного ВВП , уровня инвестиций, торговой открытости, количества школ и доли промышленности в прибавочном продукте Австрии (42%), США (22%), Японии (16%), Швейцарии (11%) и Нидерландов (9%) .
Симуляции показали, что панельный метод Сяо (фиксированные эффекты с эффектами взаимодействия ) для исследования каузальных эффектов является менее робастным к изменению в пуле доноров, нежели синтетический контроль, хотя использование обоих подходов приводит к удовлетворительным результатам. Отмечалось, что синтетический контроль является более предпочтительным, если у исследователя есть данные по дополнительным временным периодам :1001 .
Область применения метода синтетического контроля охватывает исследования политики в сфере здравоохранения , криминологию , политическую науку , различные разделы экономики .
В политологии SCM рассматривается как компромисс между конвенциональными количественными и качественными методами, позволяющий совмещать фокус на одном или нескольких кейсах со строгими критериями их подбора. Посредством этого метода изучались: экономический эффект от объединения Германии для собственно ФРГ , последствия для расходов на социальное обеспечение .
В географии SCM используется в исследованиях антропогенных ландшафтов (в рамках ) :513 .
Существуют пакеты для анализа данных посредством метода синтетического контроля в статистическом
программном обеспечением
. Для языка
R
был разработан пакет
Synth
.