Что может предложить искусственный интеллект, выходящий за рамки традиционных статистических моделей, таких как регрессионный анализ, для изучения поведения домашних хозяйств, а именно факторов, которые приводят к расставанию пар и расторжению супружеских уз?
Летиция Менкарини из Университета Боккони совместно с Бруно Арпино из Флорентийского университета и Марко Ле Могли из Миланского католического университета проанализировали данные более чем 2000 немецких супружеских или сожительствующих пар, которые в среднем в течение десяти лет принимали участие в ежегодном исследовании GSOEP (Немецком социально-экономическом панельном исследовании), и более 900 из них закончились разводом..
Применяя подход машинного обучения (в частности, случайного леса выживаемости), процедура самостоятельно обнаружила взаимосвязь между различными факторами, содержащимися в базе данных. В данном случае учитывалось более 40 факторов, от возраста до уровня образования, от состояния здоровья до психологических особенностей: масса необработанных данных была передана в модель машинного обучения без выдвижения точных гипотез, а просто с указанием интересующего события распада союза, и алгоритм указал влияние каждого фактора, содержащегося в данных.
Переменные, представляющие наибольшую угрозу стабильности союза, были определены с точностью до 70% (прогностическая способность превосходит 50%, достигаемые традиционными методами регрессии).
Модель машинного обучения не только смогла выявить факторы, стоящие за распадом пар, но и смогла использовать эти знания для прогнозирования распада союза до того, как это произойдет. Это также связано с тем, что вместо того, чтобы передавать все доступные данные специальному алгоритму, половина набора данных использовалась для инструктирования самого алгоритма, а достоверность результатов проверялась с помощью другой половины данных.
Результаты анализа очень интересны, прежде всего потому, что методология машинного обучения позволяет взвесить относительную важность различных факторов, вызвавших разрыв отношений. Факторы, которые оказывали особое влияние в предыдущих исследованиях, здесь потеряли свою актуальность, например, безработица и высокий уровень образования и дохода партнера.
Четыре основных фактора риска, выявленных в ходе исследования, расположены в порядке убывания: личная удовлетворенность, объем оплачиваемой работы женщины, некоторые личностные факторы и возраст.
Самым сильным прогностическим фактором расставания стала личная удовлетворенность: если оба партнера недовольны, очевидно, что пара долго не продержится.
Менее очевидным является то, что сильное снижение стабильности в браке возникает, когда женщина очень довольна союзом, а мужчина – гораздо меньше, в то время как обратный эффект менее очевиден. Если женщина много часов работает вне дома, риск расставания или развода выше, даже если мужчина больше занимается домашними делами (но в этом результате нет ничего нового, и, согласно существующей литературе, это зависит от большей свободы действий и независимости работающих женщин).
Что касается личностных черт, то высокая экстраверсия у мужчин (классически связанная с более высокой степенью неверности) и низкая открытость новому опыту у женщин, менее приспособленных к изменениям, вызванным совместным проживанием, являются чертами, которые сильнее всего связаны с распадом пары. Также низкий уровень добросовестности у обоих партнеров (понимаемый как организационный потенциал в повседневной жизни и, следовательно, если он низкий, как беспорядок и неспособность выполнять взятые на себя обязательства) не способствует тому, что оставаться вместе. Но также проблемой может стать слишком высокий или слишком низкий уровень невротизма.
Этот результат можно интерпретировать как тот факт, что мучения от излишней тревожности, ревности, чувства вины, беспокойства или гнева явно усложняют отношения.
Это верно прежде всего для женщин, но, с другой стороны, если они не испытывают такого рода эмоций, это может привести к тому, что мужчины воспримут это как отсутствие интереса. Однако не было выявлено ни одного сочетания черт личности, которое было бы в большей степенисвязано с разрывом отношений. Наконец, с учетом возраста, очень молодые пары, как правило, более нестабильны, но у женщин стабильность в отношениях усиливается после 40 лет, чего нельзя сказать о мужчинах.
Анализ машинного обучения не лишен ограничений. В данном случае главным является то, что он относился только к Германии, а также содержал мало подробностей о психологических аспектах двух партнеров. Однако, с методологической точки зрения, исследование демонстрирует большой потенциал методов машинного обучения в демографических и социологических исследованиях в целом, подчеркивая их способность отслеживать и анализировать большое количество прогностических факторов, автоматически находить линейные или нелинейные взаимосвязи, аддитивные или неаддитивные связи между этими факторами и интересующим результатом, с большей точностью и большей надежностью оценок относительно коллинеарности, чем обычно используемые методы.
Помощь психолога