Руководитель исследования Харуно Масахико и доктор Мори Кадзума из Центра информации и нейронных сетей (CiNet) Национального института информационных и коммуникационных технологий сообщают об использовании машинного обучения для анализа поведения в Twitter и прогнозирования широкого спектра личностных черт и качеств, включающих интеллект и экстраверсию.
В частности, в исследовании использует компонентное повышение градиента, чтобы продемонстрировать, что сетевые характеристики, такие как количество твитов и количество лайков, а также употребление слов при написании твитов являются прогностическими для социальных (например, экстраверсия) и психических (например, тревожность) черт личности соответственно. Этот подход может обеспечить новый способ диагностики психического здоровья и персонализированных побуждений к действиям.
Новое исследование было опубликовано в Journal of Personality.
Социальные медиа-сервисы быстро стали универсальными инструментами коммуникации. Предыдущие исследования показали, что информация об использовании Facebook и Twitter может выявить основные и характерные личностные черты, основанные на модели “Большая пятерка”. Но все больше растет интерес к тому, какую информацию можно использовать, какие еще личностные черты и качества можно выявить при анализе социальных сетей, и насколько точно эта информация отражает личность пользователя.
Исследование, проведенное доктором Мори и руководителем Харуно, говорит о том, что широкий спектр личностных черт и качеств можно определить по анализу четырех различных типов поведения пользователей в Twitter – сетевым характерным особенностям поведения, времени использования, статистике и использованию слов.
Статистический анализ выявил значительную корреляцию между измеренными и прогнозируемым личностными оценками и качествами, с коэффициентами корреляции около 0,25. Этого значения недостаточно для точного определения личностных качеств индивида, но при достаточно большой выборке населения данная технология может дать информативные результаты.
Прогнозирование широкого спектра личностных черт и качеств. Изображение предоставлено Национальным институтом информационно-коммуникационных технологий.
A: измеренные и прогнозируемые оценки экстраверсии по модели “Большая пятерка”
Б: прогнозы на основе сетевой инфомации
C: прогнозы на основе статистики слов
Д: прогнозы на основе использования слов (по набору слов)
Результативность оценивалась по коэффициентам корреляции между измеренными и прогнозируемыми баллами оценки черт и качеств личности. Сплошные, штриховые и пунктирные линии показывают Р = 0,05 / 52, р = 0,01/52 и Р = 0,001/52 соответственно.
В ходе исследования у 239 участников (156 мужчин, 83 женщины со средним возрастом 22,4 года) была собрана информация в социальных сетях. Также они прошли личностные тесты, измеряющие 24 черты и качества личности (52 субшкалы). Информация из Twitter может быть надежно использована для прогнозирования 23 из этих 52 субшкал. На рис. A показана положительная корреляция (коэффициент корреляции = 0,44) между измеренными и прогнозируемыми оценками экстраверсии модели “Большая пятерка”, основанными на 10-кратной процедуре перекрестной валидации, выполненной 10 раз (с поправкой Бонферрони Р 0,05/52).
Анализ показал, что некоторые социальные черты личности, – экстраверсию, эмпатию и аутизм,- можно спрогнозировать по сетевым признакам (рис. B). Другие черты личности,- социально-экономический статус, курение/употребление алкоголя и даже депрессия или шизофрению,- можно было предсказать по особенностям использования языка (рис.C и D). Прогнозирование по используемому времени было труднее соотнести с измеряемыми чертами личности, но была обнаружена значительная корреляция с интеллектом и социальной ценностной ориентацией.
Помощь психолога