1 ноября 2019 г., 17:12

1K

Стали ли мы хоть чуточку счастливее за 200 лет? Исследователи проанализировали миллионы книг, чтобы выяснить это

15 понравилось 0 пока нет комментариев 0 добавить в избранное

Вот что говорит литература о нашем благополучии согласно алгоритму анализа настроений

Автор: Сигал Самуэл

Стали ли люди счастливее с течением времени — или мы по ходу истории становимся только несчастнее?

Группа исследователей разработала новый креативный способ решения этого вопроса. Исходя из того, что все, что мы пишем, многое говорит о наших основных чувствах, они проанализировали миллионы книг, опубликованных в период с 1820 по 2009 год, и на основе выборки слов оценили изменения в субъективном благополучии жителей четырех стран: США, Великобритания, Германия и Италия. Этот период и эти страны были выбраны, потому что по ним имеется больше всего данных.

Попытки оценить уровень счастья больших групп населения сами по себе не новы. В 2011 году Организация экономического сотрудничества и развития (ОЭСР) опубликовала свой первый доклад о благосостоянии своих стран-членов, а с 2012 года ООН публикует свой ежегодный доклад о счастье в мире. И хотя они могут быть полезны для оценки современного уровня благосостояния, однако не дают представления о том, насколько счастливыми были люди в прошлые века.

В исследовании, опубликованном на этой неделе в журнале «Nature Human Behavior», ученые объясняют, как они постарались вернуться назад во времени, опираясь в основном на коллекцию Google Books, которая включает более 8 миллионов томов, т.е. более 6% всех когда-либо опубликованных книг. Они проанализировали также журналы и газетные статьи.

Конечно, они не могли обрабатывать миллионы текстов вручную, поэтому использовали алгоритм, называемый анализом настроений, предназначенный для оценки положительных или отрицательных чувств по используемым нами словам.

Как и в предыдущих работах по анализу настроений, на первом шаге исследователи обратились к уже существующим базам данных, содержащим тысячи слов, которые люди оценили, исходя из того, с хорошими или плохими чувствами они у них ассоциируются. Эти большие базы данных собраны для английского, немецкого и итальянского языков и содержат, например, такие слова, как «грабитель», «котенок», «рак» и «свобода». Средняя оценка для каждого слова становится «аффективной нормой слова», т.е. мерой того, о каком уровне благополучия свидетельствует данное слово.

Имея эти рейтинги, исследователи выясняют, сколько раз каждое слово встречается в текстах, публикуемых за год в каждой из исследуемых стран. Считается, что таким образом можно оценить средний уровень благополучия населения в данное время и в данном месте.

Более того, можно сопоставить всплески или провалы уровня счастья с мировыми событиями и национальной политикой (гражданские войны, обвалы фондового рынка или рост валового внутреннего продукта), и попытаться выяснить, события какого типа приводят к самому большому подъему или спаду благополучия населения.

В новом исследовании принимали участие ученые из университета Уорика, университета Глазго и института Алана Тьюринга в Лондоне. Предполагается, что их выводы могут помочь правительствам принимать более обоснованные политические решения, ориентируясь на количественные данные по факторам, на которые следует обратить внимание, если они хотят повысить уровень удовлетворенности жизнью своих граждан.

Вот несколько самых впечатляющих выводов:

— Увеличение национального дохода вызывает рост уровня национального счастья, но для заметного эффекта на уровне страны требуется огромный рост;
— Увеличение средней продолжительности жизни на год влияет на уровень счастья точно так же, как увеличение ВВП на 4,3%.
— Сокращение срока военных действий на год оказывает такое же влияние на уровень счастья, как и 30%-ный рост ВВП.

Такого рода данные могут быть полезны для стран-членов ОЭСР и других стран, которые сейчас сосредоточены на повышении благосостояния своих граждан. Это, например, Бутан, в 2008 году закрепивший «общее национальное счастье» в своей конституции. Или Объединенные Арабские Эмираты, где в 2016 году была введена должность министра по делам счастья. А еще есть Новая Зеландия, в этом году первой в мире выделившая «бюджет на благосостояние». Для оценки прогресса в повышении благосостояния, правительство страны будет использовать 61 показатель, отслеживающий все — от уровня одиночества до качества воды. Но неизвестно, какое значение имеет каждый из факторов.

Количественный анализ, как в новом исследовании, теоретически может помочь политическим деятелям понять это. Но мы должны быть очень осторожны, используя анализ настроений как руководство для выработки политики.

Уровень счастья по странам

Какого успеха добились США, Великобритания, Германия и Италия в последние 200 лет? Национальный индекс исследования показывает, как менялся показатель счастья. На диаграммах ниже выделенные красным цветом области соответствуют Первой мировой войне, Второй мировой войне и другим важным событиям.

Для США еще одна затененная область указывают годы гражданской войны (1861–1865), естественно повлекшую за собой падение благосостояния. Пунктирные красные линии совпадают с крахом фондового рынка Уолл-стрит (1929 г.), окончанием Корейской войны (1953 г.) и падением Сайгона (1975 г.) соответственно.

«Примечательно то, что национальное субъективное благополучие невероятно устойчиво к войнам», — сказал в своем заявлении руководитель проекта Томас Хиллз, добавив:

Даже временные экономические подъемы и спады имеют слабый долгосрочный эффект. У нас есть данные по американской гражданской войне, Европейским революциям 48 года, бурным 20-м годам и Великой депрессии. Но люди быстро вернулись к своим прежним уровням субъективного благополучия после окончания этих событий. Наше национальное счастье напоминает разводной ключ, который мы открываем и закрываем, чтобы скорректировать свои переживания в соответствии с недавним прошлым, недолго поминая победы и трагедии нашего века.

картинка Alenkamouse

На диаграмме по Германии пунктирные красные линии указывают на окончание франко-прусской войны и объединение (1870 г.), приход Гитлера к власти (1934 г.) и объединение (1990 г.) соответственно.

Дополнительный затененный участок для Италии соответствует объединению этой страны (1861-1870).

«Глядя на данные по Италии интересно отметить медленный, но постоянный спад в годы фашизма и резкий спад в следующие за последним кризисом годы», — сказал участник проекта Эудженио Прото.

картинка Alenkamouse

Для подтверждения своих измерений ученые сравнили их с данными других исследований благосостояния: обзор Евробарометр и Всемирная база данных счастья. Оказалось, что новые измерения почти в точности соответствуют их отчетам. В опросах люди отвечали на вопросы типа «В целом, вы очень довольны, достаточно удовлетворены, не очень довольны или совсем не удовлетворены своей жизнью?» Но они охватывают только последние несколько десятилетий, поэтому не могут ничего сказать о том, как люди чувствовали себя столетие или два назад, и поэтому новое исследование было расценено как необходимое.

Исследователи также отмечают: «Наш конкретный подход непосредственно доказало исследование 17 миллионов постов в блогах, показавшее, что простой расчет на основе взвешенного аффективного рейтинга слов был достаточно точным (70 процентов) при прогнозировании настроения блогов по оценке самих блогеров».

Тем не менее, существуют некоторые внутренние ограничения для исследований по алгоритму анализа настроений. Важно учитывать это, прежде чем делать вывод о том, что подобное исследование можно использовать для обоснования политики.

Насколько мы можем доверять анализу настроений?

В последние несколько лет анализ настроений проводился коммерческими компаниями, социологами, журналистами и многими другими из тех, кому нужны были количественные инструменты, чтобы разобраться в изменяющихся настроениях населения.

В научных исследованиях подход имел различную степень успеха. Применяя анализ настроений к публикациям в Twitter и Facebook, исследователи пытались прогнозировать все, от трендов на фондовом рынке до сезонных колебаний настроения и депрессии у пациентов.

Но мы должны подходить к новому исследованию анализа настроений с некоторой долей скептицизма. Важно помнить, что он измеряет субъективное благополучие, а не объективное, определяемое физиологическими показателями, такими как уровень кортизола (основного гормона стресса). И из-за культурных различий люди в одной стране могут быть склонны гиперболизировать свое чувство несчастья, а люди в другой будут склонны преуменьшать его.

Кроме того, алгоритмы прогнозирования, как правило, совершенно не учитывают социального контекста, а он действительно имеет значение. Например, если подросток называет что-то «убойным», то, скорее всего, он имеет в виду что-то хорошее. Но если в новостной статье говорится об «убийце», то, скорее всего, случилось что-то ужасное. Как читатель, вы интуитивно понимаете это, потому что принимаете во внимание контекст. Но алгоритм может неправильно классифицировать подобные вещи.

«На данный момент у нас совсем дрянное программное обеспечение. Компьютеры не понимают нюансов и шуток», — сказала мне Мередит Бруссард, профессор дата-журналистики Нью-Йоркского университета и автор книги «Искусственный неинтеллект».

Она добавила, что анализ настроений и другие средства ИИ, как правило, имеют высокий уровень ошибок, потому что они ограничены проведением фундаментально математического анализа языка — отслеживания того, сколько раз встречается одна буква, как часто она встречается рядом с другой буквой, и так далее. Эти модели понимают язык не так, как мы, люди. Мы выделяем понятия и встраиваем их в более широкие рамки смысла.

С этой проблемой связан и вопрос о том, чьи слова анализировать, а чьи не принимать во внимание. Угнетенные меньшинства, если они вообще имеют возможность излагать свои истинные взгляды, склонны делать это в периферийных публикациях или в низкокачественных брошюрах (вспомним, например, ту роль, которую журналы играли в сообществе ЛГБТ). Маловероятно, что подобные тексты будут отображаться в Google Books.

Авторы нового исследования признают эту проблему. «Наши данные взяты из опубликованных текстов, а они могли подвергаться цензуре. И Германия 1940-х годов, когда негативные изображения нацистского режима подвергались цензуре, тому пример», — пишут они.

Авторы пытаются корректировать цензуру в исследовании, вводя переменную, определяющую уровень демократии общества, и используя «разные источники» — широкий спектр книг, газет и журналов.

Но, как они сами говорят, «никакой контроль не может быть совершенным».

Таким образом, хотя это исследование и приоткрывает окошко на меняющееся ощущение благополучия людей, отраженное в их текстах, оно все же не может определять решения политиков.

Совместный проект Клуба Лингвопанд и редакции ЛЛ

В группу Клуб переводчиков Все обсуждения группы
15 понравилось 0 добавить в избранное

Комментарии

Комментариев пока нет — ваш может стать первым

Поделитесь мнением с другими читателями!

Читайте также