Автоматизированный анализ текстов: topic models и вот это вот все

Для тех, кому интересно применение машинного анализа текстов в социальных науках — вот, например, виртуальный номер журнала Political Analysis на эту тему.

“Text as Data” — на, мой взгляд, одно из самых интересных направлений в политологии сейчас. Вот только несколько из недавних работ:

О том, как работает китайская цензура + видео Молли Робертс с рассказом о том как работают их методы на примере пропаганды в китайских газетах:

О том, как влияет гибель исламских религиозных лидеров на распространение их идей

О политической поляризации в американском твиттере.

Ну и, конечно же, вечная классика — о том, влияют ли политические предпочтения хозяев газет в США на то, как эти газеты освещают события (спойлер: не особенно).

Вот, например, ещё лекция авторов этой классической статьи — Мэтта Гентзкова (недавнего лауреата премии Кларка) и Джесси Шапиро про методы анализа текстов (там вначале еще короткое введение про Machine Learning вообще)