Границы в цифровом пространстве

Ivan Smirnov
Thesis Notes
Published in
5 min readSep 11, 2017

Часто можно услышать, что интернет стирает границы. Действительно, отправить запрос в друзья в социальной сети одинаково легко и соседке по парте Маше Смирновой, и Мэри Смит из Америки. С другой стороны, можно ожидать, что люди все-таки чаще отправляют запрос в друзья соседке по парте, а не человеку, находящемуся за тысячи километров. В этой части мы посмотрим на то, что происходит на самом деле, а именно насколько онлайн-дружба учащихся определяется структурой образовательных организаций и географическими расстояниями.

Начнем с того, что построим сеть дружбы учащихся одной школы. Каждый кружок представляет ученика, а линии между ними дружбу на ВКонтакте. К сожалению, из получившейся картины сложно что-либо понять.

Это известная проблема представления больших сетей и для ее решения были придуманы специальные алгоритмы, которые стараются так разместить узлы сети, чтобы связи между ними были примерно одинаковой длины и как можно реже пересекались. Классический алгоритм представляет, что все узлы это одинаково заряженные частицы, а связи между ними — пружины. Тогда несвязанные между собой узлы будут расходиться, а связанные находиться примерно на одном и том же расстоянии друг от друга. В результате сильно связанные между собой группы узлов окажутся вместе на картинке. Важно отметить, что сам по себе результат работы такого алгоритма еще ничего не доказывает, однако может помочь увидеть структуру скрытую в сети. Применим такой алгоритм к нашей школе.

Теперь картина приобрела определенную структуру. Раскрасим разными цветами учащихся разных параллелей с пятого по одиннадцатый класс.

Мы видим, что сеть дружбы на ВКонтакте воспроизводит структуру образовательной организации. Не только учащиеся одного класса оказываются тесно связаны между собой, но и сами классы расположились по порядку так, что пятый класс находится на наибольшем удалении от одиннадцатого. Можно убедиться и в том, что это не просто видимость. Например, посчитать отношение количества связей внутри классов к количеству связей между классами это сравнить это значение с аналогичным, но полученным для случайного распределения классов между учащимися.

На приведенной картинке бросается в глаза, что сеть разбивается не только на классы, но и на две большие части. Что это может быть? Так как речь идет о московской школе, то она состоит из нескольких физически разделенных корпусов — результат недавней реформы образования в Москве, объединившей школы в образовательные комплексы. Покрасим корпуса разным цветом.

Наша сеть практически идеально воспроизвела разбиение школы на корпуса. Несколько исключений могут объясняться тем, что ученики перешли из одного класса в другой. Но это может быть и просто какая-нибудь ошибка. Шум есть в любых научных данных, и он не должен нас пугать до тех пор пока не вносит систематических искажений в результаты исследования.

Аналогичная картина получается и для сети дружбы на ВКонтакте студентов университета. Здесь мы видим и разбиение на четыре кампуса, находящихся в разных городах, и разбиение на курсы с первого по четвертый, и на отдельные образовательные программы (им соответствуют визуально различимые облака внутри каждого курса).

Эти результаты могут показаться тривиальными. Однако нужно не забывать, что все становится очевидным, как только узнаешь ответ. Я неслучайно начал эту заметку с изображения неорганизованной сети дружбы школьников. Не было никаких гарантий, что она удачно сложится в структуру школы. В процедуре сопоставления могла быть какая-то ошибка, школьники могли не пользоваться ВКонтакте, они могли мало дружить между собой или, наоборот, дружить сразу со всеми, их дружба могла быть организована вокруг популярных детей независимо от класса и так далее. Так что мы совершили пусть совсем небольшое, но открытие.

Построить сеть дружбы школьников можно в принципе и с помощью стандартных опросных методов. Гораздо сложнее было бы построить такую же сеть между всеми школами одного города. Однако данные ВКонтакте позволяют нам сделать и это.

Возьмем список всех школ Санкт-Петербурга и найдем пользователей ВКонтакте одного года рождения, указавших, что они учатся в одной из этих школ. Исключим пользователей, у которых нет ни одного друга из той же школы. Мы уже видели, что это эффективный способ отфильтровать поддельные аккаунты. Будем считать, что школы связаны между собой, если их учащиеся дружат на ВКонтакте. Получим такую картинку.

Связи показаны только в том случае, если со стороны каждой из двух школ в дружбу на ВКонтакте вовлечено хотя бы несколько учащихся. В противном случае связей было бы слишком много и изображение потеряло наглядность.

Как мы видим, рядом расположенные школы теснее связаны между собой. Например, в правом нижнем углу школы Колпина тесно связаны между собой, но практически не связаны с другими школами. График зависимости вероятности связи между школами от расстояния между ними выглядит следующим образом. Если школы находятся достаточно близко, то между их учащимися почти наверняка будет дружеская связь. С увеличением расстояния эта вероятность убывает. Интересно, что аналогичные результаты были получены и для социальных контактов в твиттере.

Итак, мы обнаружили, что социальные связи в интернете воспроизводят структуру образовательных организаций. Мы можем почти наверняка предсказать в каком классе или на какой образовательной программе кто-то учится, зная, где учатся его друзья. В масштабах города географическое расстояние во многом определяет вероятность социальной связи, более того эта вероятность подчиняется строгому степенному закону. Однако между организацией цифрового пространства и физического есть и принципиальные различия. О них пойдет речь в следующих частях.

Литература
Смирнов И. Б., Сивак Е. В., Козьмина Я. Я. В поисках утраченных профилей: достоверность данных ВКонтакте и их значение для исследований образования // Вопросы образования. 2016. № 4. С. 106–122
Smirnov, I. (2017). School segregation in the digital space (in preparation)
Takhteyev, Y., Gruzd, A., & Wellman, B. (2012). Geography of Twitter networks. Social networks, 34(1), 73–81.
Watts, D. J. (2011). Everything is obvious:* Once you know the answer. Crown Business.

--

--

Ivan Smirnov
Thesis Notes

Computational social scientist. Thinking about science, education and society somewhere between the Neva and the Seine