DNDM

Aleksey Tikhonov
Altsoph’s blog
Published in
3 min readJul 13, 2010

Недавно нашел интересный сайт с замечательным названием хуистори.ком. На сайте этом публикуется история регистрации доменных имен в зоне ru, история подневная, начиная с февраля 2006 года, т.е. на текущий момент уже почти за 4.5 года. Решил я эту историю немного покрутить-порисовать. Получилось с десяток картинок, их-то я и выкладываю с некоторыми пояснениями.

Это общий подневный график регистрации доменов + его сглаженная версия + кубический тренд. Явные выбросы — это активность сквоттеров. Общее впечатление — рост сходит на нет, деятельность сквоттеров приглушена с осени 2009 года.

Дальше интереснее.

Статистика регистрации доменов внутри года выглядит так:

Провал летом (“мертвый сезон”), рост по весне и к новогодним, средний рост объема за год — около 50%.

Внутри месяца ярких всплесков нет, имеется просто линейный возрастающий тренд, соответствующий общему росту. Недельная статистика тоже получилась вполне ожидаемая — падение интенсивности на выходных почти вдвое. Недельная картинка (с воскресенья по понедельник):

Далее довольно несложным алгоритмом я выделил из имен доменов отдельные слова и посчитал статистику их употребления, как общую, так и в динамике.

За весь период был выявлен следующий top30 лидеров употребления:

spb, shop, auto, club, online, art, avto, info, pro, group,
all, hotel, dom, stroy, rus, web, you, ru, service, best,
russia, mebel, it, news, studio, my, sex, nn, design, tv

В динамике доля некоторых из этих слов выглядит так:

Видны некоторые интересные закономерности, например:

  • tv+video имеют явную годовую периодичность с пиком в районе новогодних праздников и провалом в районе майских,
  • доля art+design не очень быстро, но явно убывает, а info+news, наоборот, понемногу растет,
  • рынок путешествий (hotel+tour) был агрессивно занят к лету 2007, после чего там наблюдается застой,
  • sex+porno активно росли до лета 2009, после чего резко рухнули вниз (я подозреваю в этом действия каких-то регуляторов).

Отдельно интересно посмотреть на динамику кодов городов/регионов/чего-то-еще:

На картинке, конечно, каша, но мне лень было отдельные графики рисовать. Общая тенденция по всем кодам — довольно заметный рост.

Наконец, я решил прогнать алгоритм выявления событий (аналогичный тому, что используется в twitter trends). К сожалению, до конца 2009 года данные очень зашумлены сквоттерами. Но кое-что интересное всё-таки нашлось (от мусора почищено руками):

  • июнь 2010: casinos
  • апрель 2010: interny
  • март 2010: skolkovo
  • январь 2010: ipad, tablet
  • ноябрь 2009: gripp
  • октябрь 2009: ektv, olimpiada
  • август 2009: mmcis
  • и так далее. Интерпретацию событий оставляю на ваше усмотрение ;)

Общие выводы:

  • до лета 2009 года всё очень зашумлено сквоттерами, так что какие-либо точные алгоритмы не работают;
  • летом 2009 что-то изменилось (во-первых основной рынок был уже поделен к этому моменту, во-вторых я подозреваю вмешательство гос.регуляторов, но с историей вопроса не знаком), кол-во сквоттеров от SEO существенно сократилось, однако остались, судя по всему “политические” и “новостные” сквоттеры, которым свойственно реагировать на события регистрациями небольших объемов;
  • через год-полтора подобный анализ будет более эффективен (т.к. шума будет еще меньше);
  • региональный сектор рунета уверенно растет.

Как-то вот так.

--

--