Балансировка Ситибайк

Urbica
7 min readMay 4, 2016

--

Небольшая история про Нью-Йоркский прокат велосипедов и о том, как большой город справляется с высокой нагрузкой.

Оригинал текста: в англоязычном блоге Urbica Design

Широко известно, что открытые данные имеют большой потенциал в развитии городского транспорта. «Ситибайк» — система проката велосипедов в Нью-Йорке, предоставляет большое количество данных о перемещениях пользователей в системе, которые могут быть визуализированы множеством способов.

Большие данные, как правило содержат в себе интересные срезы знаний, которые сразу могут быть не видны. Анализируя «скрытые» в открытых данных знания, можно открыть проблему с неожиданной стороны.

Одна из наиболее актуальных проблем Нью-Йоркской системы проката велосипедов — неравномерное перераспределение маршрутов поездок велосипедистов. Поскольку велосипед в Нью-Йорке это средство перемещения, люди утром едут на работу, а вечером с работы. Таким образом, офисные районы получают больше велосипедов в начале рабочего дня, а жилые — вечером. Количество желающих воспользоваться сервисом больше, чем велосипедов. Это требует ребалансировки системы. Рядом с основными транспортными узлами (станциями метро и вокзалами) требуется особо следить, чтобы сервис был доступен для пользователей. В час-пик эта проблема стоит особенно остро.

Плохо или невовремя сбалансированная система, в конечном счёте приводит к расстроенным пользователям. Для того, чтобы эфективнее балансировать систему, Ситибайк использует вело-трейлеры, которые могут перемещать до 3х велосипедов — так стандартным грузовикам сложно маневрировать по улицам, полных людей и машин в часы пик.

Мы решили исследовать, как происходит ребалансировка системы велопроката: куда и когда перемещаются велосипеды — и пользователями и специальными службами.

Объектом нашего исследования стали три вещи: визуализировать маршруты ребалансировки, совместив их с маршрутами поездок самих велосипедистов, во-вторых, посмотреть как загружены (или свободны) станции проката в течение дня, и в третьих, составить профиль для каждой конкретной станции.

Проект основывается на открытых данных о статистике поездок Ситибайка и доступности станций от проекта Open Bus. Для поездок мы использовали данные обо всех поездках на велосипедах за 2015 год по будням. Для визуализации данных на карте мы использовали Mapbox GL JS, а для графиков —javascript-библиотеку D3.js.

Забегая вперёд, посмотрите на наш интерактивный проект.

Здесь два режима — первый режим показывает маршруты поездок, второй — среднюю загруженность станций, а кликнув в станцию можно посмотреть детальную статистику о ней. Данные представлены в усреднённых значениях и в средних значениях в разное время суток.

Маршруты поездок и ребалансировки

Поскольку в исходных данных нет реальных маршрутов (GPS-данных нет в системе), мы предположили, как могли бы пролегать маршруты поездок от станции до станции, используя кратчайший маршрут, построенный с помощью Open Source Routing Machine (OSRM).

Наиболее частные маршруты поездок и ребалансировки в 6 утра

Как понять куда перемещались велосипеды для ребалансировки? Очень просто — в открытых данных есть ID велосипедов, и поездка, которая началась не с той станции, на которой закончилась предыдущая может означать два случая: или велосипед перемещали не велосипедисты, или он побывал на обслуживании: в среднем велосипед «пропадает» на обслуживание на 3–4 дня и это видно по данным. При ребалансировке среднее время между поездками 10–12 часов, и как правило это ночные часы — ведь велосипеды перераспределяются, в основном, когда снижается городской трафик.

Точное время ребалансировки нам не известно, это невозможно было понять по доступным данным, и можно лишь предположить и использовать среднее время между завершением поездки на одной станцией и началом поездки на другой станции.

Total trips (blue) and total bike transfers x 10 (orange) hourly in 2015

Доступность велосипедов

Доступность велостанций наиболее важная часть ребалансировки. Наиболее критичны крайние случаи — когда велостанция переполнена (нельзя вернуть велосипед, нет свободных слотов) или пустая (нет свободных велосипедов). Данные о доступности публикует проект The Open Bus, который агрегирует данные JSON-поток данных Ситибайка, записывая статус каждой станции с интервалом в 10 минут.

Average bike availability at each station per hour (bikes/total docks)

Чтобы понять типы станций, по их загруженности и найти похожие, мы использовали алгоритм k-средних значений в R (программный пакет для расчётов). Это несложный алгоритм, который хорошо применим на больших наборах данных. Каждая станция имеет 24 значения (% загруженности во времени суток).

Получилось три типа станций:

Тип 1: Станция слабо загружена в течение всего дня, такие станции склонны к загрузке в среднем 30%

Тип 2: Станция слабо загружена утром и вечером, а днём — станция заполнена

Cluster 3: Станция загружена утром и вечером, а днём она загружена слабо

Видите разные цвета станций?

Разные типы станций проката на карте ©OpenStreetMap, Mapbox, Citibike, OpenBus data

Почему у станций разное поведение? Как замечено ранее, потоки велосипедистов повторяют потоки трафика. Давайте возьмём станции в Ист Сайд и Ист Виладж — рацоны с большой долей жилых и смешанных (жилые/офисные) кварталов, известные места для ночной жизни. Станции в этих районах обычно заполнены вечером и ночью, освобождаются только под утро. Похожее повдение у станций на верхнем Вест Сайд, где премущественно преобладают жилые кварталы. Противоположное поведение у станций в районах Нижний Манхэттен, Сохо, Трайбека, и вокруг Цивик Центра, в районах, где преобладают офисные и коммерческие здания. Все эти станци слабо загружены вечером и ночью, зато переполнены днём. Третий тип станций с преимущественно низкой загрузкой преобладает на Бродвее, в Южном Мидтауне, на станциях на востоке Центрального Парка и в Бруклине.

Может показаться очевидным, что в течение дня деловые районы наполняются, жилые пустеют, а рядом с туристическими местами типа Центрального парка, станции обычно наполнены слабо. Однако, поведение станции важно, так как это помогает понять пользователям , в каких районах, что ожидать от системы. Например, для жителей Бруклина, которые пользуются станциями около Манхэттен Бридж полезно было бы знать, что у этих станций высокая доступность велосипедов днём, и низкая доступность велосипедов утром и вечером.

Топ-10

Мы обнаружили, что 8 из 10 станций с высоким спросом не фигурируют в топ-10 станций, которые получают больше велосипедов через ребалансировку:

Станции, которые получали больше всего велосипедов от рабалансировки в 2015 году:

  1. 521–8 Ave & W 31 St (Chelsea) — 22,763 велосипеда
  2. 529 — W 42 St & 8 Ave (Clinton) — 18,892 велосипеда
  3. 511 — E 14 St & Avenue B (Stuyvesant Town) — 16,521 велосипед
  4. 432 — E 7 St & Avenue A (East Village) — 13,312 велосипедов
  5. 517 — Pershing Square South (Murray Hill) — 12,059 велосипедов
  6. 519 — Pershing Square North (Murray Hill) — 11,257 велосипедов
  7. 356 — Bialystoker Pl & Delancey St (Lower East Side) — 7,648 велосипедов
  8. 520 — W 52 St & 5 Ave (Midtown) — 7,524 велосипеда
  9. 3230 — Penn Station Valet* (Midtown) — 7,089 велосипедов
  10. 445 — E 10 St & Avenue A (East Village) — 6,795 велосипедов

* Penn Station Valet (Пенн Стейшн ) на этой станции расположен склад большой вместимости

10 станций с наибольшим спросом (по числу поездок):

  1. 519 — Pershing Square North (Murray Hill) — 104,813 поездок
  2. 521–8 Ave & W 31 St (Chelsea) — 100,796 поездок
  3. 293 — Lafayette St & E 8 St (West Village) — 95,890 поездок
  4. 435 — W 21 St & 6 Ave (Flatiron) — 87,149 поездок
  5. 497 — E 17 St & Broadway (Union Square) — 86,108 поездок
  6. 426 — West St & Chambers St (Lower Manhattan) — 79,061 поездка
  7. 285 — Broadway & E 14 St (West Village) — 73,682 поездки
  8. 151 — Cleveland Pl & Spring St (Nolita) — 70,374 поездки
  9. 284 — Greenwich Ave & 8 Ave (Greenwich Village) — 67,950 поездок
  10. 402 — Broadway & E 22 St (Flatiron) — 67,497 поездок

Десять наиболее популярных пар станций для балансировки:

  1. 432 E 7 St & Avenue A (East Village) > 511 E 14 St & Avenue B (East Village): 4107 bikes
  2. 477 W 41 St & 8 Ave > 500 W 52 St & 5 Ave : 4097 bikes
  3. 359 E 47 St & Park Ave > 519 Pershing Square N : 3292 bikes
  4. 520 W 52 St & 5 Ave > 529 W 42 St & 8 Ave : 3057 bikes
  5. 492 W 33 St & 7 Ave > 519 Pershing Square N: 2651 bikes
  6. 511 Е 14 St & Avenue B > 432 E 7 St & Avenue A: 2628 bikes
  7. 329 Greenwich St & N Moore St > 363 West Thames St: 2621: bikes
  8. 520 W 52 St & 5 Ave > 449 52 St & 9 Ave: 2563 bikes
  9. 352 W 56 St & 6 Ave > 468 Broadway & W 55 St: 2233 bikes
  10. 415 Pearl St & Hanover Square > 432 E 7 St & Avenue A: 1942 bikes
Top ten: trip routes (blue), rebalancing routes (orange). ©OpenStreetMap, Mapbox, Citibike, OpenBus data

Исследовать этот невероятный объём данных вы можете самостоятельно, в нашем интерактивном проекте:urbica.co/citibike

Этот проект ещё будет продолжаться — мы надеемся порадовать вас новыми открытиями, ведь данных действительно много и они интересные.

Этот проект основан на магистерской работе Александра Тедески «Пространственный анализ перераспределения велосипедов в Нью-Йорке». Александр — географ, который специализируется на проектах в России, Восточной Европе и Центральной Азии, недавно закончил Университет Лиссабона по специальности «Геопространственные технологии». Как урбанист и активный велосипедист, он мечтает, чтобы города становились более комфортными для жизни.

О нас:

Urbica — компания, занимающаяся анализом и визуализацией данных про городскую среду. Urbica специализируется на информационном дизайне, интерфейсах и анализе данных.

Спасибо, что прочитали нашу историю! Если она вам понравилась — поделитесь ей!

--

--