Как яндекс определяет пробки на дорогах и дтп


Как работают Яндекс.Пробки. Принцип работы алгоритма онлайн сервиса Яндекс.Пробки / Украинский бизнес ресурс UBR.ua

"Меня часто спрашивают как работают Яндекс.Пробки и каким образом улицы городов закрашиваются в тот или иной цвет, – рассказывает Леонид Медников, руководитель аналитики этого сервиса. – Многие даже в шутку предполагают, что это делается вручную".

Ради интереса в Яндекс.Пробках посчитали, что если бы это действительно делал специально обученный человек, то только для закраски улиц Киева, при скорости 1 км. в 10 секунд, ему бы понадобилось около 3 часов. И это только для обозначения ситуации в данный конкретный момент времени. Для полноценного обеспечения функционирования сервиса с регулярными обновлениями, Яндекс.Пробкам пришлось бы нанять 40 человек, которые были бы вынуждены работать по 24 часа в сутки.

А учитывая, что сервис Яндекса покрывает не только Киев, но и многие города России, а также ряд населенных пунктов Турции, общая потребность в персонале составила бы около 5 тыс. человек. "Что интересно: в Яндексе действительно есть такое количество людей, – говорит Леонид. – Но Яндекс – это не только сервис Пробок, поэтому они, конечно же, занимаются совершенно другими вещами".

Текущая зима заставила мониторить состояние автомобильных дорог, пожалуй, даже самых консервативных и ленивых киевлян. Снегопады, праздники, ремонт, аварии и плохие дороги стали основными причинами дорожных заторов.

По данным Яндекс.Пробок, в целом этой зимой ситуация на киевских дорогах была немного сложнее, чем за год до этого.

Специалисты сервиса подтверждают известную истину: больше всего пробок и заторов в Киеве возникает утром, когда люди едут на работу, и вечером, когда возвращаются домой. При этом во второй половине дня ситуация на дорогах обычно сложнее, чем в первой.

Яндекс исследовал загруженность дорог Киева в 2012 и начале 2013 года

Такая неблагоприятная ситуация Яндекс.Пробкам лишь на руку. Статистика косвенно подтверждает это: уже 3-й год подряд количество пользователей сервиса удваивается.

Рано или поздно почти каждый пользователь сервиса задается вопросом: как же Яндекс составляет карту пробок и можно ли ей доверять? Помимо догадки, что вручную, есть мнение, что это делается с использованием видеокамер на дорогах. Но все намного проще и в то же время сложнее.

В любом потоке автомобилистов, которые двигаются по дорогам, почти наверняка найдутся пользователи приложений Яндекс.Карты или Яндекс.Навигатор. Их мобильные устройства передают Яндексу информацию об их месторасположении, направлении и скорости движения. Поэтому, если поступает информации о замедлении движения, это может свидетельствовать о заторах.

"Чтобы участвовать в сборе данных, автомобилисту необходимы: подключенное к интернету мобильное устройство (телефон, смартфон, КПК) с GPS-приемником (встроенным или внешним) и установленное на этом устройстве приложение Яндекс.Карты с включенным режимом "сообщать о пробках", – сообщают в Яндекс.Пробках. – Каждые несколько секунд устройство передает свои географические координаты, направление и скорость движения в компьютерную систему Яндекс.Пробок. Затем программа-анализатор строит единый маршрут движения с информацией о скорости его прохождения — трек. Треки поступают не только от частных водителей, но и от машин компаний-партнеров Яндекса (организации с большим парком автомобилей, курсирующих по городу)".

Помимо своих координат автомобилисты могут сообщать сервису дополнительную информацию об авариях, ремонтных работах или других дорожных неприятностях, что также учитывается сервисом при определении степени загруженности той или иной улицы.

Анализатор Яндекс.Пробок

У сервиса Яндекс.Пробки есть так называемый анализатор, который призван ответить на несколько вопросов.

Где ехала машина?

GPS-приемники допускают погрешности при определении координат, что затрудняет построение трека. Погрешность может "сместить" автомобиль на несколько метров в любую сторону, например, на тротуар или крышу рядом стоящего здания. Координаты, поступающие от пользователей, попадают на электронную схему города, на которой очень точно отображены все здания, парки, улицы с дорожной разметкой и прочие городские объекты. Благодаря этой детализации программа понимает, как на самом деле двигался автомобиль. Например, в том или ином месте машина не могла выехать на встречную полосу или поворот был совершен по дорожной разметке, не "срезая" угол.

Ехала ли и машина ли?

Чтобы правильно воссоздать картину загруженности дорог, необходимо проверять, соответствует ли трек ситуации на своем участке. Пользователи мобильных Яндекс.Карт могут иногда останавливаться или замедлять движение не из-за пробки, а, например, чтобы купить что-нибудь в киоске или не пропустить малозаметный поворот.

Помимо этого сервисами Яндекса могут пользоваться велосипедисты или пешеходы, которые также могут "спутать карты" Яндекс.Пробкам.

Как ехали другие?

Поэтому, если мимо свободно едут несколько автомобилей с мобильными устройствами, такой трек будет отсеян алгоритмом, потому что не отображает реальную загруженность участка. Чем больше пользователей у сервиса, тем точнее информация о дорожной ситуации. К слову, как утверждает Дмитрий Мельник, менеджер по маркетингу Яндекс.Карт и Пробок в Украине, количество пользователей в Киеве, которые передают данные Яндексу, в среднем за день составляет порядка 50 тыс.

После объединения проверенных треков алгоритм анализирует их и выставляет "зеленые", "желтые" и "красные" оценки соответствующим участкам дорог.

Автомобильные пробки 2012-2013: Основные цифры и факты

Карта пробок

Далее происходит объединения всей поступающей информации. Каждые две минуты для мобильных устройств и каждые четыре для стационарных, программа-агрегатор собирает  информацию, полученную от пользователей мобильных сервисов Яндекса в одну схему. Которая затем "отрисовывается" на слое Пробки Яндекс.Карт.

Как считаются баллы Яндекс.Пробок

Шкала баллов настроена по-разному для каждого из городов: то, что в Киеве – небольшое затруднение, в другом городе может стать уже серьезной пробкой и наоборот.

Баллы рассчитываются следующим образом. По улицам каждого города заранее составлены маршруты, включающие в себя основные шоссе и проспекты. При этом данные о второстепенных улицах программой отсекаются как несущественные.

Для каждого маршрута есть эталонное время, за которое его можно проехать по свободной дороге, не нарушая правил. После оценки общей загруженности города программа-агрегатор рассчитывает, на сколько отличается реальное время от эталонного. На основе разницы по всем маршрутам и вычисляется загруженность в баллах.

Хотите первыми получать важную и полезную информацию о ДЕНЬГАХ и БИЗНЕСЕ? Подписывайтесь на наши аккаунты в мессенджерах и соцсетях: Telegram, Twitter, Google+, Facebook, Instagram.

ubr.ua

Разработчики "Яндекс.Пробки" рассказали о способах предсказания будущего: Наука и техника: Lenta.ru

В первой половине декабря компания "Яндекс" заявила, что ее сервис "Яндекс.Пробки" сможет предсказывать развитие дорожной ситуации на несколько часов вперед. Ранее, в сентябре 2012 года, стало известно, что сервис сможет предугадывать пробки на час вперед. Как именно это работает? Какие математические модели используются для анализа и прогнозирования пробок? Об этом и многом другом "Лента.ру" поговорила с доцентом кафедры информатики МФТИ и разработчиком сервиса Михаилом Хохловым.

Примечательно, что в назначенный Михаилом Хохловым день Москва встала в 10-балльных пробках, в одну из которых угодил и корреспондент "Ленты.ру", спешивший на интервью.

"Лента.ру": Итак, Михаил, как работают "Яндекс.Пробки"?

Михаил Хохлов: Ну тут, наверное, надо начать с того, как мы собираем данные о пробках. Эту информацию мы получаем от пользователей: люди, у которых на телефоне включены "Яндекс.Карты" или "Яндекс.Навигатор", с определенной периодичностью посылают нам информацию о своем местоположении. Эти данные, называемые треки, обезличиваются и анализируются. Из них мы узнаем, в каких местах и с какой скоростью сейчас едут машины.

А как вы узнаете, что источником трека был именно человек на машине, а не пешеход?

Такая проблема есть, действительно, к нам в систему могут попадать некоторые "мусорные" треки от пешеходов, у которых включены "Яндекс.Карты". Поэтому мы фильтруем треки перед анализом. Если в течение своей истории трек ни разу не разгонялся более 5 километров в час, то скорее всего это пешеход. Там есть и другие эвристические принципы. Кроме того, статистика говорит , что пешеходов в процентном соотношении не очень много. Обычно пешеходы включают "Яндекс.Карты", что-то посмотрят и выключают.

Регрессионный (линейный) анализ - статистический метод исследования влияния набора независимых переменных, именуемых регрессорами (или предикторами) на зависимые, именуемые критериальными.

После того как треки обработаны и прошли фильтрацию, из многих треков, проехавших по одному участку дороги, мы должны получить одно число - среднюю скорость. Для этого используется разнообразное усреднение.

То есть вы, используя данные от пользователей, строите такую карту и раскрашиваете ее по скоростям - чем ниже скорость, тем краснее цвет?

Не сразу, на самом деле. Мелкие пробки объединяются в крупные, мы вычисляем, какой продолжительности эта пробка.Если просто раскрасить каждый участок разным цветом в зависимости от скорости, то получится рябая мозаика, из которой очень сложно понять, где и как едут. Поэтому перед тем, как показать картинку пользователю, мы ее обрабатываем. В частности, при помощи фильтрации убираем мелкие помехи.

Я так понимаю, что избавиться от мозаики - это то же самое, что взять ступенчатую функцию и сделать ее гладкой?

Она все равно остается ступенчатой, потому что у нас всего три цвета. Конечно, если мы не хотим перейти к непрерывной палитре цветов, что было бы довольно неожиданным ходом. Цвета всего три, и функция все равно остается ступенчатой. Но мы стараемся некоторым образом фильтровать и укрупнять участки одного цвета. Если, допустим, все кругом красное и у нас тут маленький кусочек зеленого, то мы, скорее всего, не будем показывать этот зеленый кусочек, а закрасим его красным. Потому что ясно, что внутри пробки всегда есть небольшие участки по 50 метров, которые можно быстро проскочить. Это уже получается пространственное усреднение.

Таким образом вы получили картину. Это картина на данный конкретный момент. Как часто она обновляется? Сколько времени уходит на подсчет всей картины? Каков шаг по времени?

Вообще шаг по времени - одна минута. Конкретная картина, которую видит пользователь, когда заходит на "Карты", может отставать больше, чем на одну минуту. Это зависит от многих факторов. Естественно, мы всегда стараемся выдать пользователю самый свежий срез из тех, которые есть. Но иногда он может отставать на минут пять, это зависит от загруженности серверов и многих других факторов.

Учитывая, что вы используете данные, полученные только от пользователей, может ли так случиться, что покрытие выйдет неравномерным? То есть в одном месте много пользователей, а в другом мало - и информация уже не такая подробная?

Да, я даже могу сказать, где пользователей очень много - в Москве. В других городах их гораздо меньше.

Я имею в виду, что даже в Москве они могут быть распределены по карте неравномерно. Или такого не происходит на практике?

Их так много, что даже если их мало, то этого все равно достаточно. У нас, в принципе, есть еще так называемые партнеры. Это некоторые транспортные компании, фактически те же самые пользователи, просто мы с ними договорились, что они обязательно будут пользоваться "Яндекс.Картами", они тоже посылают нам информацию.

Михаил Хохлов

Lenta.ru

Отлично. Итак, у вас получилась картинка, она обновляется раз в минуту. Соответственно, речь заходит о прогнозе. Каким образом вы прогнозируете будущее?

Для этого мы используем методы машинного обучения, мы пытаемся построить некоторую модель, которая бы вычисляла, как зависит будущая скорость на дороге от текущей.

То есть вы строите нейросеть?

Нет, нейросеть мы не используем. Мы используем более простую линейную модель. Это линейная авторегрессионная модель: следующее значение временного ряда есть линейная комбинация от фиксированного количества предыдущих. То есть она векторная, в зависимость включаются и соседние сегменты тоже.

И как далеко у вас получается прогнозировать?

Сейчас горизонт прогноза составляет один час. На самом деле даже немножко больше, чем час - там 75 минут. Чтобы всегда гарантировано покрыть час, приходится закладывать на немножко больший промежуток времени. Что касается качества, то тут вопрос в том, что мы меряем. Мы можем сравнить то, что мы напрогнозировали, с уже известным результатом.

Во-первых, мы смотрим на времена проезда, а не на скорости, поскольку наша цель - как можно более точно предсказывать время движения по маршруту - скорости нам известны. Мы сравниваем время проезда по маршруту, сперва исходя из нашего прогноза на час вперед, а потом, грубо говоря, ждем этот час - на самом же деле мы берем уже известные данные прошлого дня, смотрим, сколько на самом деле занял бы такой маршрут.

То есть у вас есть некий набор маршрутов, вы не считаете для всей карты?

Мы разбиваем всю карту на куски.

То есть вы берете карту и разбиваете ее на набор маршрутов?

Да.

Они пересекаются или нет?

Они могут пересекаться, могут не пересекаться. Главное, что карта полностью покрыта.

И это разбиение постоянно или оно меняется?

Может меняться.

Это вопрос к тому, свободный это параметр в модели или нет? Может быть, у вас какой-то стохастический подход, вы случайно разбиваете карту на набор маршрутов и считаете для них. Так как у вас случайное разбиение, то оно каждый раз разное. Либо же вы руками разбили и считаете время для каждого маршрута изо дня в день.

У нас есть фиксированное разбиение, на котором считается модель. При оценке качества этой модели, однако, мы можем использовать то же разбиение, а можем другое. Естественно, мы проверяем и так, и так. Есть же некоторые разбиения, которые подсчитаны и используются именно на этапе подбора коэффициентов модели.

А дальше?

Допустим, мы нашли, насколько наш прогноз отличается относительно реальности. Эти величины еще рано с чем-то сравнивать, потому что это величины на разных дорогах совершенно разных порядков. Есть дороги, на которых пробки постоянно, и там сложно что-то предсказать. Есть дороги, где всегда относительно свободно, и там предсказать гораздо проще. И абсолютная величина ошибки на них гораздо меньше, но не потому, что наш прогноз там хорошо работает, а просто потому, что там и так все понятно.

Поэтому мы смотрим не просто на абсолютную величину ошибки, а на то, насколько эта ошибка меньше, чем ошибка некоего базового уровня. За базовый уровень мы берем прогноз константой - то есть мы считаем, что через час будет то же самое, что и сейчас. И мы считаем, насколько наш прогноз точнее, чем тривиальный прогноз, что через час будет то же самое. По этим результатам наш прогноз где-то на 15 процентов точнее базового.

Детали подобного рода (например, выбор метрики) - это все какие-то эмпирические вещи, которые вы выяснили методом проб и ошибок, или за этим стоит некая теория? Может, вы использовали чьи-то работы, например?

У нас было большое исследование (правда для внутреннего пользования, результаты не публиковались), посвященное оценке качества. Все, что я вам рассказываю, все эти проблемы когда-то перед нами реально возникли и мы обсуждали разные варианты того, как можно их обойти.

Собственно говоря, вопрос оценки качества - это вопрос того, что мы хотим получить. Здесь нет какого-то одного правильного ответа. Ответим так - получим один прогноз, ответим по-другому - получим другой прогноз. Поэтому это такое исследование, которое шло постоянно и параллельно с разработкой самого прогноза. Мы постоянно уточняли модель и уточняли оценку качества. Тут, например, она плохо работает. Почему наша оценка качества это не ловит? Давайте опять собираться и решать, как менять оценку качества, и так далее. Постоянно возникали вопросы, как взвешивать большие и малые ошибки. Хотим ли мы построить прогноз, который в первую очередь минимизирует большие ошибки, или прогноз, который допускает на некоторых участках очень большую ошибку, но зато на остальных участках очень хорошо работает?

Насчет прогнозирования на больший период, тут такая вещь: у нас уже достаточно давно есть обычный сервис пробок, который строит так называемый "недельный профиль", то есть как в течение недели обычно меняются пробки.

Как он устроен?

Он устроен очень просто. Мы собираем статистику и данные о том, какие скорости на каких участках, все эти данные сохраняются. И потом мы можем за какой-то период, за месяц или за два усреднить. Берем один день недели и все скорости в этот день на данном участке за промежуток времени, фильтруем их и усредняем.

Прямо средним арифметическим?

Нет, не средним арифметическим, но как-то усредняем. И говорим, что обычно в этот день недели в такое время бывает такая ситуация. Это тоже один из методов прогноза.

С которым кстати можно тоже сравнивать предсказания.

Я к этому и веду. Если сравнить его с тем, что уже есть, то есть с постоянным прогнозом и с нашим, оказывается, что на горизонтах до часа константный способ лучше, чем среднее. А после часа среднее лучше. То есть ситуация на дороге все время меняется, и где-то в течение часа она остается больше похожей на то, что было. А уже через два часа она не будет иметь ничего общего с тем, что сейчас, и будет гораздо больше похожа на то, что обычно бывает в это время.

Обычно в это время. А если сравнить с этими двумя версиями регрессионную линейную модель, которую вы используете?

Наша модель прогнозирует лучше, чем константная. Через два часа ошибка, однако, ухудшается до уровня средних пробок. Дольше чем на два часа не имеет смысла прогнозировать ни нашей моделью, ни как-то по-другому, только пробки обычные могут вам подсказать, что будет через два часа и позже. Поэтому прогнозирование на более далекий срок - это просто улучшение обычного сервиса пробок. Можно как-то учитывать погоду в них, еще какие-то другие факторы. Например, известно, что наступят долгие праздники.

Сейчас модель не учитывает такие вещи?

Да, пока модель их не учитывает.

Меня очень интересовал вопрос, учитывает ли она режим работы светофоров. Потому что этот режим меняется и оказывает очень большое влияние на динамику движения (pdf). Например, часто же бывает, что меняют время переключения светофоров. Например, на кольце включают зеленый свет, и становится легче ездить. С точки зрения модели, это такие же непредвиденные вещи (или не непредвиденные), правильно?

Совершенно верно. Было бы хорошо это учитывать, если бы мы могли хоть откуда-то эту информацию получить.

Правильно я понимаю, что вы ни с кем не сотрудничаете по поводу этой информации? Ни с правительством Москвы, ни с кем-то еще?

Нет.

А вы сотрудничаете с какими-то научными институтами, университетами, которые занимаются исследованием таких вещей?

Мы сотрудничали с несколькими научными коллективами, которые занимаются научной тематикой. Они по нашему заказу пробовали применять несколько другие подходы - в частности потоковое моделирование.

Расскажите, пожалуйста, подробнее.

Да, есть такое направление в науке - моделирование транспортных потоков. Оно пытается описывать движение автомобилей в городе как движение некоторой особенной жидкости. Там используется уравнение, похожее на уравнение гидродинамики, но там есть и существенное отличие, которое приводит к тому, что решение этих уравнений совершенно не похоже на гидродинамические.

Эти модели сейчас очень активно развиваются. В частности, они используются в целях планирования градостроительства. С их помощью можно предсказать, как изменится нагрузка на разные дороги, если где-то построить новую дорогу или мост, и увидеть проблемные участки, где движение перегружено. Это такое долговременное масштабное планирование.

У многих возникает идея: а нельзя ли использовать такие модели для краткосрочного планирования? По нашему заказу научные группы пробовали это делать, но результаты пока отрицательные. Этим занимается один коллектив на физтехе, там Александр Гасников и другие. Еще есть один коллектив под руководством Юрия Чеховича, компания "Форексис", они больше занимаются методом машинного обучения, но и потоковым моделированием тоже. Это из тех, с кем мы сотрудничали. Я могу назвать и других.

А отрицательный результат по какой причине? Не хватает вычислительных мощностей?

Нет, там более серьезные причины. Во-первых, в наших данных нет информации о потоке, только о скорости. Мы не можем восстановить, сколько машин едет по дороге, можем только сказать, с какой скоростью они движутся, а для потоковых моделей (как следует и из названия) это принципиальная вещь. К сожалению, по скорости однозначно установить поток нельзя.

Во-вторых, во многих местах качество данных хромает. Ту же самую линейную регрессию мы во многом выбрали из-за ее устойчивости, она очень устойчива к шуму. Потоковые же модели относятся к шуму гораздо хуже.

И кроме того, есть некая проблема задания начальных условий. Если вы восстанавливаете картину в среднем за месяц, то это одно дело: скорее всего для этого вы используете какой-то итерационный алгоритм, который сходится к равновесию. А другое дело, если вам надо точно задать начальные условия и сказать, что будет через час. Это задача гораздо более сложная, и не до конца понятно, как ее решать.

Творчество интернет-пользователей, посвященное пробкам

Lenta.ru

В общем пока результат отрицательный, но сотрудничество мы не бросаем.

Еще какие-нибудь модели?

Есть подход так называемой имитационной модели, когда каждый водитель имитируется в отдельности. Создается простой алгоритм, который обычно заключается в том, что у каждого водителя есть какая-то комфортная скорость, и если у него есть такая возможность, то он едет с этой скоростью. Если ему кто-то мешает, то он тормозит, чтобы соблюдать безопасную дистанцию. Плюс время от времени перестраивается, если ему надо куда-то поворачивать. Берется тысяча таких простых алгоритмов и запускается симуляция на известной конфигурации дороги. Это тоже достаточно распространенная вещь, которая часто используется при проектировании развязок.

Мы ее тоже пробовали. Соответственно, тут еще больше проблем. Откуда брать всех этих водителей, кто куда едет - тоже абсолютно неизвестно. Это очень любопытно, но пока совершенно неприменимо. Мы общались с организациями, которые занимаются этими моделями, они посмотрели на наши данные, тоже сказали, что данные им не подходят.

Какие-нибудь еще интересные модели?

Это все были модели, которые я условно называю "физические модели". В них пытаются моделировать, что же там на самом деле происходит. Есть еще другой подход - это собственно подход машинного обучения. То есть нам не интересно, что там происходит, мы просто смотрим на числа и пытаемся понять, какие числа появятся дальше после вот этих вот чисел.

Тут набор методов тоже достаточно широкий. В том числе и упоминавшиеся нейронные сети, то есть по сути нелинейные параметрические модели. Есть линейные параметрические модели. Есть просто непараметрические модели, которые не предполагают никакой конкретной зависимости. Например, есть метод "k ближайших соседей", мы его сами пробовали.

Расскажите, пожалуйста, подробнее об этом методе.

Метод KNN (k-Nearest Neighbors) заключается в том, что у нас есть большая история. Мы знаем, что раньше было на этом участке дороги. Мы можем взять нынешнюю ситуацию, тоже с небольшой историей, и найти какое-то количество похожих ситуаций в прошлом. Посмотреть, что было после них. Усреднить, как всегда. И сказать, что раз раньше после этого было то-то, то и сейчас будет то же самое.

С точки зрения здравого смысла, это вообще очень адекватно.

Это очень логично, и это действительно работает. Мы такую модель реализовали, и она работает. Более того, она дает качество, вполне сравнимое с качеством, которое дает линейная модель, лучшие варианты того и другого методов работают одинаково, практически с точностью до процента. Линейную модель мы выбрали по соображениям вычислительной простоты. Понимаете, для нее главная сложность - найти некие численные коэффициенты. Когда коэффициенты есть, то вычислить прогноз - задача тривиальная, для этого надо умножить одну матрицу на другую. Для kNN каждый, раз, когда мы хотим построить прогноз, нам надо полностью просмотреть всю историю, найти ближайшие значения, усреднить их. Вычислительно это очень сложная задача. А у нас история наблюдений, которую мы храним, это десятки терабайт.

А сколько по времени вы храните историю?

С момента начала проекта в 2006 году.

То есть в принципе ваши данные можно использовать, чтобы увидеть, как ухудшилась ситуация с московскими дорогами за эти годы?

Если вы найдете метрику, которая показывает "степень хорошести" ситуации, то да. Такую метрику сложно придумать. Те же самые баллы - их коэффициенты постоянно подбираются, чтобы отражать дорожную ситуацию.

Расскажите хотя бы в общих чертах, как считаются баллы?

Для каждого города мы выбираем набор маршрутов, который, по нашему мнению, наилучшим образом отражает дорожную ситуацию в городе. И считаем, сколько времени занимает объехать все эти маршруты. Вся шкала времени разбита на 11 частей, пронумерована от 0 до 10, и этот балл мы показываем.

Умный город IBM

Lenta.ru

А что-нибудь аналогичное есть у ваших друзей-конкурентов, что известно про них?

Про конкурентов известно очень мало. Многое известно про комплексные системы управления городом, типа "Умный город", который разрабатывает IBM. Они в том числе строят прогнозы, потому что, естественно, чтобы правильно управлять системой, надо смотреть на шаг вперед, иначе ничего не получится. Они принципиально отличаются от нас. Во-первых, это системы управления, а не чисто информационные, как у нас. Это и сложнее, и проще. Проще - потому что часто пробку проще предотвратить, чем предсказать, как она будет потом изменяться.

Сложнее же потому, что они все требуют подстройки под конкретный город, они не универсальны. И они все требуют установки дополнительного оборудования: датчиков движения на дорогах, которые подсчитывают количество проехавших автомобилей и их скорость. Наша система отличается от них тем, что она основана только на пользовательских данных и она универсальна - везде, где у нас есть данные, там есть прогноз. Про прямых конкурентов я ничего определенного сказать не могу. То, что видят пользователи, то видим и мы.

IBM много рассказывала про свое исследование, и в частности их статьи кое в чем нам помогли. Про векторную линейную авторегрессию они рассказывают именно то, что у нас тоже работает. А вот в Австралии разрабатывают аналогичную систему, основанную на нейросетях. Хотя, конечно, это отчасти слухи.

Ну и обязательный вопрос про планы на будущее. Как вы планируете усовершенствовать модель?

Можно значительно улучшить качество прогноза, если учитывать какие-то внешние факторы. Первое, что приходит в голову - это погода. Мы исследуем возможность включить в качестве фактора погоду - просто коэффициенты в модели будут другими в случае, если идет снег. Ну или интенсивность осадков как еще одна переменная. Это все темы для дальнейшего исследования. Этот вопрос пока исследуется. Пока мы реализовали то, что есть. Очередной этап будет больше исследовательским.

Зависимость от времени суток у нас, между прочим, в модели уже есть. Время суток в качестве внешней переменной - это достаточно очевидная вещь.

А какие еще временные переменные есть?

Пока только время суток. Возможно, если бы у нас была достоверная информация об авариях или если бы мы могли как-то извлекать ее из тех данных, которые у нас есть, то это тоже могло бы улучшить прогноз. Потому что если мы знаем, что где-то авария, это поможет нам прогнозировать, сколько времени будет продолжаться пробка и что произойдет после того, как она рассосется.

Сейчас данные об авариях у нас есть только от пользователей - это то, что показывается в "Яндекс.Пробки". Мы рассматриваем варианты их включения в расчеты, но качество сейчас у них крайне низкое. Это пока работает так: вот едет пользователь. Если он увидел ДТП, то может поставить точку.

Дальше работает система голосования. Например, я ставлю точку, а вы едете и тоже видите, что там ДТП, - вы можете подтвердить точку, можете ее опровергнуть.

В этих точках тоже есть проблема. У нас есть информация, когда точка появилась, но когда она исчезла, у нас информации нет. Точнее, если никто не подтвердит точку, то она будет держаться 20 минут, если я не ошибаюсь, а потом исчезнет, пока кто-то снова не поставит эту точку.

Единственное, что пока можно сказать, это то, что если на этом участке часто происходят ДТП и они есть в обучающей выборке, на которой мы обучали модель, то, скорее всего, в модели будет это учтено. То есть коэффициенты модели будут отражать то, как обычно развивается пробка.

Большое вам спасибо, было очень интересно.

lenta.ru

Пробки на дорогах - основные причины их возникновения

Здравствуйте, уважаемые читатели! Эта статья напрямую не касается темы блога, но затрагивает каждого из нас в определённой степени! То, о чём пойдёт речь, является самой настоящей проблемой, которая с каждым годом становится всё серьёзнее и серьёзнее.

Расскажу вам немного о себе. Я являюсь заядлым автолюбителем и накатываю каждый день по несколько десятков километров по городу. Живу я, если вы не знаете, в городе Пензе с населением чуть более полумиллиона человек.

Город у нас небольшой: протяжённость с одного конца до другого составляет 15-17 км. Как вы думаете, за какое время можно проехать это расстояние? Ночью – минут за двадцать. А вот днём на это уйдёт час-полтора… Во всём виноваты пробки на дорогах. О них и поговорим.

Кстати, у нас в городе ситуация на дорогах ещё более-менее терпимая. В крупных городах дела обстоят намного хуже. Достаточно приехать в любой город-миллионник (Самара, Воронеж, Волгоград, Екатеринбург) и сразу становится видна разница — там в пробках люди теряют по 2-3 часа в день (а иногда и больше). Москва — это вообще отдельный разговор.

Если вы живёте в одном из крупных городов, то наверняка понимаете, о чём я говорю.

Количество автомобилей растёт ужасающими темпами. В этом нет ничего удивительного — вы только посмотрите на обилие предложений от автосалонов. Новые бюджетные автомобили, различные кредитные программы, скидки, агрессивная реклама – всё это побуждает среднестатистического человека купить себе авто.

Это хорошо, что автомобиль перестал быть роскошью, а стал средством передвижения. Если у вас есть свой «железный конь», то вы понимаете, что такое удобство и комфорт собственного автомобиля. Вот только передвижение на нём по городу в час пик превращается в нелёгкое испытание нервов, трату драгоценного времени и бензина.

Откуда берутся пробки на дорогах? Только ли из-за обилия машин? Тогда почему в некоторые дни пробок больше, а в некоторые меньше? Ведь количество машин должно быть одинаковым…

Эти вопросы не давали мне покоя…

Моя попытка проанализировать причины городских пробок привела к появлению этой самой статьи. Я выделил 4 основные причины и представляю их на ваш суд.

Причины пробок на улицах российских городов

Сразу скажу, что моё мнение чисто субъективное. Поэтому, если у вас есть какие-то свои идеи, то призываю вас высказывать их в комментариях к статье.

Автомобили, припаркованные на обочине дороги

Считаю, что пробки на дорогах в большинстве случаев образуются именно из-за таких машин. Они занимают половину полосы, а порой и целую полосу! Соответственно, снижается пропускная способность дороги.

Зачем водители паркуются на обочинах? Тут есть несколько вариантов ответа:

  • Подъезжают «на 5 минут», а сами оставляют машину на полчаса.
  • Паркуются на целый день, потому что работают рядом, а стоянок, где можно оставить машину, НЕТ.
  • Приезжают по делам к какому-либо зданию и оставляют машину на обочине, потому что, опять же, некуда больше поставить.

То есть причина того, что водители паркуются на обочинах дорог, сводится к отсутствию нормальных стоянок в центре города!

Уважаемые власти! Прежде чем штрафовать водителей за неправильную парковку, подумайте о строительстве многоуровневых паркингов в городе, которые значительно уменьшат число машин, мешающих нормальному движению! Это не затратнее, чем расширять уже существующие дороги. Сделайте парковки – потом штрафуйте сколько угодно.

В Пензе работа над этим уже ведётся. В центре города построили и открыли многоэтажный паркинг с достаточно приемлемыми ценами.

Некорректно настроенный режим работы светофоров на перекрёстках

Светофоры абсолютно не учитывают дорожную ситуацию в разное время суток. Утром основной поток машин идёт в одном направлении, а вечером – в другом. Элементарный анализ дорожной ситуации на каждом перекрёстке позволил бы отрегулировать работу светофоров таким образом, чтобы создавать наименьшее скопление машин.

Не спорю, на некоторых участках так и происходит. Но, к сожалению, не везде.

Перестроения автомобилей из полосы в полосу

Представьте ситуацию: имеется две полосы в одном направлении. По одной поток движется быстрее, чем по другой. Естественно, что водители, в надежде побыстрее проехать неблагополучный участок, хотят двигаться по более «быстрой» полосе. В итоге получается, что «быстрая» полоса становится «медленной». Это приводит к постоянным перестроениям машин из полосы в полосу, что приводит к общему торможению всего потока.

Другими словами, попытки водителей проехать быстрее путём подрезаний и перестроений приводят к увеличению пробки на дорогах.

Как решить эту проблему? Тут всё зависит от самих водителей…

ДТП на дорогах

Аварии случаются, как это ни печально… И они являются причинами серьёзных пробок. Учитывая невысокую скорость движения по центру города в час пик, эти аварии в основном мелкие. Но вы знаете, что при любом происшествии (даже небольшом) участники, если не договорятся между собой, вправе вызвать сотрудников ДПС для оформления ДТП. Сотрудники приезжают через час (в лучшем случае). Всё это время пострадавшие автомобили занимают проезжую часть и создают серьёзное препятствие для других транспортных средств.

Решение этой проблемы кроется в упрощении способа оформления мелких ДТП. Такой вариант возможен. Но мало кто из водителей его использует. Сказываются:

  • плохая информированность о данном способе оформления ДТП,
  • боязнь неправильно заполнить необходимые бумаги, что повлечёт за собой проблемы со страховой компанией.

Я рассказал об основных причинах, которые, по моему мнению, приводят к появлению пробок на городских улицах. И любая из этих причин, в принципе, решаемая. Вот только решать её нужно не только властям — многое зависит от культуры самих водителей.

Небольшое послесловие. В Казани решили бороться с пробками интересным методом — просто взяли и запретили большинство левых поворотов в городе. И знаете — это в какой-то степени подействовало. Пробки хоть и остались, но всё же не в таких масштабах, как в других городах-миллионниках.

А что вы думаете по данной теме, уважаемые читатели? Как вы считаете, что именно приводит к увеличению числа пробок?

С удовольствием послушаю мнение каждого. Самые интересные комментарии к статье не останутся без внимания!)

Удачи на дорогах! С уважением, Сергей Чесноков

on-www.ru

Исследования Яндекса — Автомобильные пробки в Екатеринбурге

Апрель 2015

Мы исследовали загруженность улиц Екатеринбурга за год с апреля 2014 по март 2015, определили, где и когда возникают дорожные затруднения, а также построили карту автомобильной доступности районов города. Все данные получены от сервиса Яндекс.Пробки.

Пробки в течение года

За изученный год количество пробок в Екатеринбурге заметно уменьшилось. В марте 2015 средняя загруженность дорог была такой же, как в июле, когда многие автомобилисты уезжают из города и на улицах обычно свободнее, чем в другие месяцы.

Худшим днём для автомобилистов стал понедельник 20 октября, когда после сильного снегопада город встал в многокилометровых заторах, а уровень загруженности вечером достиг максимальных десяти баллов. За год было ещё три дня, когда светофор Яндекс.Пробок показывал десять баллов: 11 июня, 5 и 29 декабря — почти во всех случаях также из-за осадков.

Самые длинные пробки Екатеринбурга обычно образуются на улицах Восточной, Фурманова, Малышева, Щорса и Амундсена.

Пробки в течение дня

На протяжении большей части года в Екатеринбурге заметны часы пик: утром с 7:30 до 9:30 и вечером примерно с 17:00 до 19:30, причём вечером загруженность обычно выше, чем утром. Летом утренний час пик менее выражен, а вечерний сохраняется на том же уровне.

ЗАГРУЖЕННОСТЬ ДОРОГ ЕКАТЕРИНБУРГА В ТЕЧЕНИЕ РАБОЧЕГО ДНЯ

Пробки в течение недели

Загруженность дорог Екатеринбурга в разные дни рабочей недели отличается незначительно. В январе-марте 2015 чуть меньше пробок было по средам, чуть больше — по пятницам. В субботу загруженность обычно сокращается по сравнению с рабочими днями в два, а в воскресенье — в два с половиной раза.

ЗАГРУЖЕННОСТЬ ДОРОГ ЕКАТЕРИНБУРГА В ТЕЧЕНИЕ НЕДЕЛИ

Транспортная доступность разных районов города

Мы изучили, из каких районов Екатеринбурга быстрее добираться до центра и обратно. Для этого мы рассчитали, сколько времени с учётом пробок займёт поездка из случайно выбранной точки города в одну из точек в центре, в которые строили маршруты пользователи Яндекс.Навигатора. Аналогичные расчёты мы произвели и для поездок из центра. Всего было измерено время примерно для миллиона таких маршрутов. Затем карту Екатеринбурга разделили на квадраты со стороной 100 метров и закрасили их в зависимости от среднего времени проезда из точек этого квадрата в центр или обратно.

КАРТА ТРАНСПОРТНОЙ ДОСТУПНОСТИ РАЙОНОВ ЕКАТЕРИНБУРГА

Мы посчитали индекс транспортной доступности для большинства микрорайонов Екатеринбурга — он показывает, во сколько раз из того или иного микрорайона ехать в центр дольше, чем из Вокзального.

Индекс транспортной доступности районов Екатеринбурга

Район

Индекс транспортной доступности

Вокзальный

1

Пионерский

1,2

Втузгородок

1,2

Ботанический

1,5

Юго-Западный

1,6

ЖБИ

1,7

Заречный

1,9

Эльмаш

2

Вторчермет

2,1

Новая Сортировка

2,1

Уралмаш

2,2

Химмаш

2,4

Старая Сортировка

2,4

Академический

2,9

По данным Яндекс.Пробок, февраль–март 2015

yandex.ru

Исследования Яндекса — Автомобильные пробки в Санкт-Петербурге

Апрель 2015

Мы исследовали загруженность улиц Санкт-Петербурга за год с апреля 2014 по март 2015, определили, где и когда возникают дорожные затруднения, а также построили карту автомобильной доступности районов города. Все данные получены от сервиса Яндекс.Пробки.

Пробки в течение года

В изученном году самым сложным месяцем для петербуржских автомобилистов был декабрь 2014 — главным образом из-за снегопадов и предпраздничной суеты на дорогах. А меньше всего пробок было в июле, когда многие автомобилисты уезжали из города.

За рассматриваемый период светофор Яндекс.Пробок в Петербурге пять раз показывал максимальные десять баллов — 27 и 28 мая, 30 июня, 25 августа и 13 января, — и во всех случаях причиной заторов были осадки или дорожные работы. А самая высокая загруженность в среднем за день была зафиксирована 25 декабря, когда из-за снега и большого количества аварий уровень пробок почти 11 часов подряд не опускался ниже восьми баллов.

В 2015 году самая длинная пробка образовалась вечером 5 февраля: она растянулась больше чем на 15 километров по Московскому шоссе.

Три самые длинные пробки с начала 2015 года

Длина, км

Время

Место

1

15,5

5 февраля 20:40

Московское шоссе от ТК «Лента» до Ям-Ижоры

2

14,8

13 января 8:45

Колтушское шоссе, проспект Косыгина, Заневский проспект, мост Александра Невского — от деревни Колтуши до площади Александра Невского

3

14,1

26 февраля

Внешняя сторона КАД от проспекта Энгельса до ЗСД

По данным Яндекс.Пробок, январь–март 2015

Пробки в течение дня

В будни в Санкт-Петербурге заметны часы пик: утром с 8:00 до 10:00 и вечером примерно с 17:30 до 19:30, причём вечером загруженность обычно заметно выше, чем утром. Летом утренний час пик почти пропадает, но вечерний остаётся на том же уровне.

ЗАГРУЖЕННОСТЬ ДОРОГ САНКТ-ПЕТЕРБУРГА В ТЕЧЕНИЕ РАБОЧЕГО ДНЯ

Пробки в течение недели

Загруженность петербуржских дорог в будни отличается незначительно. В январе-марте 2015 самым свободным днём рабочей недели чаще всего был понедельник, а самым загруженным — пятница. В субботу средний балл пробок снижается в два, а воскресенье — почти в четыре раза по сравнению с буднями.

ЗАГРУЖЕННОСТЬ ДОРОГ САНКТ-ПЕТЕРБУРГА В ТЕЧЕНИЕ НЕДЕЛИ

Транспортная доступность разных районов города

Мы посчитали индекс транспортной доступности для большинства районов Санкт-Петербурга — он показывает, во сколько раз из того или иного района ехать в центр дольше, чем из Центрального. При построении рейтинга приоритет отдавался тем местам, куда чаще всего строили маршруты пользователи Яндекс.Навигатора. Таким образом мы учли разную плотность жилой застройки внутри района.

КАРТА ТРАНСПОРТНОЙ ДОСТУПНОСТИ РАЙОНОВ САНКТ-ПЕТЕРБУРГА

Как видно на карте, жители северных районов Петербурга добираются на работу и обратно дольше, чем те, кто живёт на юге.

Мы сравнили большинство районов города по времени проезда утром в центр и посчитали индекс транспортной доступности — он показывает, во сколько раз из того или иного района ехать дольше, чем из Центрального. При построении рейтинга приоритет отдавался тем местам, куда чаще всего строили маршруты пользователи Яндекс.Навигатора. Таким образом мы учли разную плотность жилой застройки внутри района.

Индекс транспортной доступности районов Санкт-Петербурга

Район

Индекс транспортной доступности

Центральный

1

Адмиралтейский

1,2

Петроградский

1,8

Василеостровский

2,1

Красногвардейский

2,5

Невский

2,6

Фрунзенский

2,7

Московский

2,8

Кировский

2,9

Калининский

3,3

Приморский

3,6

Выборгский

4

По данным Яндекс.Пробок, февраль–март 2015

yandex.ru

Исследования Яндекса — Автомобильные пробки в Краснодаре

Апрель 2015

Мы исследовали загруженность улиц Краснодара за год с апреля 2014 по март 2015, определили, где и когда возникают дорожные затруднения, а также построили карту автомобильной доступности районов города. Все данные получены от сервиса Яндекс.Пробки.

Пробки в течение года

Меньше всего пробок в Краснодаре было в июле и августе, когда многие автомобилисты уезжали из города, а больше всего — в декабре, из-за снега и предпраздничной активности на дорогах. За исследованный период уровень загруженности дорог одиннадцать раз достигал максимальных десяти баллов, из них пять раз — в декабре. В большинстве случаев сильные затруднения были вызваны либо осадками, либо большим количеством аварий.

Самые длинные пробки Краснодара обычно образуются на улицах Красная и Северная.

Пробки в течение дня

В течение рабочего дня загруженность дорог выше всего утром, примерно с 7:30 до 10:00, когда краснодарцы едут на работу, и вечером, с 16:30 до 19:30, когда они возвращаются домой. Такая картина сохраняется вне зависимости от времени года.

ЗАГРУЖЕННОСТЬ ДОРОГ КРАСНОДАРА В ТЕЧЕНИЕ РАБОЧЕГО ДНЯ

Пробки в течение недели

В январе-марте 2015 в будни меньше всего пробок было по средам и четвергам, а больше всего — по вторникам и пятницам. В выходные загруженность дорог обычно сокращается по сравнению с рабочими днями в два-три раза.

ЗАГРУЖЕННОСТЬ ДОРОГ КРАСНОДАРА В ТЕЧЕНИЕ НЕДЕЛИ

Транспортная доступность разных районов города

Мы изучили, из каких районов Краснодара быстрее добираться до центра и обратно. Для этого мы рассчитали, сколько времени с учётом пробок займёт поездка из случайно выбранной точки города в одну из точек в центре, в которые строили маршруты пользователи Яндекс.Навигатора. Аналогичные расчёты мы произвели и для поездок из центра. Всего было измерено время примерно для миллиона таких маршрутов. Затем карту Краснодара разделили на квадраты со стороной 100 метров и закрасили их в зависимости от среднего времени проезда из точек этого квадрата в центр или обратно.

КАРТА ТРАНСПОРТНОЙ ДОСТУПНОСТИ РАЙОНОВ КРАСНОДАРА

Мы составили рейтинг микрорайонов города в зависимости от среднего времени проезда утром в центр и посчитали индекс транспортной доступности — он показывает, во сколько раз из того или иного микрорайона ехать дольше, чем из Центрального. При построении рейтинга приоритет отдавался тем местам, куда чаще всего строили маршруты пользователи Яндекс.Навигатора. Таким образом мы учли разную плотность жилой застройки внутри микрорайонов.

Рейтинг микрорайонов Краснодара по транспортной доступности

Микрорайон

Индекс транспортной доступности

Центральный

1

Кожзавод

1,9

Фестивальный

2,1

Отделение № 1 совхоза Солнечный

2,2

Школьный

2,4

Черёмушки

2,5

Сельскохозяйственный институт

2,8

Табачная фабрика

2,8

Хлопчатобумажный комбинат

2,9

Авиагородок

3

Славянский

3,1

Юбилейный

3,2

9-й километр

3,2

Теплоэлектростанция

3,4

Камвольно-суконный комбинат

3,4

Завод измерительных приборов

3,6

Краевая клиническая больница

4,4

Центр микрохирургии глаза

4,5

Комсомольский

4,7

Московский

4,7

Пашковский

4,8

Имени Н.И. Вавилова

5

2-я площадка

5

Гидростроителей

5,2

Завод радиоизмерительных приборов

5,4

Имени Маршала Жукова

5,5

Северный

6,3

Горхутор

6,4

Калинино

6,8

Посёлок Калинино

6,8

Новый

6,8

Ипподром

6,9

Немецкая деревня

7

По данным Яндекс.Пробок, февраль–апрель 2015

yandex.ru

посмотреть на карте в режиме реального времени

Дорожные пробки без преувеличения можно назвать «бичом современности». Особенно это актуально для Москвы и других мегаполисов. Хотя с ними повсеместно ведётся борьба, на сегодняшний день результат оставляет желать лучшего. Чтобы не терять драгоценные часы, простаивая в заторах, целесообразно воспользоваться онлайн картой Яндекса. Пробки в Москве сейчас можно отследить на МКАДе, на Волоколамском и Рижском шоссе и других направлениях.

Сервис демонстрирует:

  • Наполненность дорожных направлений в баллах (на данный момент времени и среднюю) в различных цветах.
  • Скорость потока в км/ч.
  • Точки происшествий.
  • Дислокацию ремонтных мероприятий.
  • Видео с камер Москвы.

Памятка по просмотру

Показатель загруженности отрезка дороги демонстрируется с помощью разных цветов:

  • Путь свободен  
  • Низкая скорость движения относительно свободного участка 
  • Пробка 
  • Движения нет 

Скорость можно узнать, направив указатель на нужный отрезок трассы.

Обратите внимание! При отсутствии проверенных сведений дорожный участок не выделяется с помощью цвета.

Единицей измерения наличия заторов  является «балл». Баллы отражаются в соответствии с интенсивностью наполненности трассы.

Загруженность измеряют по 10-ти балльной линейке. Она выглядит примерно так:

Показатель Количество баллов
Дороги свободны 1
Почти свободны 2
Затруднения в определённых местах  3-4
Плотное движение  5
Двигаться затруднительно  6
Серьезные пробки  7
Заторы на многие километры  8
Город встал  9
Пешком выйдет быстрее  10

Прогноз перегруженности трассы даётся на 1 час. Он просматривается с помощью перетаскивания движка на шкалу Сейчас / Через час на требующийся показатель.

Обратите внимание! тумблер Сегодня / Статистика требуется поставить на показатель Сегодня.

События на интересующем направлении также просматриваются. Для этого существует функция Дорожные события. При нажатии такой кнопки появляются знаки, информирующие об обстановке:

Чтобы рассмотреть подробности, следует отметить галочку “Дорожные события”:

Статистика пробок определяется для различных дней недели и времени суток. С целью ознакомления с нею:

  • Переключатель устанавливается на показатель Статистика.
  • Нажимается интересующий день.
  • Движок переставляется на требуемую позицию.

С помощью сервиса Яндекс Пробки водитель имеет возможность определить, как много времени он потеряет из-за заторов. Например, когда средний балл равен 7-ми, это означает, что время пути увеличится где-то в 2 раза. Нужно учитывать, что для разных городов шкала имеет различную настройку. Так, 6 баллов в Санкт-Петербурге соответствует 5-ти балльной ситуации в Москве.

autolawyer.guru


Смотрите также

  • Мазерати бумеранг 1971
  • Функции компьютера бортового
  • Функция та в автомагнитоле
  • Фонарь функция
  • Как включить дворники
  • Как на яндекс картах включить компас
  • Как включить автомат машинку
  • Как включить ближний свет на ваз 2110
  • Как на уаз включить передний мост
  • Лучшие бескаркасные щетки стеклоочистителя 2017
  • Можно использовать бескаркасное кресло