В работе «Яндекс.Музыки» и «Яндекс.Еды» произошел сбой — РБК
adv.rbc.ru
adv.rbc.ru
adv.rbc.ru
Скрыть баннеры
Ваше местоположение ?
ДаВыбрать другое
Рубрики
Курс евро на 7 марта
EUR ЦБ: 80,24
(+0,19)
Инвестиции, 06 мар, 16:10
Курс доллара на 7 марта
USD ЦБ: 75,47
(+0,01)
Инвестиции, 06 мар, 16:10
С блогера Валерии Чекалиной взяли подписку о невыезде Общество, 13:26
Военная операция на Украине. Онлайн Политика, 13:24
Игрок «Локомотива» сменил российское спортивное гражданство на армянcкое Спорт, 13:23
adv.rbc.ru
adv.rbc.ru
Плюс 25% к текущему доходу: как хантят сильных специалистов в кризис Pro, 13:21
Военная операция на Украине. Главное Политика, 13:21
Когда не стоит брать кредит, и как правильно его погасить РБК и банк Ренессанс, 13:20
Ушедшего воевать бойца Минеева наградят за «веру и добродетель» Спорт, 13:16
Внутренние и внешние опоры лидера в новой реальности
15 марта 19:00
Записаться
Шойгу заявил о росте потерь ВСУ на 40% в феврале Политика, 13:03
Шойгу назвал роль Артемовска в дальнейшем наступлении Политика, 12:59
Импортозамещение в IT: что предлагают российские интеграторы РБК и Tegrus, 12:57
Кремль поспорил с Китаем о «невидимой руке» в конфликте на Украине Политика, 12:57
Лукашенко заявил о провале операции СБУ и ЦРУ по подрыву российского А-50 Политика, 12:46
adv. rbc.ru
adv.rbc.ru
adv.rbc.ru
У некоторых пользователей не открывается приложение «Яндекс.Музыка», а сервис «Яндекс.Еда» выдает предупреждение о возможном сбое. В компании уверяют, что уже работают над решением проблемы
Фото: Антон Белицкий / ТАСС
В работе «Яндекс.Музыки» произошел сбой: веб-версия сервиса не открывается, а при попытке запуска приложения появляется сообщение «Проблемы со связью», предложение проверить настройки и обновить его.
«У ряда пользователей возникают трудности с доступом к «Яндекс Музыке». Наша команда уже работает над решением проблемы», — сообщил РБК представитель компании.
У некоторых пользователей возникли проблемы в работе сервиса «Яндекс.Еда». При попытке воспользоваться сервисом появляется предупреждение «Возможны сбои в работе сервиса» или «Сейчас возможны трудности с заказами», а также сообщение о том, что компания прикладывает усилия, чтобы исправить проблему.
adv. rbc.ru
«У ряда пользователей возникают временные трудности с доступом к Яндекс.Еде», — заявили РБК в пресс-службе компании.
adv.rbc.ru
Предыдущий сбой в работе сервисов компании произошел в начале февраля, тогда у части пользователей не открывались «Кинопоиск», «Карты», «Яндекс.Музыка» и другие сервисы. В компании тогда сообщали, что проблема носит кратковременный характер.
В декабре прошлого года временно не работало приложение «Яндекс Go». Тогда при попытке вызвать такси через приложение у пользователей возникало уведомление, что повторно вызвать машину можно через минуту.
Авторы
Теги
О сетевой аварии в Яндексе / Хабр
6 февраля пользователи могли заметить частичную недоступность сервисов Яндекса. Проблема возникла из-за каскадного сбоя в работе сетевого оборудования.
Основной пик пришёлся на период с 17:03 до 17:50, когда общие потери трафика достигали 40%. Кроме того, в период с 17:03 до 17:13 наблюдалась практически полная потеря IPv6 трафика. Инцидент удалось устранить к 21:30.
Как это произошло и какие выводы мы из этого извлекли — ответим на эти вопросы и поделимся нашим опытом.
Ход инцидента
Граничные маршрутизаторы — это то место, где проходит граница между разными сетями связи. От их работы зависит связность между Яндексом и сетями, которые обеспечивают подключение конечных пользователей.
Мы столкнулись с четырьмя проблемами, три из которых связаны друг с другом, а четвёртая, похоже, просто произошла одновременно с ними:
- аппаратный сбой граничного маршрутизатора;
- последовавший за этим сбой подсистемы лукапа и аварийные перезагрузки линейных карт на трёх других георазнесённых граничных маршрутизаторах;
- сбой ПО на пяти маршрутизаторах внутри дата-центров Яндекса;
- нестабильность контрольного протокола BFD из-за флапа MAC-адресов внутри CLOS-фабрики на М9.
Проблема №1
Началом инцидента мы считаем аппаратный отказ на одном из граничных маршрутизаторов, который привёл к его полному отключению.
Немного теории. Современный маршрутизатор состоит из набора различных плат:
- управляющих,
- линейных, на которых есть интерфейсы,
- фабрик коммутации, которые соединяют всё воедино.
Кому интересно, более подробно можно почитать в блоге на linkmeup.
6 февраля в 17:03:30 на одном из наших граничных маршрутизаторов вышла из строя управляющая плата или её «ответная» часть, на которой расположена фабрика коммутации и вся машинерия для контроля состояния аппаратных компонентов. Мы до сих пор не знаем точной причины, потому что оживить коробку так и не удалось. По итогу маршрутизатор был потерян полностью.
Эту проблему могла бы предотвратить резервная управляющая плата, но она отказала ещё 22 января, а работы по её замене были запланированы, но не завершены.
Проблема №2
Обычно распределение нагрузки между оставшимися маршрутизаторами обрабатывается штатно: сессии и соседства контрольных протоколов (BGP, IS-IS) должны были уйти по таймауту, а трафик — перейти на резервный маршрут. Пользователи не должны такого замечать, но кое-что пошло не так — ниже разберёмся, что именно.
Полная потеря связности с отказавшим маршрутизатором привела к падению протокольных соседств IS-IS — это заняло около секунды. А вот отзыв BGP-маршрутов занял несколько больше: связность внутри нашей автономной системы организована с помощью рефлекторов, поэтому системе потребовалось некоторое время на обработку событий падения BGP-сессий между рефлекторами и отказавшим маршрутизатором, а также на отзыв маршрутов с других бордеров.
Таким образом, в течение нескольких секунд все оставшиеся в живых пограничные маршрутизаторы оказались в ситуации, когда BGP-маршрут ещё присутствовал, а вот IS-IS маршрут, необходимый для его корректного рекурсивного разрешения, — уже нет.
Рекурсивное разрешение маршрута в BGP — это процесс вычисления актуального выходного интерфейса и выходной инкапсуляции для BGP-маршрута. Он производится исходя из значений протокольного Next-hop маршрута и актуального состояния таблиц маршрутизации. Происходит однократно либо в момент создания маршрута, либо значимого изменения его атрибутов. Необходим для программирования корректной записи в FIB.
Lookup (или лукап) — это процесс поиска подходящей записи в таблицах маршрутизации, коммутации и других (например, FIB, LFIB, ARP Adjacencies, IPv6 ND Table) на основании значения адреса назначения IP-пакета. В современных аппаратных маршрутизаторах это происходит индивидуально для каждого пакета: то есть за короткое время — скажем, секунду — на высоконагруженном маршрутизаторе этот процесс повторяется огромное количество раз.
В таких условиях BGP-маршрут в нашей конфигурации рекурсивно разрешился не самым очевидным образом. Из-за отсутствия IS-IS маршрута разрешение происходило через маршрут по умолчанию, который, в свою очередь, был статическим. Он указывал в таблицу маршрутизации, с которой и начался процесс нашего рекурсивного лукапа.
Круг замкнулся: в FIB маршрутизаторов сформировалась замкнутая цепочка логических next-hop, приводившая к тому, что процесс лукапа над пакетом не завершался за разумное время.
С точки зрения способности пограничных маршрутизаторов отправлять трафик у этой ситуации были следующие последствия:
- у пакетов, которым выпадал этот маршрут, не было ни единого шанса «вынырнуть» из маршрутизатора;
- что ещё хуже — все имеющиеся аппаратные ресурсы линейных карт были заняты бесконечным лукапом крайне небольшого числа пакетов.
Это, мягко говоря, нештатное состояние линейных карт, когда подсистема лукапа фактически блокирована, спровоцировало ряд аварийных перезагрузок этих самых карт. И это только усугубило нестабильность и увеличило потери внешнего трафика.
Мы считаем такое поведение некорректным и связываем его с багом операционной системы вендора сетевого оборудования, потому что проблема возникла только на части маршрутизаторов и определённом типе линейных карт.
Локализация этой проблемы заняла около 10 минут. Ещё через 10 минут мы приняли решение вручную перезагрузить часть маршрутизаторов. Эти действия позволили восстановить связность. Мы воспроизвели похожую ситуацию в лаборатории днём позже, выработали для неё решение и раскатили его на весь парк устройств.
Проблема №3
Вскоре после того, как пограничные маршрутизаторы оправились от предыдущей проблемы и её прямых последствий, стала заметна частичная потеря трафика на маршрутизаторах на границе наших дата-центровых фабрик.
У этой проблемы была несколько иная природа: дело в том, что неделей ранее мы начали плановое обновление ПО на этих маршрутизаторах и к 6 февраля у нас было пять обновлённых устройств. В итоге мы выяснили, что потери трафика локализуются как раз на них.
Нестабильность в сети кратно увеличила количество изменяющейся маршрутной информации. Из-за этого появились маршруты, застрявшие в очереди от процесса, который реализовывал протоколы маршрутизации к ядру, которое, в свою очередь, должно было записать итоговые изменения в программный FIB, а затем и в аппаратный.
Мы продолжаем выяснять детали, но можем утверждать, что с высокой долей вероятности это ещё один баг в ПО одного из наших устройств. После даунгрейда проблема была решена.
Проблема №4
Но и это был ещё не конец инцидента: коллеги из Yandex Cloud сообщили о потерях части трафика сервиса объектного хранилища через одну из магистральных площадок. Сначала мы исследовали проблему на граничных маршрутизаторах, подозревая возврат первой проблемы с линейными картами, но эта гипотеза не подтвердилась.
Потом мы посмотрели, что происходит на транзитных устройствах, и выяснили, что на подключении между магистралью и бордером циклически переустанавливается контрольный протокол BFD и это приводит к постоянному перестроению сети. Искать причину мы сразу стали на промежуточных коммутаторах CLOS-фабрики, потому что ранее уже наблюдали похожую проблему с пиринговыми партнёрами в той же локации.
Наша догадка подтвердилась: мы увидели MAC-флаппинг, только источником теперь был DHCP-пакет, прилетевший со стороны магистрали на М9. В обычной ситуации такого быть не должно — у нас нет DHCP серверов в локации M9.
Мы уже знали, как исправить эту проблему: выключить DHCP-протокол на коммутаторах CLOS-фабрики на точке присутствия М9, которую мы используем для увеличения количества пиринговых портов. В прошлом мы уже поставили заплатку в виде аксесс-листа на все внешние пиринговые порты, запрещающего DHCP-пакеты на вход в фабрику. Но мы не ожидали, что такие пакеты могут прийти изнутри, из-за чего эта проблема и возникла.
Чтобы избежать повторения данной проблемы, мы выключили функциональность DHCP на коммутаторах пиринговой фабрики. Защищаться на портах в сторону нашей сети мы не видим смысла, потому что не хотим блокировать пользовательский трафик.
Таким образом, этот инцидент не связан напрямую с тремя вышеописанными, но мог каким-то косвенным образом быть вызван ими. В любом случае в обновлённой конфигурации он больше не появится.
Итог
В ходе инцидента мы столкнулись с рядом нетривиальных проблем, которые мы смогли быстро детектировать и локализовать.
Мы приняли ряд мер, которые не позволят подобному инциденту произойти вновь. Заменили отказавший маршрутизатор на полностью рабочий. Научились воспроизводить аварийную ситуацию в нашей лаборатории. В будущем она будет исправлена на уровне операционной системы производителя сетевого оборудования.
Мы уже достаточно давно думаем над диверсификацией граничных маршрутизаторов, чтобы баги, специфичные для конкретной конфигурации, не приводили к каскадной аварии. Но, к сожалению, используемая нами функциональность медленно разрабатывается другими производителями. Стратегически мы планируем:
- внедрить второго вендора на этом участке сети;
- проработать вопрос упрощения сетевого дизайна;
- улучшить систему квалификации вендорского ПО.
Мы опубликовали этот разбор, потому что считаем важным объяснять причины серьёзных аварий. Полезно не только рассказывать о достижениях, но и признавать слабые места. В конечном счёте это поможет нам извлечь урок и защитить пользователей от подобных аварий в будущем, а также помочь другим компаниям в диагностике сложных сетевых сбоев.
Ошибка при загрузке и отображении страницы Яндекс.Диска
При использовании Яндекс.Диска могут возникать некоторые из следующих проблем: перестают работать кнопки, не загружаются элементы страницы, не открываются фотографии, не загружаются файлы или браузер сообщает об ошибке.
Почему так происходит и как это исправить:
- Браузер некорректно отображает страницу
Для снижения расхода трафика браузер сохраняет копии посещенных страниц в кэше. При повторном просмотре этих страниц браузер может загрузить их из памяти. Если вы измените имя файла в программе Desktop и браузер загрузит информацию об этом файле из памяти, вы увидите устаревшее имя файла.
Попробуйте обновить страницу для повторной загрузки из Интернета. Если проблема не устранена, очистите кеш браузера и удалите все файлы cookie.
- Расширения блокируют Яндекс.Диск
Яндекс.Диск может работать некорректно из-за надстроек и расширений браузера. Чтобы проверить, не в этом ли причина, попробуйте временно отключить их. Если Яндекс.Диск работает некорректно из-за расширения, блокирующего рекламу или антивирус, добавьте страницу Яндекс.Диска в список исключений этого расширения.
- Блокировка данных включена в браузере
Следуйте инструкциям по отключению блокировки данных для вашего браузера:
Откройте настройки браузера.
Перейти к веб-сайтам.
Прокрутите вниз и нажмите Дополнительные параметры сайта.
Прокрутите вниз до Файлы cookie.
Отключить Блокировать сторонние данные и файлы.
Откройте настройки браузера.
Перейдите на вкладку Конфиденциальность и безопасность.
Прокрутите вниз до раздела «Файлы cookie и данные сайта».
Щелкните Управление разрешениями.
В поле Адрес сайта введите
https://disk.yandex.com/
.Щелкните Разрешить.
Сохраните изменения.
Откройте настройки браузера.
Прокрутите левое меню вниз и нажмите «Дополнительно» → «Конфиденциальность и безопасность».
Перейдите в «Настройки сайта» и нажмите «Файлы cookie и данные сайта».
Отключить Блокировать сторонние файлы cookie.
Откройте настройки браузера.
Перейдите в раздел «Дополнительно» → «Безопасность».
Перейдите в Настройки сайта → Файлы cookie и данные сайта.
Отключить Блокировать сторонние файлы cookie.
Откройте параметры браузера.
Перейти к разрешениям сайта.
Щелкните Файлы cookie и данные сайта.
Отключить Блокировать сторонние файлы cookie.
Откройте свойства браузера.
Перейдите в раздел «Конфиденциальность» и нажмите «Дополнительно».
В разделе Сторонние файлы cookie выберите Принять.
Сохраните изменения.
Яндекс Браузер
Mozilla Firefox
Гугл Хром
Opera
Edge
Internet Explorer
- Вы используете устаревший браузер
Устаревший браузер может не поддерживать технологии, используемые для быстрой и удобной загрузки страниц. Установите последнюю версию вашего браузера.
- На ваше интернет-соединение влияет антивирус, брандмауэр или прокси-сервер.
Яндекс.Диск может работать некорректно из-за антивируса, брандмауэра или прокси-сервера. Чтобы проверить, не в этом ли причина, попробуйте временно отключить их. Если Яндекс.Диск работает некорректно из-за антивируса или брандмауэра, добавьте страницу Яндекс.Диска в список исключений этой программы.
- Интернет-соединение замедлилось
Проверьте скорость вашего интернет-соединения на yandex.com/internet. Закройте все вкладки в браузере, кроме Яндекс.Диска. Отключите приложения, использующие Интернет, и обновите страницу.
Яндекс не загружается: Проблемы с Яндексом
Яндекс не загружается или очень медленно несмотря на подключение к интернету? Тогда узнайте здесь, что можно сделать, если не загружается Яндекс.
Может быть довольно неприятно, когда приложение из App Store не может быть загружено и, следовательно, обновлено. Загрузка или обновление запущены, но в нерабочее время загружается только часть приложения.
Или такое приложение, как Яндекс, не может быть установлено, потому что загрузка не начинается, даже если вы подключены к Интернету.
Кстати, могут возникать и другие проблемы и ошибки, которые вы можете найти в обзоре всех проблем Яндекса найти.
Яндекс не загружается
Вы хотите загрузить или обновить Яндекс, но загрузка или полная загрузка приложения занимает целую вечность, потому что оно просто не загружается. Многие потом отчаянно пытаются перезагрузить загрузку Яндекса, но и это не приводит ни к какому полезному результату.
Следующей попыткой многих будет проверка интернет-соединения. Но WLAN показывает полный прием и все равно не работает или работает очень медленно.
Яндекс загружается очень медленно
Если Яндекс загружает очень медленно, это также может быть связано с размером самого приложения. Индикатор выполнения показывает медленную загрузку, но это может появиться только из-за размера приложения. В случае обновления вы можете проверить в соответствующем магазине приложений, насколько велик установочный файл, и посмотреть, может ли он загружаться так долго из-за своего размера.
Обновление Яндекса не запускается
Хотите обновить Яндекс или скачать заново. Если один не работает, у вас, вероятно, те же проблемы с другим, и вам следует искать те же решения.
Поэтому мы собрали несколько возможных решений, чтобы вы могли без проблем скачать приложение Яндекс.
Для того, чтобы загрузка Яндекса работала:
Надеемся, что следующие решения помогут, чтобы вы могли загрузить Яндекс и загрузка не длилась вечно. Если вам известны другие возможные решения, мы с нетерпением ждем сообщения от вас в конце этой статьи.
- Проверить подключение к интернету
Причины, по которым не загружается Яндекс, не могут быть более разными. В большинстве случаев это связано с вашим собственным подключением к Интернету. Вполне возможно, что ваше устройство находится в сети Wi-Fi, но оно все равно не работает, поэтому вам следует попробовать зайти на веб-сайт в Интернете с помощью браузера. Если это работает нормально, то это не ваш смартфон или планшет. Если вы пытаетесь загрузить приложение через мобильную сеть (что не рекомендуется из-за потребления данных), то вам следует проверить, насколько стабильно мобильное соединение. Возможно, ваш объем данных также был израсходован и поэтому доступен медленно. Также может случиться так, что загрузка из мобильной сети невозможна из-за ваших настроек.
В этом случае вам следует проверить настройки мобильных данных на вашем устройстве. - Перезагрузите смартфон или планшет
Часто возникают проблемы с App Store после обновления операционной системы Android или iOS. После обновления системы вполне может случиться так, что соединение с данными для входа в соответствующий магазин перестанет работать безопасно. В этом случае следует перезагрузить смартфон или планшет, что перезагрузит все настройки и функции и, при необходимости, восстановит подключение к App Store. - Проверить статус сервера
Если перезагрузка и работающее интернет-соединение не решили проблему и Яндекс по-прежнему загружается медленно или вообще не загружается, то дело может быть и на серверах iTunes Store для iOS или для Android на лежат серверы Google Play Store. Это не должно быть связано с серверами разработчика Yandex Apps, так как приложение находится на серверах App Store, в редких случаях они могут быть перегружены или возникать сбои из-за профилактических работ.проверить статус сервера Apple
проверить статус сервера Google - Для Android: Очистить кеш и удалить данные в Play Store
Это полностью перезапустит приложение, и проблемы могут быть решены.- Откройте приложение « Настройки » на устройстве.
- Нажмите Приложения и уведомления , затем нажмите Просмотреть все приложения .
- Прокрутите вниз и коснитесь Google Play Store.
- Tap Память Пустой кэш .
- Затем нажмите Очистить данные .
- Снова откройте Play Store и повторите попытку загрузки.
Итак, надеемся, советы и рекомендации оказались полезными и загрузка с Яндекса снова работает быстро и без проблем.