Разное

Новый алгоритм яндекса: Новый алгоритм Яндекса YATI. Как оптимизировать сайт под Yandex YATI

21.08.2023

Новый алгоритм Яндекса Y2 – все, что нужно знать SEO-специалисту

Спикер: Дмитрий Севальнев, основатель и евангелист сервиса «Пиксель Тулс» 

Y2 – это новая версия поиска Яндекса, которая была запущена в конце ноября. В основе ее все также лежит технология нейросетей-трансформеров и алгоритмы YATI + CS YATI и YALM, а также такие метрики качества поиска как Профицит и Проксима. Самое важное в обновлении: новые формулы по тематикам, поиск видео с закадровым переводом, поиск объектов и большие темы. 

Что реально поменялось и когда? 5+3 самых важных моментов в Y2

А когда же был апдейт? Конечно же, единой даты выката нового алгоритма Y2 — не было, и уж тем более он не был явлен миру 28 ноября, когда Яндекс об этом объявил. Так уже давно не делают, а постепенно «раскатывают на 2%», максимально минимизируя риски. 

Согласно анализаторам, особенно заметные изменения в выдаче фиксировались в двадцатых числах сентября и ноября:


Напомним, что в сентябре Яндекс обновил поиск на базе модели CS YATI, которая учитывает в полтора раза больше информации со страницы, чем ее предыдущая версия – YATI. Это позволило поисковику существенно улучшить поиск специализированной информации для программистов. 

А в двадцатых числах ноября Яндекс реализовал на своих сервисах (в том числе и на поиске) возможность создания детских аккаунтов для защиты несовершеннолетних от контента взрослой тематики. 

Эти оба обновления вошли в новую версию поискового алгоритма Y2, что также позволяет утверждать, что никакого апдейта – утром проснулись и увидели новые позиции – в общем-то и не было. А есть новый алгоритм, который постепенно внедряется в поиск с сентября, постоянно тестируется, подкручивается и улучшается, согласно поставленным Яндексом целям.

Что нового в выдаче Яндекса

1. Поиск объектов. Фактически, это продолжение проекта Яндекс Острова, который был придуман в 2013 году и похоже, значительно опередил свое время. 

Яндекс делает очередной «заход» на структурирование веба, пытаясь из урлов вычленять некоторый набор объектов – в данном случае тех, с которыми пользователь хочет вступить во взаимодействие – и показывать ее в выдаче в удобной интерактивной форме.  

Например, если пользователь ищет какие-то курсы, то Яндекс агрегирует все подходящие предложения и объединит их на выдаче, дав пользователю возможность сделать выбор и вступить во взаимодействие с выбранным объектом на сайте. 


Если обратиться к справочной информации Яндекс Вебмастера, а именно к разделу «Дополнительные возможности отображения сайта в поиске», то можно увидеть перечень определенных тематик и существующих для них форматов отображения на выдаче, по которым вебмастера могут передавать свои данные поиску с помощью YML-файла. 


Обязательно нужно делать это, если вы хотите получать и красивые сниппеты, и дополнительный трафик на сайт, и не оказаться на обочине при внедрении Яндексом каких-то новых интересных форматов.

Взаимодействие с объектами (непосредственно заказ) пока еще происходит на сайте владельца, однако, если эта технология будет развиваться поиском дальше, логично предположить, что в дальнейшем пользователи получат возможность совершать транзакции непосредственно на странице SERP.

2. Большие темы (персонализация). Это обновление также по большому счету новым не является. Яндекс учитывает постоянные и сиюминутные интересы для персонализации поиска с 2011-2012 годов (Рейкьявик, Калининград, Дублин), сейчас долгосрочные интересы были вынесены в блок «Большие темы».


В таком виде персонализация становится понятной каждому пользователю, потому что оформлена соответствующим образом и отчасти предоставляет какой-то выбор – в виде перехода от одной темы к другой.

Сейчас поиск Яндекса выделяет такие большие темы, как образование, карьера, финансы, семья, квартира, ремонт и так далее. Чтобы распознать интерес к той или иной тематике, Яндекс применяет сложный классификатор на основе генеративной нейронной сети YaLM.

3. Асессоры –> Эксперты. Очень интересным является тот факт, что поисковые асессоры уже превращаются в экспертов (либо эксперты становятся асессорами), ведь есть большое количество тематик, где только эксперт способен правильно оценить качество ответа по запросу.

Для примера, возьмем запрос [C++ list find]. Большинство страниц, отвечающих на этот запрос будет на английском, и совершенно очевидно, что рядовой асессор, не владеющий этим языком программирования, не сможет верно оценить релевантность выдачи. 


Именно поэтому появилась CS YATI – новая модель, обученная на документах для IT-специалистов и оценках экспертов по программированию. 

Примечательно, что новый подход применен сначала именно в поиске для программистов, однако, Яндекс, как владелец поиска, имеет право задавать свои тренды. SEO-специалисты же из этого могут сделать вывод о том, в какую сторону будет развиваться поиск во всех тематиках, требующих экспертизы.

4. Перевод видео «в потоке». В Y2 есть фильтры для поиска видео с автоматическим голосовым переводом на русский язык. Например, чтобы сварить настоящий луковый суп, можно посмотреть французский видеорецепт с закадровым переводом. Сейчас доступен перевод видео с английского, немецкого, французского, итальянского и испанского языков.  

Он работает в приложении Яндекс и в Браузере. Также Яндекс умеет на лету переводить видео, даже если это стриминг. Теперь можно в прямом эфире смотреть международные конференции или, например, интервью с иностранцами. Причем это будет многоголосый машинный перевод, в основе которого лежат сложнейшие технологии.

Эта фича на самом деле тоже 2021 года, правда уже в доработанном варианте, как и все то, о чем говорилось выше. Она лишь подтверждает тренд на глобальный интернет, на стирание языкового барьера и возможность получения информации из абсолютно разных источников.

В 2021 году был запущен проект «Переводной поиск», и доля переведенных ответов плавно растет. Яндекс стремится к тому, чтобы максимально релевантные ответы на запросы, не зависимо от того, на каком они языке, присутствовали в выдаче. Вебмастерам переживать по этому поводу не стоит, разве что только владельцам узконаправленных контентных проектов на русском языке.

5. Детские аккаунты и безопасность.   Детский аккаунт работает в Поиске, Музыке и других сервисах Яндекса. Так, Кинопоиск будет предлагать детям только фильмы и мультики по возрасту.  Приложение Яндекс Музыки не даст послушать трек с ненормативной лексикой, а Поиск и Браузер оградят от шок-контента и сайтов для взрослых — неважно, искал их ребенок специально или нет. 


Аккаунты для детей заводят родители. Для этого нужно зайти в свой Яндекс ID и создать детский аккаунт: указать имя и возраст ребенка, придумать логин и пароль. Можно также выбрать возрастное ограничение контента: например, 6+ или 12+. Также детский аккаунт можно завести из раздела «Семья» в Яндекс ID, куда пользователи добавляют своих близких. 

5+1. Поиск на Картах. 9 ноября Яндекс анонсировал новый поиск на Картах – довольно большой и сильный алгоритм, который почему-то остался без должного внимания со стороны сеошников. 

Поиск на Картах теперь умеет распознавать объекты на прикрепленных фотографиях для того, чтобы показывать организации в выдаче по сложным запросам без применения дополнительных фильтров.  Например, если это баня, которая находится рядом с пользователем, Карты покажут ее по запросу [баня] или [баня поблизости], а анализ прикрепленных фото, на которых виден бассейн и вязанки дров, позволит показать ее еще и по запросам [баня на дровах] или [баня с бассейном]:


Кроме того, новый поиск Карт учитывает описания и ключевые слова от владельцев организаций, наличие отзывов и прайс-листов. Для хорошего ранжирврания в Картах у организации должен быть очень хорошо оптимизированный под нужные поисковые запросы сайт, и желательно, чтобы в отзывах использовались нужные данному бизнесу ключевые слова. 

5+2. Развитие антиспама. Яндекс усиливает борьбу с накрутками кликов и трафика, и за время внедрения нового алгоритма, десятки сайтов в тематике «создание и продвижение сайтов» буквально ушли под бан.


Это подтверждает ранее взятый курс Яндекса на полную фильтрацию накрученных кликов и неучет трафика, о чем не следует забывать.

5+3. Фильтр Мимикрия. Еще одна вещь, выпущенная Яндексом в августе текущего года, про которую тоже стоит помнить и всегда иметь в виду. Это понижение в ранжировании сайтов, которые похожи на другие популярные ресурсы. 

Под фильтр попали сайты, которые монетизировались на чужом навигационном трафике, при полном отсутствии собственного функционала и/или контента. Они «выезжали» на визуальной схожести с оригинальными сайтами, копируя заголовки, лого, favicon, названия и проч., при этом будучи ресурсами низкого качества, которые плохо решают задачи пользователя. 

К сожалению, пострадали не только такие уж явные «чернушники», но и многие партнерские сайты, работающие по CPA-модели, также провалились в выдаче. Здесь можно посоветовать только одно – не только решать задачи обработки навигационного трафика, но и развивать ресурс, создавать комьюнити и заботиться о качественном решении пользовательских задач. Ну и конечно, уделять внимание визуальному оформлению сайта, чтобы не делать его сильно похожим на изначальный бренд.  

Новые алгоритмы для крупных тематик и экспертные оценки + проблема ПФ

Метрики

Что улучшает Яндекс и почему это важно для SEO-специалиста? Яндекс улучшает метрики качества выдачи, которые называются Проксима и Профицит. Первая оценивает качество отдельных страниц, а вторая – качество выдачи в целом.

Проксима оценивает страницы, исходя из:

  • их релевантности запросу
  • вероятности решения задач пользователя 
  • баланса полезного и навязчивого
  • дополнительных сигналов о качестве контента, авторитетности автора, YMYL

Профицит же оценивает взаимодействие пользователя с выдачей – было оно успешным или нет. Успешное взаимодействие (long click, last click, …) – увеличивает профицит, а неуспешное (возвраты на SERP) – уменьшает. Также метрикой учитывается размер элементов в выдаче и их расположение. 

Именно ключевой акцент Яндекса на метрике Профицит и приводит к такой колоссальной роли поведенческих факторов в выдаче на текущий момент. Как только мы хотим улучшить эту метрику, то активно цепляемся за все те якобы успешные взаимодействия ботов или мотивированных пользователей на выдаче, которые Яндекс так хорошо умеет распознавать. Проблема накруток ПФ не может быть полностью решена до тех пор, пока метрике успешности/неуспешности взаимодействия пользователя с выдачей будет придаваться столько значения.

Экспертные темы и ранжирование

Как все работает. Сначала Яндекс пытается понять, какой тематике посвящен поисковый запрос, и этим занимается одна нейронная сеть. Далее включается другая нейронная сеть для ранжирования сложных тематик – в первую очередь программирования, финансы, медицина, игры и др.  Во всех этих тематиках, где оценить качество ответа может только человек, обладающий определенной экспертизой, место асессоров постепенно занимают эксперты. 

Что значит это дробление алгоритмов и появление новых нейронных сетей для SEO? Только то, что при продвижении сайтов обязательно нужно учитывать E-A-T-факторы – во всех тематиках. Уделять больше времени проработке факторов экспертизы и доверия. Об этом нам говорит Яндекс, и об этом же постоянно говорит Google. Это текущая реальность и игнорировать ее не получится. 

Пришло время SEO-специалистам пересмотреть ТЗ на копирайтинг – перестать смотреть на контент лишь в разрезе контент-маркетинга с учетом SEO-требований, а все-таки рассматривать его как инструмент для решения задач пользователя. 

Важно помнить, что работы, дающие плюс в одной тематике, могут давать минус в другой. На текущий момент алгоритмы настолько разобщены, что успешные подходы в продвижении сайтов медицинской тематики, могут давать околонулевые результаты в продвижении, например, финансовых сайтов или игр. Это говорит  о том, что в SEO уже нет какой-то универсальной экспертизы, а экспертный подход – это продуктовый подход: постоянный анализ, выдвижение гипотез и их тестирование, а также измерение результатов внедрения. 

Какое место в алгоритме Яндекса занимает ИИ? Факторы, вычисленные с помощью нейросетей (YATI + CS YATI + прочие YATI) являются «одними из» в общей совокупности, которые используются для построения итоговой формулы ранжирования, которая в свою очередь строится на алгоритмах машинного обучения (CatBoost).

Важно понимать, что это не сама нейронная сеть строит формулу ранжирования, а она  лишь является одним из факторов:


При этом остальные, классические факторы поисковой оптимизации никуда не деваются и продолжают играть свою роль в связи с их фундаментальной природой.

Проблема ПФ

Как уже говорилось выше, проблема накрутки поведенческих факторов никуда не делась. Ну, Яндекс, ну come on! Сколько еще нейронных сетей надо, чтобы отфильтровать это:


Если внимательно посмотреть на проекты, которые начали динамично расти с нуля, то можно увидеть, что это сайты типа «уборка после ремонта», без какой-либо ценности, без какого-либо бренда, зато с накруткой от нуля в бесконечность.

Для того, чтобы понять, что это накрутчики, достаточно всего лишь одного графика, который показывает полное отсутствие трафика из Google, но зато 60% видимости в Яндексе:


Конечно, вряд ли Яндекс анализирует, какую видимость имеет тот или иной сайт в выдаче Google, а зря. Ведь если другой авторитетный поисковик дает ресурсу ноль трафика, то почему Яндекс ему должен обеспечивать видимость и показы?

Это свидетельствует о том, что сайт просто обеспечил себе «отличные» метрики так необходимые Яндексу. О каком успешном взаимодействии пользователя с сайтом тут можно говорить, если перейдя на сайт можно увидеть следующее:


Как после этого можно серьезно относиться ко всему тому, что говорилось ранее – E-A-T, экспертность, доверие, надежность бизнеса?

Давайте сообщать о таких сайтах Яндексу, тогда возможно через полгода мы увидим другую выдачу, без накрутчиков в ТОПах, потому что для многих тематик это является очень серьезной проблемой. Сообщать можно просто: либо прямо на выдаче жаловаться на подобные сайты, либо писать Михаилу Сливинскому по адресу – [email protected]

Y2 и продвижение: рекомендации 2022

1. Загрузите YML-фид

Как уже упоминалось ранее, большое число тематик имеет возможность получить дополнительное представление в поиске + большой шанс на мега-крутой сниппет на выдаче.  


2. Отзывы, рейтинг и качество сайта

Яндекс делает все, чтобы оценивать качество сайта, используя доступные данные для улучшения ранжирования. Рейтинг сайта сказывается, как на позициях, так и на конверсии  сайта.

Количество оценок и отзывов на любой сайт можно посмотреть на специальной странице в Вебмастере. Там очень хорошо видно, есть ли у сайта вообще отзывы, каково соотношение отзывов положительной и отрицательной направленности, отвечает ли владелец сайта на отзывы, решает ли какие-то возникающие у пользователей вопросы и как.

В Справке поисковик прямо указывает, что оценки в 4-5 баллов являются положительными и дают плюс в оценке качества сайта, а также плюс к ранжированию, а оценки 3 и менее – являются отрицательными. 

Поэтому нужно постоянно проверять рейтинг своего сайта и рейтинг своего магазина в поиске по товарам. Для поиска по товарам используйте YML-фид.


Улучшение рейтинга организации на Картах, высокий рейтинг магазина в товарном поиске – это те вещи, которые серьезно помогают улучшить ранжирование сайта по хостовым характеристикам.  

3. Эксперименты и откаты

Это вечная SEO-тема и она не теряет, а только наращивает свою актуальность. Каждая идея, которая появляется в голове у SEO-специалиста, является гипотезой, которая нуждается в проверке. Масштабировать стоит только те подходы, которые дают положительный результат, иначе можно испортить все то что было ранее нажито непосильным трудом.

Например, вы внедрили на сайт 12 изменений, и в среднем, это не дало никакого результата. Говорит ли это о том, что все они были бесполезны? Конечно же нет. Если проанализировать результаты внедрения каждого изменения, может оказаться, что какие-то из них оказались провальными и ухудшали результат, в то время как какие-то – улучшали. Достаточно убрать неэффективные подходы для того, чтобы получить динамику и рост.

Про SEO-гипотезы можно послушать здесь, это рассказ о том «Как мы внедрили 12 изменений на сайт и он просел в 3 случаях».

4. Экспертиза и доверие

Помните, свой CS YATI рано или поздно придет и в вашу тематику. И вот тогда, когда вместо обычных асессоров придут эксперты, чтобы с экспертной точки зрения оценить ваш контент,  важно будет показать, что:

  • за вашим контентом также стоит экспертиза, т. е. авторитетное мнение, которому можно доверять
  • у контента есть конкретный автор, живой и настоящий, и на сайте есть о нем подробная информация
  • помимо наличия экспертной информации, у сайта есть  добавочная ценность – UGC, рейтинг, комьюнити…
  • у сайта есть свое УТП, как у инфо-ресурса, а не только УТП бизнеса
5. Чек позиций бизнеса на Картах

Как уже отмечалось, на Яндекс Картах заработал новый нейросетевой поиск, поэтому добавляйте в отзывы ключевые фразы, загружайте больше фото с  объектами на них, прикрутите онлайн-функции – запись, консультирование, чат… Обязательно проведите хотя бы базовую оптимизацию сайта, потому что сейчас это критически важно для хорошего продвижения организации на Картах.


6. Слова из ТОП URL конкурентов

На самом деле, ТЗ на копирайтинг – это унылинг какой-то. Надо уходить от одних только SEO-требований в сторону решения задач пользователя. Включайте в ТЗ не одни только ключевые слова из поисковых запросов, но и те слова, которые в целом характеризуют тематику. Их в том числе можно подсмотреть у конкурентов. 

7. Не забывайте про «классику» 

Сложно поверить, но роль классических факторов сейчас все также велика. Точное вхождение слов и фраз в текст, наличие ключей в Title, количество ссылок, ПФ, пост-фильтры – никуда не пропали. Они по-прежнему играют свою роль в алгоритме.  


К примеру, если посмотреть вероятность наличия пост-фильтра, то видно, что большое количество ниже 20 позиции могут иметь проблемы с пост-фильтром. Также же мы видим, что сохраняется и сильная корреляция точного вхождения и позиций в выдаче.

Ключевые выводы

  • Поисковые алгоритмы постоянно меняются. Среднее количество небольших изменений — более 5 в день.
  • Растет роль качества сайта и бизнеса, который стоит за ним. Свой «CS YATI» придет и в вашу тематику.
  • SEO-специалистам и Яндексу важно сделать акцент на проблеме ПФ в выдаче и победить болезнь.
  • Классические факторы ранжирования играли, играют и будут играть крайне важную роль для SEO

Алгоритм Y2 не был революцией в поиске, скорей, Яндекс идет эволюционным путем, решая текущие задачи пользователя.

Я верю, что теперь каждый из вас разобрался с Y2 и сможет повысить трафик своего сайта и продажи!

YATI новый алгоритм Яндекса | Интернет-агентство Малевич в Нижнем Новгороде

В конце прошлого 2020 года компания Яндекс ввела новый алгоритм ранжирования, эффект которого основан на нейронном преобразовании запросов. Аббревиатура YATI переводится с английского как «еще один трансформер, имеющий улучшения». Новая технология, основанная на семантическом компоненте, оценивает близость запроса и искомой страницы.

Данный алгоритм проходит самообучение по трансферному принципу, то есть в первую очередь происходит решение одной задачи, для которого собираются данные, позволяющие трансформеру решить именно ее. После этого та же информация применяется во второй раз, но уже для решения иных задач. Изначально «Яти» предобучается на большом количестве простых и не всегда правдоподобных сведений от посетителей Яндекс.Толока. По окончании первого этапа, трансформером получается уже больше экспертной информации от специально обученных консультантов поисковика, но в меньшем количестве.

Одной из характерных особенностей YATI является предсказание пользовательского клика. Данная метрика является дополнительной и учитываемой при ранжировании сайтов.

Новый алгоритм анализирует текстовые запросы и страницы, выводящиеся по ним. По мнению издателей, делает он это эффективнее алгоритмов «Палех» и «Королев», которые при совместной работе оказывают меньшее воздействие на поисковую выдачу. Стоит понимать, что использование нейросетей не отменяет общие поисковые правила, по которым происходит ранжирование. Однако если выводить результаты поиска только по алгоритму YATI, то качество отбора (по оффлайн-метрике) снизиться максимум на 5%.

По мнению экспертов Яндекса, выход «Яти» стал самым значимым событием для поисковика за последнее десятилетие, после запуска Matrixnet. Стоит напомнить, что до 2016 г. порядка 95% вводимых в Яндекс слов вообще не учитывалось – алгоритмы их просто игнорировали.

Постоянное совершенствование поисковых систем и Core Updates

Весь прошлый год, особенно осень, поисковую систему Яндекса постоянно штормило. Регулярный мониторинг обновлений с помощью «Пиксель Тулс» позволяет выделить некоторые регулярные изменения в поисковой системе, которых ежегодно бывает до 500, и основные перемены, непосредственно связанные с алгоритмом сортировки, называемые Core (основные обновления). Последние влияют на большую часть поисковых запросов и часто затрагивают переобучение поисковой формулы или новый подход к ней.

Все поисковики уведомляют СЕО об основных обновлениях по-разному. Например, Google, у которой в прошлом году было три обновления главного алгоритма, предупреждала перед их вводом вкратце и в соцсетях. Яндекс сам не анонсирует релизы, но раскрывает более подробную информацию в публикуемых о них статьях.

«Яти» был анонсирован в ноябре прошлого года. Однако, по данным «Пихель Тулс», ошибок в росте средних параметров выбросов поисковика в том месяце не было. Результаты наблюдались в конце сентября, что могло говорить как раз о вводе данного алгоритма.

Принципы ранжирования и нейросети

Нейронные сети представляют собой способ машинного обучения, применяемый в поисковых системах с 2000-х гг.

В 2009 г. Яндексом был введен «Снежинск» – алгоритм, работа которого основана на MatrixNet (тот самый принцип машинного обучения).

В 2016 г., при представлении алгоритма «Палех», Яндексом впервые было озвучено о применении нейронных сетей. Откровенно говоря, поисковик стал использовать нейронные сети раньше – к примеру, в сервисе Яндекс.Переводчик. В то время специалистами Яндекса было сделано признание в том, что одной из целей поисковика является получение моделей, основанных на нейросетях, способных улавливать смысл пользовательских запросов и страниц в степени, сравнимой с человеческим пониманием.

Алгоритм «Палех» стал значительным шагом в развитии поисковой системы на пути к технологии «Яти» – так же, как и «Королев», введенный в 2017 году. Он был создан для сравнения текстовых запросов, введенных в строку, и страничных заголовков. Обучение проводилось на нескольких примерах (как положительных, так и неэффективных) из ранее собранных статистических данных. Поскольку алгоритмы поисковиков не могут читать тексты, поиск соответствия осуществлялся путем численного сравнения.

«Палех» был сравнительно тяжелым, поэтому он применялся лишь на более поздних этапах классификации, приблизительно к ста пятидесяти наилучшим документам из уже отфильтрованного набора.

«Королев» действовал по тому же принципу, что и «Палех», но после его ввода вектор стал вычисляться заранее, в автономном режиме, что позволило применять его к большему числу документов. Работает это по следующей схеме:

  • автономный алгоритм производит вычисления страничного вектора, сохранив его в базе индексов,
  • пользователь вписывает в строку запрос,
  • запрос форматируется в вектор, умножается на готовые боковые векторы и вычисляется его релевантность.

В том случае, если векторы не были бы рассчитаны заранее – невозможно было бы применить нейросети к большему числу страниц, не влияя на время доставки результатов для пользователя в его запросе.

Кроме действий по векторному сравнению, «Королев» начал сравнивать новые запросные векторы с другими запросными векторами, для которых понятен наилучший ответ. Если бы они стояли близко друг от друга, то итог был бы одинаковым.

Следует понимать, что нейросети не могут полностью заменить всю формулу классификации поиска. Коэффициенты, рассчитанные с их помощью, являются лишь «некоторыми» в целом объеме факторов, используемых для построения финальной формулы. В результате, когда мы даем запрос, то можем увидеть ответные документы, соответствующие как по семантике, так и по точному вхождению.

Если упрощенно, то каждый из факторов движется в своем направлении. В результате происходит так называемая «борьба» смысловых и обычных факторов – ответственных за смысл и за текст.

К остальным факторам относятся поведенческие, ссылочные и факторы хостинга. Это является доказательством того, что поисковик не заменил уже существующие инструменты новым алгоритмом, а действует на улучшение уже существующих новыми технологиями. Факторы, ответственные за смысл, играют важную роль, когда прямых ответов на конкретный запрос пользователя немного.

Внедрение Google ПО Word2vec и алгоритма Bert могут ознаменовать аналогичные вехи в развитии этой поисковой системы.

Конкурирующие алгоритмы: BERT и YATI

У конкурирующего поисковика Google есть также трансформер BERT, работающий с остальными алгоритмами, действующими при ранжировании. Данная нейросеть анализирует поисковые запросы и их контекст, а не отдельные ключевые вхождения. То есть, «Берт» полностью анализирует предложение.

Надо сказать, что данная технология может решать большое количество поставленных перед ней задач, поскольку используется также для понимания «смысла» текста. Эта технология лежит в основе достаточного большого семейства языковых моделей.

По описаниями «Яти» и «Берт» понятно, что оба являются трансформерами и стремятся лучше понять смысл пользовательского запроса. При этом «Яти» выглядит более выигрышно, поскольку, помимо анализа запросов, он также анализирует тексты самих документов, и при этом учится прогнозировать клики. Отсюда напрашивается вывод о том, что «Яти» является более важным обновлением, чем «Берт».

С позиции IT-лингвистики, «Берт» и «Яти» являются родственными алгоритмами. И Яндекс к этому алгоритму пришел не сразу. Первым шагом, как уже упоминалось, был «Палех», который научился понимать текстовый смысл. То же самое применилось в алгоритме «Королев». Вероятно, именно по этой причине «Яти» был объявлен достаточно скромно, без громких заявлений о том, что поисковик умеет еще лучше понимать текстовый смысл.

Способен ли YATI справиться с накруткой поведенческих факторов

Когда Яндекс сделал поведение пользователей одним из факторов ранжирования, поведенческие факторы быстро научились накручивать – имитировать клики, заказы и звонки через формы связи. В 2020 г. поисковик перестал угрожать санкциями за мошенничество и ввел меры по борьбе с ним (антифрод). В течение месяца сотни сайтов вышли из выдачи, годами накручивая ПФ для показа в топе. В 2021 году данная тенденция сохранится.

Обстановка с накруткой поведенческих факторов в конце 2020 г. была весьма проблематичной. Соответствующие санкции были введены в начале осени прошлого года. Яндекс наказывает ресурсы, чьи ПФ кажутся неестественными, а некоторые проекты потеряли видимость с момента запуска «Яти».

Яндекс, как и Google, постепенно тянет трафик на свои сервисы, что уже невозможно игнорировать. Так же невозможно перехватить трафик с более качественным контентом, надежными ссылками и поведенческими факторами. Нет смысла сражаться с великаном – нужно просто пользоваться сервисами и получать трафик от них. Яндекс позволяет, к примеру, бронировать столик прямо с карты, приглашать пользователей на вебинары, предлагать услуги специалистов своего сервиса, рассказывать о событиях для жителей районов, продвигать свои материалы через Дзен и т. д.

Что сделать на сайте прямо сейчас, как оптимизировать сайт под YATI

Появление «Яти» не отменяет оптимизацию – заголовки и теги все так же учитываются. Здесь нужно понимание того, что «Яти» не вычеркивает введенные ранее классификационные коэффициенты, а лишь дополняет их качественной функцией в виде текстового анализа. Поэтому оптимизация, наращивание естественной ссылочной массы и улучшение ПФ продолжают работать.

Нужного эффекта в выдаче можно добиться, работая над ресурсом в комплексе:

  1. Увеличьте число совместимых слов в текстовом контенте своего ресурса с словами пользовательского поиска. К ним могут относиться подсвеченные слова и фразы, а также используемые конкурирующими ресурсами, которых нет на вашей странице.
  2. Расставьте акценты на текстовом содержимом, отформатируйте его. Если текст имеет более 14 предложений, то необходимо использовать заголовки с использованием ключевых и относящихся к тематике слов.
  3. Проведите анализ и оптимизацию индекса запросов для отдельных страниц, а также для всего ресурса в целом через Яндекс. Вебмастер.
  4. Проверьте соответствие запросов, с которых был переход по определенному URL-адресу, и одних лишь показов, без переходов. Информация по всему ресурсу по-прежнему влияет на факторы для конкретной страницы. Поэтому необходимы проверки по всему сайту, а не только по адресу.
  5. Расширьте семантическое ядро, чтобы перейти к низкочастотным запросам. Помогут продвинуться слова-синонимы и т.н. «вложенные» запросы. К примеру, «сео продвижение сайтов» сработает и для «сео сайта», и для «SEO-продвижение».
  6. Проведите анализ конкурирующих ресурсов. Проанализируйте показы конкурирующих страниц на основе поисковых требований.
  7. Изучайте сторонние материалы: какие из тематических слов и словосочетаний в них применяются, их лингвистическая структура и т.д.
  8. Выполните традиционную оптимизацию текстового материла, введите точные вхождения ключевиков, заголовков.

Выводы

Трансформеры заметно улучшили качество поисковой выдачи в Яндексе, выведя его на более высокий уровень. Использование тяжелых технологий на основе нейросетей, способных учитывать естественную языковую структуру, семантику между словами одного текста, помогает находить нужные результаты по его смыслу, а не по тексту.

С учетом того, что «Яти» нацелен на анализ и понимание смысла написанного, можно сделать предположение, что текстовое содержимое будет играть важную роль в классификации ресурсов. Поэтому все чаще появляется профессиональный текстовый контент, дающий квалифицированный ответ на пользовательские поиски.

Невзирая на то, что «Яти» считается инновационной технологией, поисковые инструменты Яндекса, как правило, создаются постепенно, эволюционируя, а не меняясь кардинальным образом. Т.е., обновление осуществляется путем постоянного добавления новых классифицирующих факторов к предыдущим, а не кардинально революционным изменением основ. С появлением «Яти» оптимизация не теряет актуальности, а лишь требует небольшой корректировки.

«Яти», безусловно, изменит вывод результатов запроса, но так как системе необходимо обучение, это займет некоторое время. Поэтому пока еще существует возможность внести нужные корректировки в свой ресурс и переработать продающие тексты, сохранив и улучшив свои позиции при окончательном переходе поисковика на новый формат.

Утечка Яндекса раскрывает факторы ранжирования в поиске

Бывший сотрудник предположительно слил репозиторий исходного кода Яндекса, часть которого содержала более 1900 факторов, используемых поисковыми системами для ранжирования сайтов в результатах поиска.

Эта утечка выявила 1922 фактора ранжирования, которые Яндекс использовал в своем алгоритме поиска, по крайней мере, по состоянию на июль 2022 года. Пожалуй, Мартин Макдональд лучше всех выразился сегодня в Твиттере: «Взлом Яндекса, вероятно, самое интересное, что произошло в SEO за последние годы. ».

Яндекс — это не Google. Если вы планируете прочитать полный список факторов ранжирования Яндекса, помните, что Яндекс — это не Google. Если вы видите фактор ранжирования, указанный Яндексом, это не значит, что Google придает этому сигналу такой же вес.

На самом деле Google может использовать не все перечисленные 1922 фактора. На самом деле, многие факторы в этой утечке устарели или не используются.

Тем не менее, многие из этих факторов ранжирования могут быть очень похожи на сигналы, которые Google использует для поиска. Таким образом, просмотр этого документа может дать некоторые полезные сведения, которые помогут вам лучше понять, как поисковые системы, такие как Google, работают с технологической точки зрения.

Общая картина. Код появился в виде торрента на популярном хакерском форуме, как сообщает Bleeping Computer:

… Лидер опубликовал магнитную ссылку, которая, как они утверждают, является «источниками git Яндекса», состоящая из 44,7 ГБ файлов, украденных у компании в июле 2022 года. Эти репозитории кода якобы содержат весь исходный код компании, кроме правил защиты от спама.

Яндекс называет это утечкой. Поскольку код появился на популярном хакерском форуме, сначала подумали, что Яндекс взломали. Яндекс опроверг это и предоставил следующее заявление:

«Яндекс не был взломан. Наша служба безопасности обнаружила фрагменты кода из внутреннего репозитория в открытом доступе, но содержимое отличается от текущей версии репозитория, используемого в сервисах Яндекса.

Репозиторий — это инструмент для хранения кода и работы с ним. Таким образом код используется внутри большинства компаний.

Репозитории нужны для работы с кодом и не предназначены для хранения персональных данных пользователей. Мы проводим внутреннее расследование причин обнародования фрагментов исходного кода, но не видим никакой угрозы для пользовательских данных или производительности платформы».

Макдональд поделился полным списком из 1922 факторов здесь, в Школе веб-маркетинга. Я настоятельно рекомендую скачать его, так как я полностью ожидаю, что Яндекс попытается вычистить эту информацию из Интернета. (Примечание редактора: в более ранней версии этой статьи мы давали ссылку на переведенную версию в Dropbox, но эта ссылка быстро исчезла.

)

Ранний анализ факторов ранжирования. Алекс Буракс создал две темы в Твиттере — первую и вторую — анализируя различные факторы ранжирования. Здесь есть еще одна интересная ветка в Твиттере от Майкла Кинга.

Дэн Тейлор также делится некоторыми выводами из статьи «Утечка данных Яндекса: что мы узнали об алгоритмах поиска в поисковых новостях России».

Многие факторы ранжирования Яндекса — это то, что вы ожидаете увидеть:

  • PageRank и множество факторов, связанных со ссылками (например, возраст, релевантность и т. д.).
  • Релевантность текста.
  • Содержание возраста и свежести.
  • Сигналы поведения конечного пользователя.
  • Надежность хоста.
  • Некоторые сайты получают предпочтение (например, Википедия).

Некоторые факторы ранжирования вызывают удивление у SEO-специалистов: количество уникальных посетителей, процент органического трафика и средний рейтинг домена по запросам.

И, как указал Тейлор, 244 фактора ранжирования были классифицированы как неиспользуемые, а 988 — как устаревшие, «это означает, что 64% ​​документа либо не используются активно, либо были заменены — так что это больше похоже на ~690 потенциальных факторов ранжирования, и многие из них содержат тонкие описания».

Как отмечалось ранее, Яндекс — это не Google, и у него не такие показатели трафика, как у Google, поэтому эта утечка — не новейший ресурс №1, получивший первое место в Google. Но всегда приятно получить внутреннюю картину того, как работают некоторые поисковые системы.

В связи с недавним стремлением Google выделить контент EAT, некоторые из технических факторов ранжирования в Яндексе могут не иметь такого большого веса в Google.

«Подгоняем алгоритмы под новую реальность» Сооснователь Яндекса о монополии, Google, Украине, цензуре и роботах — Meduza поисковый гигант Яндекс не любит давать интервью СМИ, но на этой неделе он сделал исключение после недавнего урегулирования спора между Google и российской антимонопольной службой по иску, поданному Яндексом.

В беседе с корреспондентом газеты «Ведомости» Анастасией Голицыной Волож ответил на вопросы о планах «Яндекса» после победы над Google, о последствиях решения Украины запретить «Яндекс», о новых российских антитеррористических законах об Интернете и о качестве новостей «Яндекса». агрегаторный сервис. Meduza переводит самые важные фразы из интервью Воложа.

На монополию

Мы неуклонно приближаемся к созданию искусственной техники. Сегодня это нейронные сети. Завтра это будет какой-то другой алгоритм. И все это естественным образом тяготеет к централизации. Чем больше данных может изучить нейронная сеть, тем умнее она становится. Больше данных, лучшие алгоритмы, больше данных. И конечно же, вспоминая научно-фантастические книги, которые я читал в детстве, меня лично немного настораживает мысль о том, что альтернативы такой системе не будет. Может быть, мы [в Яндексе] являемся одной из необходимых альтернатив. Именно поэтому я считаю существование такой компании, как Яндекс, абсолютно необходимым.

[…]

Если бы мы не добились мирового соглашения через Антимонопольную службу, не исключаю, что Яндекс мог бы просто исчезнуть в какой-то момент. А это, мне кажется, сделало бы мир хуже.

О его личных беседах с соучредителем Google Сергеем Брином и генеральным директором Google Сундаром Пичаи

Были переговоры на всех уровнях. Прямой диалог, конечно, помог. У меня всегда было огромное профессиональное уважение к ним, и я очень рад, что мы сохранили чисто теплые отношения, построенные на общем понимании некоторых основных принципов. Я уверен, что у нас еще будет повод поговорить, потому что подобные ситуации будут в новых областях.

В службе такси Яндекса

Яндекс.Такси уже ежегодно обрабатывает более миллиарда долларов транзакций, и бизнес ежегодно растет в пять раз.

Все это, и Яндекс.Такси зародилось в 2010 году просто как небольшой эксперимент одного молодого менеджера. Его поддержали опытные коллеги, и служба постепенно складывалась — но не сразу. В 2012 году его чуть не закрыли. 

О роботах, управляющих людьми

Наши речевые технологии позволяют проверить знание языка нашими водителями. В ожидании следующего пассажира мы можем попросить водителя прочитать стихотворение вслух. Мы также можем попросить водителя пройтись вокруг своей машины и сфотографировать ее, и другая программа распознает, если она грязная.

О запрете Яндекса в Украине

Мы слышим: «Можете не волноваться — для нас построят другие подобные сервисы». Но давайте трезво посмотрим на ситуацию. Мы видим (измеряем) качество услуг на неконкурентных рынках. Через три года без конкурса специально для Украины никто ничего разрабатывать не будет. Качество абсолютно всего онлайна в Украине будет очень быстро ухудшаться, и это очень скоро начнут ощущать обычные пользователи. Не будет не только хорошего интернет-поиска, такси или карт, но и некоторых тонкостей, таких как списки шоу или расписания поездов.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *