Тем

Поисковой системой не является google: 12. Поисковой системой НЕ является: 1) Nigma2) Яндекс3) FireFox …

23.04.2023

Содержание

Не «Гуглом» единым

Что происходит на глобальном рынке интернет-поисковиков


Тройка наиболее популярных в мире поисковых систем состоит из Google, Bing и Yahoo. «Яндекс» сумел закрепиться в «бронзовых призерах» у пользователей Европы и Азии. В России он востребован почти у половины аудитории.


ГДЕ ЛЮДИ ИЩУТ ИНФОРМАЦИЮ

По данным Statcounter Global Stats на август 2021 года, поисковая система Google занимает доминирующее положение в мире с долей более 90 процентов. Второе место удерживает Bing от Microsoft, замыкает тройку Yahoo.

Российский ресурс «Яндекс» сумел закрепиться в «бронзовых призерах» у пользователей Европы и Азии. В Азии китайский ресурс Baidu оттеснил со второго места Bing, заняв почти 3% интернет-рынка. В свою очередь, «Яндекс» в этом же регионе обошел Yahoo, получив долю почти в 2% и третье место в рейтинге.

На родине «Яндекс» востребован почти у 43% аудитории

Более 54% выбирают Google, 1% – поисковик от Mail. ru Group. У Bing, Yahoo и DuckDuckGo – менее 1% российских пользователей.

АНТИМОНОПОЛЬНЫЕ МЕРЫ

Google остается безоговорочным мировым лидером, несмотря на то что в ряде регионов доминирующее положение американского IT-гиганта пытаются остановить законодательно.

Европейский союз

В ЕС антимонопольное расследование в отношении Google ведется с 2010 года. Много лет компании удавалось избегать прямых обвинений, однако в июле 2018 года Еврокомиссия оштрафовала ее на 4,34 млрд евро за ограничение выбора поисковых систем в смартфонах с мобильной операционной системой (ОС) Android, которая также принадлежит Google.

Спустя два года корпорация выполнила требование регулятора ЕС. С лета 2020 года пользователи Android могут сами решать, каким поисковиком они хотят пользоваться, хотя ранее соответствующий сервис от Google был встроен в гаджеты по умолчанию. Сейчас компания даже публикует списки самых популярных альтернативных поисковых систем в каждой из стран Европы.

Россия

В феврале 2015-го с заявлением о том, что Google запрещает предустанавливать приложения и сервисы других интернет-компаний в устройствах, работающих на базе ее ОС, в Федеральную антимонопольную службу (ФАС) обратился «Яндекс». В сентябре того же года ФАС приняла решение по этому делу в пользу российской компании. Под угрозой штрафов и после попыток обжаловать решения ведомства Google предложил ФАС мировое соглашение, которое и было заключено в апреле 2017 года.

Его суть состояла в том, что производители предназначенных для продажи в России мобильных устройств на ОС Android перестали быть связаны условием устанавливать действующий по умолчанию американский поисковый сервис. С августа 2017-го в новой версии собственного браузера на Android пользователям в России начали показывать окно выбора поисковика по умолчанию – «Яндекс», Google или Mail.ru.

К сентябрю доля поиска «Яндекса» на Android выросла.

А с 1 июля текущего года производители гаджетов должны предустанавливать в загруженный браузер по умолчанию российский поисковик. Согласно постановлению правительства РФ, есть три варианта реализации права выбора:

  • отечественный поисковик устанавливается по умолчанию с возможностью поменять настройки;
  • окно выбора с предложением нескольких систем появляется при первом запуске устройства;
  • окно выбора появляется при первом запуске предустановленных браузеров.

В 2021 году поисковой системой по умолчанию определен отобранный в декабре прошлого года «Яндекс»

Обязательная предустановка российского ПО, в том числе поисковых сервисов, стала возможной благодаря поправкам в закон «О защите прав потребителей», который был принят в 2019 году. Согласно подзаконным актам к нему, софт из стран Евразийского экономического союза должен устанавливаться на все смартфоны, планшеты, портативные и стационарные компьютеры, а также Smart TV.

Утвержденный правительством в начале этого года список обязательного ПО включает продукты «Яндекса», Mail.ru Group, «Лаборатории Касперского», «Ростелекома», «Первого канала» и других крупнейших российских интернет- и медиакомпаний.

Китай

В Поднебесной с 2003 года действует проект «Золотой щит», который блокирует доступ к американским социальным сетям и интернет-сервисам – Facebook, Google, Twitter. Впрочем, обходить ограничения можно при помощи VPN-сервисов.

Google начал работать в стране в 2006 году. При этом он согласился цензурировать поисковую выдачу в интересах правительства Китая. Однако в ее результатах компания сообщала об удаленных ссылках, что не понравилось китайским властям. Одновременно Google навлек на себя критику со стороны западных стран тем, что все-таки выполнял требования Китая по фильтрации поисковой выдачи.

В 2010 году Google ушел из страны.

Австралия

Иногда Google идет ва-банк, угрожая уйти с рынка. Так произошло в Австралии после того, как в этой стране был принят Кодекс игроков медиарынка. В нем говорится, что поисковые ресурсы должны платить СМИ за использование их контента. Перед этим Google пообещал отключить свою поисковую систему в Австралии, если законодатели примут документ.

В ответ на это премьер-министр страны Скотт Моррисон заявил, что компания Microsoft с поисковиком Bing заменит Google, в случае если последний примет решение уйти. Чиновник даже провел переговоры по данному вопросу с исполнительным директором Microsoft Сатьей Наделлой. Google, в свою очередь, обвинил Microsoft в готовности нарушить принцип открытого интернета.

YAHOO МЕНЯЕТ ВЛАДЕЛЬЦА

В августе один из крупнейших в США операторов связи Verizon закрыл сделку по продаже Yahoo, оставив себе только 10% акций. Помимо поисковика и почтового сервиса, в Yahoo входят издание TechCrunch, медийный конгломерат AOL, блог о технологиях Engadget и бренд интерактивных медиа RYOT.

Компанию приобрел фонд Apollo Global Management. Verizon, который купил Yahoo в 2015 году за $4,5 млрд, получит за нее $4,25 млрд наличными и $750 тыс. в виде привилегированных акций.

Это событие означает, что еще одна история о владении телекоммуникационным холдингом компанией «новой экономики» закончилась без успеха – синергию найти не удалось, отметил в комментарии для RSpectr аналитик ФГ «ФИНАМ» Леонид Делицын. И это несмотря на то, что Verizon – далеко не только телеком, а TMT-компания (телекоммуникации, медиа и технологии), с опытом владениям медийными активами. Компании Yahoo уже больше 25 лет. В течение долгого времени это был крупнейший в мире сайт, пока он не уступил первенство Google, а потом и другим игрокам, напоминает Л.Делицын.

«По-видимому, для Verizon наступает время сконцентрироваться на 5G. Кроме того, формально оператор заработал на купле и продаже Yahoo полмиллиарда долларов», – говорит эксперт.

Леонид Делицын, ФГ «ФИНАМ»:

– Что касается фонда прямых инвестиций Apollo Global Management, то он в прошлом уже инвестировал в медиа и зачастую выкупает компании, переживающие не самый блестящий период бизнес-цикла, чтобы найти новые драйверы роста, вернуть на восходящую траекторию и продать. Ведь еще около десять лет назад Yahoo оценивали почти вдесятеро дороже, чем сейчас, и Apollo имеет право надеяться на значительную прибыль.

УТКА ХРАНИТ КОНФИДЕНЦИАЛЬНОСТЬ

В странах СНГ основным конкурентом Google является «Яндекс», который занимает наиболее заметное положение на рынках России, Белоруссии и Казахстана.

В Китае же по понятным причинам лидирует национальный поисковик Baidu, который работает с 2000 года. Для Baidu основным рынком являются страны, где говорят на китайском языке. В этом они схожи с «Яндексом», который по большей части работает в русскоговорящих регионах. Поисковой системой Baidu пользуется в основном население материкового Китая (76,6%), Гонконга, Макао и некоторых других стран, например, Малайзии и Индонезии.

В 2015 году Baidu решил выйти на российский рынок и был готов заключить партнерское соглашение с «Яндексом». Однако этого так и не произошло.

А вот за океаном набирает силу другой конкурент Google.

В июне компания DuckDuckGo сообщила, что ее одноименный поисковик по итогам 2020 года стал вторым по популярности на мобильных устройствах в США, Канаде, Австралии и Нидерландах

Трафик сервиса за год увеличился на 55 процентов. Однако, по данным Statcounter Global Stats, DuckDuckGo остается на четвертом месте в Северной Америке.

Главным достоинством своей поисковой системы компания называет обеспечение конфиденциальности пользователей. «Мы не собираем данные наших пользователей, поэтому не можем точно сказать, сколько у нас их, но, основываясь на оценках доли рынка, количестве загрузок и национальных опросах, мы считаем, что их насчитывается от 70 млн до 100 млн», – говорится в сообщении DuckDuckGo.

Изображение: RSpectr, Freepik.com

ЕЩЕ ПО ТЕМЕ:

Google идет в угол?
Европа борется с монополией крупнейшего поисковика

Поисковые системы Интернета: Яндекс, Google, Rambler, Yahoo — информация, принципы работы

1. Введение
2. Понятие и функции поисковой системы
3. Основные характеристики поисковой системы
4. Краткая история развития поисковых систем
5. Состав и принципы работы поисковой системы
6. Заключение

1. Введение

Поисковые системы уже давно стали неотъемлемой частью российского Интернета. Поисковые системы сейчас – это огромные и сложные механизмы, представляющие собой не только инструмент поиска информации, но и заманчивые сферы для бизнеса.

Большинство пользователей поисковых систем никогда не задумывались (либо задумывались, но не нашли ответа) о принципе работы поисковых систем, о схеме обработки запросов пользователей, о том, из чего эти системы состоят и как функционируют…

Данный материал призван дать ответ на вопрос о том, как работают поисковые системы. Однако вы не найдете здесь факторов, влияющих на ранжирование документов. И тем более не стоит рассчитывать на подробное объяснение алгоритма работы Яндекса. Его, по словам

Ильи Сегаловича, директора по технологиям и разработке поисковой машины «Яндекс», можно узнать лишь «под пыткой» самого Ильи Сегаловича.

2. Понятие и функции поисковой системы

Поисковая система – это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу).

Наиболее крупные международные поисковые системы: «Google», «Yahoo», «MSN». В русском Интернете это – «Яндекс», «Рамблер», «Апорт».

Рассмотрим подробнее понятие поискового запроса на примере поисковой системы «Яндекс». Поисковый запрос должен быть сформулирован пользователем в соответствии с тем, что он хочет найти, максимально кратко и просто. Допустим, мы хотим найти информацию в «Яндексе» о том, как выбрать автомобиль. Для этого, открываем главную страницу «Яндекса», и вводим текст поискового запроса «как выбрать автомобиль». Далее, наша задача сводится к тому, чтобы открыть предоставленные по нашему запросу ссылки на источники информации в Интернет. Однако, вполне можно и не найти нужную нам информацию. Если таковое произошло, то либо нужно перефразировать свой запрос, либо в базе поисковой системе действительно нет никакой актуальной информации по нашему запросу (такое может быть при задании очень «узких» запросов, как, например «как выбрать автомобиль в Архангельске»).

Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут. А научить пользователей делать «правильные» запросы к системе, т.е. запросы, соответствующие принципам работы поисковых систем, невозможно. Поэтому разработчики создают такие алгоритмы и принципы работы поисковых систем, которые бы позволяли находить пользователям искомую ими информацию.

Это означает, поисковая система должна «думать» так же, как думает пользователь при поиске информации. Когда пользователь обращается с запросом к поисковой машине, он хочет найти то, что ему нужно, максимально быстро и просто. Получая результат, он оценивает работу системы, руководствуясь несколькими основными параметрами. Нашел ли он то, что искал? Если не нашел, то сколько раз ему пришлось перефразировать запрос, чтобы найти искомое? Насколько актуальную информацию он смог найти? Насколько быстро обрабатывала запрос поисковая машина? Насколько удобно были представлены результаты поиска? Был ли искомый результат первым или же сотым? Как много ненужного мусора было найдено наравне с полезной информацией? Найдется ли нужная информация, при обращении к поисковой системе, скажем, через неделю, или через месяц?

Для того, чтобы удовлетворить ответами все эти вопросы, разработчики поисковых машин постоянно совершенствуют алгоритмы и принципы поиска, добавляют новые функции и возможности, всячески пытаются ускорить работу системы.

3. Основные характеристики поисковой системы

Опишем основные характеристики поисковых систем:

  • Полнота

    Полнота – одна из основных характеристик поисковой системы, представляющая собой отношение количества найденных по запросу документов к общему числу документов в сети Интернет, удовлетворяющих данному запросу. К примеру, если в Интернете имеется 100 страниц, содержащих словосочетание «как выбрать автомобиль», а по соответствующему запросу было найдено всего 60 из них, то полнота поиска будет 0,6. Очевидно, что чем полнее поиск, тем меньше вероятность того, что пользователь не найдет нужный ему документ, при условии, что он вообще существует в Интернете.

  • Точность

    Точность – еще одна основная характеристика поисковой машины, которая определяется степенью соответствия найденных документов запросу пользователя. Например, если по запросу «как выбрать автомобиль» находится 100 документов, в 50 из них содержится словосочетание «как выбрать автомобиль», а в остальных просто наличествуют эти слова («как правильно выбрать магнитолу и установить в автомобиль»), то точность поиска считается равной 50/100 (=0,5). Чем точнее поиск, тем быстрее пользователь найдет нужные ему документы, тем меньше различного рода «мусора» среди них будет встречаться, тем реже найденные документы не будут соответствовать запросу.

  • Актуальность

    Актуальность – не менее важная составляющая поиска, которая характеризуется временем, проходящим с момента публикации документов в сети Интернет, до занесения их в индексную базу поисковой системы. Например, на следующий день после появления интересной новости, большое количество пользователей обратились к поисковым системам с соответствующими запросами. Объективно с момента публикации новостной информации на эту тему прошло меньше суток, однако основные документы уже были проиндексированы и доступны для поиска, благодаря существованию у крупных поисковых систем так называемой «быстрой базы», которая обновляется несколько раз в день.

  • Скорость поиска

    Скорость поиска тесно связана с его устойчивостью к нагрузкам. Например, по данным ООО «Рамблер Интернет Холдинг», на сегодняшний день в рабочие часы к поисковой машине Рамблер приходит около 60 запросов в секунду. Такая загруженность требует сокращения времени обработки отдельного запроса. Здесь интересы пользователя и поисковой системы совпадают: посетитель желает получить результаты как можно быстрее, а поисковая машина должна отрабатывать запрос максимально оперативно, чтобы не тормозить вычисление следующих запросов.

  • Наглядность

    Наглядность представления результатов является важным компонентом удобного поиска. По большинству запросов поисковая машина находит сотни, а то и тысячи документов. Вследствие нечеткости составления запросов или неточности поиска, даже первые страницы выдачи не всегда содержат только нужную информацию. Это означает, что пользователю зачастую приходится производить свой собственный поиск внутри найденного списка. Различные элементы страницы выдачи поисковой системы помогают ориентироваться в результатах поиска. Подробные пояснения по странице результатов поиска, например у «Яндекса» можно посмотреть по ссылке http:\/\/help\.yandex\.ru\/search\/?id=481937.

4. Краткая история развития поисковых систем

В начальный период развития Интернет, число его пользователей было невелико, а объем доступной информации сравнительно небольшим. В большинстве своем, доступ к сети Интернет имели лишь сотрудники научно-исследовательской сферы. В это время задача поиска информации в Интернете не была столь актуальной, как в настоящее время.

Одним из первых способов организации доступа к информационным ресурсам сети стало создание открытых каталогов сайтов, ссылки на ресурсы в которых группировались согласно тематике. Первым таким проектом стал сайт Yahoo.com, открывшийся весной 1994 года. После того, как количество сайтов в каталоге Yahoo значительно увеличилось, была добавлена возможность поиска нужной информации по каталогу. В полном смысле это еще не было поисковой системой, так как поисковая область была ограничена только ресурсами, присутствующими в каталоге, а не всеми Интернет ресурсами.

Каталоги ссылок широко использовались ранее, однако практически полностью утратили свою популярность в настоящее время. Так как даже современные, огромные по своему объему каталоги, содержат информацию лишь о ничтожно малой части сети Интернет. Самый большой каталог сети DMOZ (его еще называют Open Directory Project) содержит информацию о 5 миллионах ресурсов, тогда как база поисковой системы Google состоит из более чем 8 миллиардов документов.

Первой полноценной поисковой системой стал проект WebCrawler, вышедший в свет в 1994 году.

В 1995 году появились поисковые системы Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в сети Интернет.

В 1997 году Сергей Брин и Ларри Пейдж создали поисковую машину Google в рамках исследовательского проекта в Стэндфордском университете. В настоящий момент Google –самая популярная поисковая система в мире!

В сентябре 1997 года была официально анонсирована поисковая система Yandex, являющаяся самой популярной в русскоязычном Интернете.

В настоящее время существуют три основные поисковые системы (международные) – Google, Yahoo и MSN, имеющие собственные базы и алгоритмы поиска. Большинство остальных поисковых систем (коих насчитывается большое количество) использует в том или ином виде результаты трех перечисленных. Например, поиск AOL (search.aol.com) использует базу Google, а AltaVista, Lycos и AllTheWeb – базу Yahoo. 

5. Состав и принципы работы поисковой системы

В России основной поисковой системой является «Яндекс», далее – Rambler.ru, Google.ru, Aport.ru, Mail.ru. Причем, на данный момент, Mail.ru использует механизм и базу поиска «Яндекса».

Практически все крупные поисковые системы имеют свою собственную структуру, отличную от других. Однако можно выделить общие для всех поисковых машин основные компоненты. Различия в структуре могут быть лишь в виде реализации механизмов взаимодействия этих компонентов.

Модуль индексирования

Модуль индексирования состоит из трех вспомогательных программ (роботов):

Spider (паук) – программа, предназначенная для скачивания веб-страниц. «Паук» обеспечивает скачивание страницы и извлекает все внутренние ссылки с этой страницы. Скачивается html-код каждой страницы. Для скачивания страниц роботы используют протоколы HTTP. Работает «паук» следующим образом. Робот на сервер передает запрос “get/path/document” и некоторые другие команды HTTP-запроса. В ответ робот получает текстовый поток, содержащий служебную информацию и непосредственно сам документ.

Ссылки извлекаются из тэгов a, area, base, frame, frameset, и др. Наряду со ссылками, многими роботами обрабатываются редиректы (перенаправления). Каждая скачанная страница сохраняется в следующем формате:

  • URL страницы
  • дата, когда страница была скачана
  • http-заголовок ответа сервера
  • тело страницы (html-код)

Crawler («путешествующий» паук) – программа, которая автоматически проходит по всем ссылкам, найденным на странице. Выделяет все ссылки, присутствующие на странице. Его задача — определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Crawler, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.

Indexer (робот- индексатор) – программа, которая анализирует веб-страницы, скаченные пауками. Индексатор разбирает страницу на составные части и анализирует их, применяя собственные лексические и морфологические алгоритмы. Анализу подвергаются различные элементы страницы, такие как текст, заголовки, ссылки структурные и стилевые особенности, специальные служебные html-теги и т.д.

Таким образом, модуль индексирования позволяет обходить по ссылкам заданное множество ресурсов, скачивать встречающиеся страницы, извлекать ссылки на новые страницы из получаемых документов и производить полный анализ этих документов.

База данных

База данных, или индекс поисковой системы — это система хранения данных, информационный массив, в котором хранятся специальным образом преобразованные параметры всех скачанных и обработанных модулем индексирования документов.

Поисковый сервер

Поисковый сервер является важнейшим элементом всей системы, так как от алгоритмов, которые лежат в основе ее функционирования, напрямую зависит качество и скорость поиска.

Поисковый сервер работает следующим образом:

  • Полученный от пользователя запрос подвергается морфологическому анализу. Генерируется информационное окружение каждого документа, содержащегося в базе (которое и будет впоследствии отображено в виде сниппета, то есть соответствующей запросу текстовой информации на странице выдачи результатов поиска).
  • Полученные данные передаются в качестве входных параметров специальному модулю ранжирования. Происходит обработка данных по всем документам, в результате чего, для каждого документа рассчитывается собственный рейтинг, характеризующий релевантность запроса, введенного пользователем, и различных составляющих этого документа, хранящихся в индексе поисковой системы.
  • В зависимости от выбора пользователя этот рейтинг может быть скорректирован дополнительными условиями (например, так называемый «расширенный поиск»).
  • Далее генерируется сниппет, то есть, для каждого найденного документа из таблицы документов извлекаются заголовок, краткая аннотация, наиболее соответствующая запросу и ссылка на сам документ, причем найденные слова подсвечиваются.
  • Полученные результаты поиска передаются пользователю в виде SERP (Search Engine Result Page) – страницы выдачи поисковых результатов.

Как видно, все эти компоненты тесно связаны друг с другом и работают во взаимодействии, образовывая четкий, достаточно сложный механизм работы поисковой системы, требующий огромных затрат ресурсов.

По информации ООО «Рамблер Интернет Холдинг» обработка поискового запроса в системе «Рамблер» происходит, так, как это изображено на рисунке.

Запрос поступает в поисковую систему через маршрутизатор Cisco 6000 series. Cisco передает его наименее загруженной машине первого уровня — frontend (1.1 — 1.3, на рис. машине 1.3). Frontend, в свою очередь, отправляет запрос дальше, на один из восьми proxy-серверов, также выбирая наиболее свободный сервер (2. 1 — 2.8, на рис. машине 2.2). Одновременно frontend отправляет запрос на машины, осуществляющие поиск по товарам (3.1 — 3.2, на рис. машине 3.1) и по базе Тор 100 (4.1 — 4.2, на рис. машине 4.1). На proxy проводится поиск по ссылочному индексу, и его результаты вместе с поисковым запросом передаются на машины, которые содержат основную индексную базу, — backends (5.1.х — 5.7.х, на рис. машинам 5.1.2, 5.2.11, 5.3.1 и т.д.) Та же информация отправляется на машины с «быстрой базой» (6.1 — 6.2).

На текущий момент в поиск включено 77 backend’ов. Они сгруппированы по 11 машин, и каждая группа содержит копию одной из частей поискового индекса. Таким образом, информация о сайтах, условно входящих в красный сектор Интернета, находится на backend’ах первой группы (5.1.1 — 5.1.11 на рис), оранжевый сектор — на backend’ах второй группы (5.2.1 — 5.2.11) и т.д. Proxy-сервер выбирает наименее загруженный backend в каждой группе машин и отправляет на него поисковый запрос с результатами ссылочного поиска. На backend’ах осуществляется поиск по частям индексной базы и ранжирование с учетом результатов поиска по ссылочному индексу. При ранжировании для всех найденных документов высчитываются веса по конкретному запросу.

После того, как запрос обработан на backend’ах, информация о результатах и ранжировании отдается обратно на proxy-сервер. Туда же поступают отсортированные результаты с машин «быстрой базы». Proxy интегрирует данные, полученные с восьми машин: клеит дубли, объединяет зеркала сайтов, переранжирует документы в общий список по весам, рассчитанным на backend’ах. Так, первым в списке найденного может быть документ с машины 5.3.1, вторым и третьим – с 6.1, четвертым — с 5.5.2 и т.д. На proxy-сервере также реализуется построение цитат к документам и подсветка слов запроса в тексте. Полученные результаты отдаются на frontend.

Помимо информации с proxy-сервера, frontend получает результаты из поиска по товарам и из базы Тор 100, отсортированные, с цитатами и подсветкой слов запроса. Frontend осуществляет окончательное объединение результатов, генерирует html со списком найденного, вставляет баннеры и перевязки (ссылки на различные разделы Рамблера) и отдает html Cisco, который маршрутизирует информацию пользователю.

При написании мастер-класса были использованы материалы и данные ООО «Рамблер Интернет Холдинг», RuSeo.info

6. Заключение

Теперь подытожим все вышесказанное.

  • Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут.
  • Основные характеристики поисковых систем:
    1. Полнота
    2. Точность
    3. Актуальность
    4. Скорость поиска
    5. Наглядность
  • Первой полноценной поисковой системой стал проект WebCrawler, вышедший в свет в 1994 году.
  • В состав поисковой системы входят компоненты:
    1. Модуль индексирования
    2. База данных
    3. Поисковый сервер

Надеемся, наш материал позволит вам поближе познакомиться с понятием ПС, лучше узнать основные функции, характеристики и принцип работы поисковых систем.

11 Ориентированные на конфиденциальность поисковые системы, альтернативные Google

Ребекка Лью

Маркетолог и писатель. Пристрастие к словам, канцелярским принадлежностям и изучению новых мест пешком.

СТАТИЯ СТАТИСТВА
  • Ежемесячный трафик 8,154

  • Связывание веб -сайтов 247

  • твиты 102

. Из Contlactor. содержание. Как правило, чем больше веб-сайтов ссылаются на вас, тем выше ваш рейтинг в Google.

Показывает расчетный месячный поисковый трафик этой статьи по данным Ahrefs. Фактический поисковый трафик (по данным Google Analytics) обычно в 3-5 раз больше.

Сколько раз этой статьей поделились в Твиттере.

Поделитесь этой статьей
Получите лучший маркетинговый контент недели

Подписка по электронной почте

Подписка

Содержание

    Альтернативы Google есть везде, но так ли они хороши?

    Чтобы ответить на этот вопрос, я покопался в нескольких популярных альтернативных поисковых системах в течение дня или двух и использовал их в своей повседневной работе.

    Моим главным критерием оценки было то, как каждая поисковая система справилась со своими обязательствами по защите пользовательских данных и конфиденциальности. Here are the 11 that got my approval:

    1. Startpage
    2. DuckDuckGo
    3. Brave Search
    4. Swisscows
    5. Search Encrypt
    6. OneSearch
    7. MetaGer
    8. Mojeek
    9. Qwant
    10. Ecosia
    11. You.com

    1. Стартовая страница

    Стартовая страница фактически Google без отслеживания. И по этой причине он занимает первое место.

    По данным поисковой системы в Нидерландах, ваши запросы анонимизируются до того, как результаты поиска будут извлечены из Google. Это означает, что вся идентифицирующая информация скрыта, включая ваш IP-адрес. Отслеживающие файлы cookie также не используются.

    Стартовая страница также соответствует GDPR, регламенту Европейского Союза, который защищает данные пользователей. Тем не менее, вы должны знать, что страна является частью разведывательного альянса «Девять глаз», который делится данными массовой слежки с восемью странами.

    Обзор функций

    Функция анонимного просмотра позволяет анонимно посещать веб-сайты из результатов поиска как на компьютере, так и на мобильном устройстве. По сути, он ведет себя как (бесплатный) VPN.

    2. DuckDuckGo

    DuckDuckGo — это, безусловно, самая известная частная поисковая система, которая является полной противоположностью Google, когда речь идет о конфиденциальности пользователей. (Хотя это монетизируется за счет пользовательских поисков.)

    Ваша история поиска сохраняется неидентифицируемым образом, то есть отслеживающие файлы cookie и личные идентификаторы, такие как IP-адреса, не сохраняются.

    Это огромный плюс для нас, несмотря на то, что результаты получены из более чем 400 источников, включая собственный поисковый робот (DuckDuckBot), краудсорсинговые сайты, такие как Википедия, и таких партнеров, как Bing и Yahoo.

    Чтобы проверить его эффективность, я вставил одни и те же ключевые слова в Google и DuckDuckGo — от «обновления covid-19» до «kaws marina bay». Результаты часто были похожи. Я обнаружил, что это относится и к экстренным новостям.

    Возможным недостатком является то, что DuckDuckGo базируется в США и, соответственно, является частью разведывательного альянса Five Eyes, который часто собирает данные массового наблюдения от интернет-компаний.

    Обзор функций

    Функция «Челка» DuckDuckGo позволяет напрямую перейти к результатам поиска на других сайтах. Например, если ввести «!w» и ключевое слово (например, !w singapore), вы попадете прямо на страницу Википедии для Сингапура.

    3. Brave Search

    Мне нравится Brave Search за то, что он фокусируется на беспристрастных результатах, которые он извлекает из собственного индекса. Компания сделала смелый шаг, отказавшись от поисковой выдачи Google в октябре 2021 года9.0003

    При поиске как вечнозеленого контента, так и срочных новостей я обнаружил, что результаты достаточно похожи на результаты Google — при условии, что вы разрешаете анонимные локальные результаты.

    Для большей конфиденциальности вы можете отключить этот переключатель и выполнять поиск вручную, например, «чем заняться в [место]».

    Как и в других поисковых системах здесь нет профилирования пользователей и персонализированной или целевой рекламы.

    Поисковая система является частью Brave Software, соучредителями которой являются Брендан Эйх (создатель JavaScript и соучредитель браузера Mozilla Firefox) и Брайан Бонди (бывший старший инженер по платформам в Mozilla).

    Обзор функций

    У Brave есть панели знаний для быстрых ответов на животрепещущие вопросы, как у Google.

    4. Swisscows

    Swisscows – это швейцарская поисковая система, у которой есть собственный индекс для запросов на немецком языке. Для всех других языков результаты извлекаются из Bing. Но это не проблема, учитывая, что все поисковые запросы лишены личных идентификаторов.

    Поисковая система также не использует отслеживающие файлы cookie и геотаргетинг.

    Хотя результаты поиска Swisscows, безусловно, не соответствуют результатам Google, мне нравится, насколько удобна для семьи поисковая система: она автоматически отфильтровывает результаты поиска с насилием и порнографией с помощью принудительной функции.

    Что касается конфиденциальности, Швейцария не является частью разведывательного альянса, но у нее есть Договор о взаимной правовой помощи с США

    В центре внимания

    Swisscows предлагает «семантические карты», которые помогут вам уточнить результаты поиска.

    5. Search Encrypt

    Search Encrypt источники для его результатов от партнеров по контенту и поисковых систем (включая Google, Bing и Yahoo), хотя и безопасным для конфиденциальности способом.

    Как и другие поисковые системы в этом списке, Search Encrypt анонимизирует поисковые запросы, не сохраняет журналы серверов или IP-адреса, а также не хранит отслеживающие файлы cookie.

    Когда дело доходит до поиска, ваши термины шифруются локально перед отправкой на серверы. Через 30 минут бездействия ваша история просмотров будет удалена.

    Однако Search Encrypt сохраняет ваши поисковые данные (хотя и без ваших личных идентификаторов) для повышения производительности своего продукта.

    Я обнаружил, что его результаты поиска сопоставимы с результатами Ecosia. Таким образом, несмотря на то, что Search Encrypt не совсем соответствует DuckDuckGo и Startpage, он достаточно надежен, чтобы его можно было использовать для всех видов запросов — будь то навигационные, транзакционные или информационные.

    Обзор функций

    Если вы недовольны результатами или хотите провести быстрое сравнение, это легко сделать с помощью функции «повторить поиск», расположенной вверху страницы.

    6. OneSearch

    Компания OneSearch, принадлежащая материнской компании Yahoo, Verizon Media, утверждает, что является поисковой системой, ориентированной на конфиденциальность, а результаты поиска извлекаются из Bing.

    Файлы cookie не сохраняются, и рекламодателям не передаются идентифицируемые личные данные. Изучив также его политику конфиденциальности, я обнаружил, что поисковая система довольно безопасна.

    С другой стороны, OneSearch формирует ваш профиль на основе поисковых запросов и вашего неточного местоположения во время поиска. Таким образом, вы можете получать контекстную рекламу или обоснованные предположения о ваших интересах на основе ключевых слов поиска. Однако нет личного профилирования или ретаргетинга.

    Что мне нравится, так это небольшие дополнения: функция безопасного поиска, возможность указать более конкретное местоположение и параметр «Расширенный режим конфиденциальности» (подробнее ниже).

    Обзор функций

    Включите «Расширенный режим конфиденциальности», чтобы зашифровать условия поиска и поисковые URL-адреса, которые скроют ваш поисковый контент от третьих лиц.

    7. MetaGer

    MetaGer — немецкая метапоисковая система с открытым исходным кодом. Как и Ecosia, его серверы работают на возобновляемых источниках энергии.

    Результаты взяты из Scopia, Bing, OneNewspage и OneNewspage (Video), поэтому они довольно своевременны. Вы также можете отменить выбор используемых поисковых систем или создать черный список веб-сайтов в настройках.

    Я ценю прозрачность MetaGer в обработке пользовательской информации, от запросов до карт. Тем не менее, не обошлось без предостережений: поисковая система хранит ваш полный IP-адрес в течение 96 часов, а ваше имя и адрес электронной почты сохраняются, если вы заполните контактную форму.

    Однако он использует анонимный прокси-сервер, который гарантирует, что вы сохраните полный контроль над своими данными.

    Обзор функций

    Поле «Знаете ли вы» (справа от результатов поиска) предлагает лакомые кусочки о MetaGer и о том, как уточнить результаты поиска. Вы также можете нажать на текст, чтобы просмотреть полный список советов.

    8. Mojeek

    Mojeek – поисковая система на основе сканера с собственным поисковым индексом, насчитывающим более 4 миллиардов страниц. Это делает его отличным для объективной информации. Но это также означает, что результаты могут быть ограничены, поскольку он не извлекает результаты из других поисковых систем.

    Тем не менее, мне нравится эта поисковая система за ее прямолинейную политику запрета отслеживания. Ваши личные данные также никогда не будут проданы или распространены, что является огромным плюсом в наших книгах. Если вы заполнили контактную форму, вы также можете запросить удаление информации в соответствии с GDPR.

    При этом Mojeek — это , базирующийся в Великобритании, который является частью разведывательного альянса Five Eyes, как и DuckDuckGo.

    Обзор функций

    Функция классификации поиска на основе эмоций позволяет ввести ключевое слово и выполнять поиск по эмоциям.

    9. Qwant

    Qwant — парижская поисковая система, результаты поиска которой основаны на Bing и собственном поисковом роботе. Он полностью доступен более чем в 30 странах, но, увы, не в Сингапуре.

    При последней проверке мой коллега SQ обнаружил, что точность результатов поиска достаточно приличная. Но не ждите ответов по конкретному местоположению, так как Qwant не отслеживает вашу геолокацию.

    Он также не собирает данные и не использует отслеживающие файлы cookie. Но он сохраняет ваш IP-адрес для целей обнаружения мошенничества. Если вы предпочитаете полную анонимность, Qwant предлагает использовать VPN или службу ретрансляции TOR.

    Как и Startpage, Qwant предлагает защиту GDPR. Однако Франция является частью разведывательного альянса «Девять глаз».

    Обзор функций

    Существуют «ярлыки поиска», обеспечивающие быстрый доступ к определенным веб-сайтам. Например, использование термина «книги» дает результаты из категории книг Amazon.

    Посмотреть список ярлыков здесь.

    10. Ecosia

    Знаете ли вы, что каждое действие, которое вы выполняете на своем цифровом устройстве, выделяет углекислый газ? И Google играет в этом большую роль: на его долю приходится около 40% углеродного следа Интернета.

    Чтобы противодействовать этому, частная поисковая система Ecosia жертвует 80% своей прибыли на проекты по посадке деревьев, или примерно одно дерево на каждые 45 выполненных поисков. Компания также построила солнечную электростанцию, чтобы ее серверы могли работать на чистой энергии.

    В целом, я нашел его результаты поиска достаточно близкими к Google.

    Ecosia не является полностью частной. Он собирает данные поиска и личную информацию, которые становятся анонимными только через семь дней. Но мы считаем, что использование поисковой системы — достойный компромисс, поскольку она направлена ​​на борьбу с изменением климата.

    Обзор функций

    Количество ваших поисковых запросов отображается на табло (если вы не решите очистить файлы cookie браузера), что позволяет отслеживать ваше воздействие на окружающую среду.

    11. You.com

    Завершает список You.com. Поисковая система на этапе бета-тестирования предлагает широкие возможности настройки: результаты поиска отображаются на одной веб-странице, но разделены на несколько разделов, которые вы можете изменить в соответствии со своими предпочтениями.

    Для дальнейшей настройки результатов зарегистрируйте учетную запись, чтобы добавлять и сохранять приложения на панели инструментов (подробнее см. в разделе «Обзор функций» ниже). Эти приложения, по сути, являются вашими предпочтительными источниками информации и будут отображаться вместе с результатами поиска.

    Хотя это удобная функция, она также означает, что ваши собственные файлы cookie будут храниться в целях персонализации. Кроме того, вы можете полностью исключить стороннее отслеживание файлов cookie, просматривая сайты в частном порядке или через VPN.

    Я обнаружил, что результаты поиска по различным ключевым словам (таким как «ahrefs» и «covid-19 singapore daily case») сопоставимы с результатами Google. И хотя некоторые результаты получены от Microsoft, You.com утверждает, что пользовательские данные хранятся в безопасности и не продаются рекламодателям. Компания также является углеродно-нейтральной.

    Обзор функций

    Персонализируйте результаты поиска, добавляя приложения в свою ленту — есть множество категорий на выбор. Вы даже можете добавить приложения для разработчиков, такие как Github, на свою панель инструментов.

    Заключительные мысли

    Несмотря на то, что Google доминирует на мировом рынке поисковых систем, у него была своя доля критики: проблемы антимонопольного законодательства, создание пузыря фильтров, нарушение конфиденциальности пользователей и многое другое.

    Для пользователей альтернативные поисковые системы могут быть одним из обходных путей. Но не верьте нам на слово; попробуйте те из этого списка, чтобы решить, что лучше всего подходит для вас.

    Есть вопросы или комментарии? Отправьте мне сообщение в Твиттере.

    Топ-5 инструментов SEO от Google

    Google предлагает постоянно обновляемый набор инструментов, полезных для SEO.

    Эти инструменты помогают издателям понять, почему страница неэффективна, и дают им конкретные советы по улучшению производительности веб-страницы для повышения рейтинга.

    Вот пять лучших SEO-инструментов Google.

    1. Lighthouse

    Lighthouse — это инструмент для повышения производительности веб-страниц, встроенный в каждый браузер на основе Chrome. Инструмент доступен на панели Chrome Dev Tools.

    Несколько способов доступа к инструменту Google Lighthouse

    • На компьютере с Windows нажмите функциональную кнопку F12.
    • В Windows или Mac щелкните правой кнопкой мыши страницу и выберите «Проверить», затем перейдите на вкладку «Маяк».
    • На Mac нажмите: Command+Option+C
    • В Windows, Linux и Chrome OS нажмите: Control+Shift+C
    • В Chrome щелкните меню из трех точек в правом верхнем углу, затем Дополнительные инструменты > Инструменты разработчика

    Скриншот из поиска Google, август 2021 г.

    Скриншот из Chrome Dev Tools, август 2021 г.

    Lighthouse предлагает 5 категорий отзывов

    В настоящее время он предоставляет пять категорий отзывов об эффективности SEO:

    1. Производительность.
    2. Прогрессивное веб-приложение.
    3. Лучшие практики.
    4. Доступность.
    5. SEO.

    Хотя доступность не является строго связанным с SEO показателем, она связана с удобством работы посетителей сайта с ограниченными возможностями.

    Использование отзывов из этих пяти категорий поможет улучшить видимость большинства веб-страниц при поиске.

    Раздел SEO в Lighthouse предоставляет 10 отзывов о факторах, важных для Google.

    Некоторые показатели Chrome Lighthouse сообщает о

    • метатеге области просмотра.
    • Элемент заголовка.
    • Мета-описание.
    • Код состояния HTTP.
    • Описательный текст в ссылках.
    • Статус страницы для успешного сканирования и индексирования.
    • Проверяет Hreflang.
    • Проверяет rel=canonical.
    • Проверяет удобство для мобильных устройств.
    • Проверяет удобочитаемость шрифта для мобильных устройств.
    • Проверяет мобильные цели касания.
    • Проверяет, не пропускает ли документ плагины браузера для просмотра.
    • Проверяет сканирование и индексирование.
    • Проверяет файл robots.txt.
    • Проверяет, отправляет ли страница успешный код состояния HTTP.

    Почему вам следует использовать SEO-инструмент Lighthouse

    Не буду отрицать, Lighthouse — это легкий инструмент для просмотра сайтов.

    Но это важный инструмент проверки сайта, потому что он представляет мнение Google о 10 показателях, на которые вам следует обратить внимание.

    Если Google считает, что эти метрики важны, то и вам следует.

    Чтобы максимально эффективно использовать этот инструмент, обязательно ознакомьтесь с Техническим руководством SEO по показателям производительности Lighthouse.

    2. Test My Site

    Инструмент аудита Test My Site от Google предлагает две метрики:

    1. Расчетное время загрузки в мобильной сети 4G.
    2. Рекомендации по ускорению работы сайта.

    Скриншот Test My Site, август 2021 г.

    Это хороший инструмент для получения быстрого снимка состояния скорости веб-сайта.

    Это хорошая отправная точка для получения общей картины мобильной оптимизации.

    Инструмент также предлагает отправить по электронной почте полный отчет, содержащий предложения по ускорению тестируемой веб-страницы.

    Зачем использовать Test My Site

    Аналогичную информацию можно получить с помощью Page Speed ​​Insights.

    Но инструмент Test My Site предоставляет информацию в простом для понимания виде, который позволяет заинтересованным лицам, не являющимся разработчиками, понять, что может быть не так с производительностью мобильного сайта.

    Тем не менее, разработчикам также полезно получить краткий обзор.

    Если вам нужны подробные сведения о том, что нужно исправить, перейдите на Google Page Speed ​​Insights.

    3. Page Speed ​​Insights

    Page Speed ​​Insights — это инструмент, который предоставляет лабораторные оценки производительности Core Web Vitals.

    Core Web Vitals — это важные показатели, созданные Google для представления пользовательского опыта на веб-странице.

    Эта информация важна, потому что исправление выделенных проблем улучшит SEO, конверсию продаж, количество кликов по объявлениям и (в случае успешного устранения узких мест в производительности) немного повысит фактор ранжирования.

    Этот онлайн-инструмент предоставляет подробные сведения о причинах замедления работы и дает рекомендации по устранению проблем.

    Он сообщает, какие скрипты и таблицы стилей замедляют работу сайта, какие изображения слишком велики, и предлагает множество других советов по ускорению работы затронутых веб-страниц.

    Зачем использовать Page Speed ​​Insights

    Page Speed ​​Insights не только предлагает полезные решения для скрытых технических проблем, влияющих на скорость страницы, но также является ресурсом для изучения этих проблем.

    Каждая выделенная проблема связана со страницей Google Developers, которая предлагает более подробную справочную информацию и объяснение того, как решить проблемы.

    4. Проверка безопасного просмотра

    Каждый день Google сканирует миллиарды страниц для проверки на наличие вредоносных программ. Этот инструмент сообщает, есть ли на сайте какие-либо вредоносные программы.

    Инструмент также предоставляет дату последней проверки сайта на наличие вредоносных программ.

    Некоторые сайты проверяются чаще, чем другие.

    Почему следует использовать инструмент проверки безопасного просмотра

    Многие люди не считают безопасность веб-сайта проблемой SEO.

    Но безопасность веб-сайта быстро становится проблемой SEO, когда Google начинает удалять URL-адреса из своего индекса, потому что сайт взломан.

    Вот почему безопасность сайта следует рассматривать как часть SEO. Отсутствие защиты сайта может серьезно повлиять на его видимость в поиске.

    5. Google Trends

    Google Trends предоставляет информацию о популярности ключевых слов, а также сегментирует информацию по времени и географическому положению.

    Сегмент времени может дать вам представление о том, как времена года могут влиять на ключевые слова. Он также может показать вам, теряет ли ключевое слово популярность.

    Если вы видите тенденцию к снижению ключевого слова, это может указывать на то, что продукт или тенденция приводят к тому, что ищущие теряют интерес к этому поиску.

    Почему вы должны использовать Google Trends

    Google Trends также важен для проведения конкурентных исследований. Он показывает, как часто люди ищут в Google название бренда конкурента.

    Линия тренда по времени покажет вам, насколько устойчив этот тренд – идет ли он вверх, вниз или устойчиво.

    Очевидно, что линия тренда конкурента, направленная вниз, — это хорошо. Линия тренда, идущая вверх, — это плохо.

    Устойчивая линия тренда (наиболее распространенная) означает, что у конкурента дела идут хорошо, и вам придется определить его слабые стороны и сделать их своими сильными сторонами — среди множества соображений.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *