Темы

Яндекс сша поисковая система – Поисковые системы мира: поисковики США

22.12.2017

Какие поисковики используют американцы

Популярностью в Соединенных Штатах пользуются поисковые системы известные на весь мир.

Google – берет 78% всей аудитории юзеров.

Являясь ведущим поисковиком в большинстве государств планеты, у себя на родине, в США он также завоевал лидерство. Поскольку, каждый пользователь, невзирая на территорию своего проживания, останется довольным скоростью работы поиска, высокой релевантностью поискового материала и значительным объемом поисковых данных. Кроме того, поисковый механизм — это еще не все, чем может заинтересовать интернет-юзеров Google.

Процентное использование поисковиков в США

Просто зарегистрировав аккаунт в этой поисковой системе, владелец учетной записи получает возможность доступа к ряду других сервисов, например, электронный почтовый ящик Gmail (к слову, признанный одним из наиболее защищенных от вредоносных рассылок и взлома), глобальная социальная сеть Google+, масштабный видеохостинг Youtube, работа с документами, заметками, планирование и много другого. Небольшие услуги, типа набора инструментов для вебмастеров, онлайн-переводчика и подобные также присутствуют. Добраться к ним можно непосредственно со стартовой страницы поискового механизма.

Bing – 12% аудитории американских интернет пользователей.

Поисковая система от крупнейшего производителя операционных систем и другого программного обеспечения Microsoft (в былые годы имела названия MSN Search, Windows Live Search). Завоевала второе место по обработке интернет трафика в США. Местные юзеры поисковика имеют доступ к таким эксклюзивным возможностям: получение уточняющих данных в запросах по некоторым специальным категориям, предварительный просмотр видеороликов, вспомогательная информация по всем результатам поисковой выдачи и другие новшества.

Невзирая на то, что Bing сегодня переживает не самые лучшие времена, работа в сфере улучшения его производительности и работа над движком Kumo не останавливаются. Следует также сказать, что до осени 2013 года сервис пребывал на стадии тестирования, в Beta режиме. Поэтому, со счетов данный механизм списывать очень рано. Google также получил признание далеко не в первые два-три года существования.

Бинг — второй по популярности поисковик в США

Yahoo! – 8% американского интернет трафика.

Старт работы в США произошел еще в далеком 1994 году и был презентован общественности, как обычный каталог сайтов. Вырос до поисковой системы портал значительно позже, к тому же на начальном этапе вообще не применял какие-то свои разработки, а заимствовал продукты от Google. И лишь с 2004 года был произведен переход на движок своего производства.

На данный момент, невзирая на серьезное отставание от своих ближайших основных конкурентов – Google и Bing, поисковик Yahoo! не прекращает развивать собственные предложения, внедрять инновационные решения и выкупать многообещающие стартапы. К примеру, они произвели большую доработку сервиса электронной почты (Yahoo! Mail), что дало возможность повысить число посетителей на 10%. Помимо этого, компания демонстрирует хорошие результаты на рынке мобильных технологий.

Яху — имеет до 10% американской аудитории

По данным исследования, с мобильных устройств на стартовую страницу Yahoo! переходит более 200 миллионов человек каждый день.

Вот так распределись первые три места в рейтинге поисковых систем США. В общем на них приходится порядка 98% общего поискового трафика Соединенных Штатов. Другие проекты, типа Aol.com и наподобие, получили меньше 1% внимания. Качество поисковых услуг и размер поисковой базы у них очень отстает от лидеров, так что какого-то смысла рассматривать их подробно нет.

usa-24.ru

поисковики, поисковые системы интернета, интернет, раскрутка сайта

Поиск информации в интернете, справочники.

Российские и русскоязычные поисковые системы.

Yandex.ru Яндекс, поисковая система России, мегапортал.

Google.ru Гугл, поисковая система США, мегапортал.

Mail.ru   Мейл ру, почта, поисковая система, мегапортал.

Rambler.ru Рамблер, поисковая система, мегапортал.

Bing.com Бинг ком, поисковая система США Майкрософт.

D DuckDuckGo.com Дак Дак Го ком, минимум слежки.


Sputnik.ru Спутник, государственная поисковая система.


Iskomoe.ru Искомое, православная поисковая форма.

 

Каталоги и Рейтинги сайтов.

Radar.Yandex.ru Яндекс Радар, рейтинг сайтов России.

LiveInternet.ru Лив Интернет, рейтинг сайтов России.

Top.Mail.ru Топ Мейл ру, каталог и рейтинг сайтов.

Top100.Rambler.ru Рамблер Топ 100 рейтинг сайтов.

HotLog.ru/top Хот Лог ру, рейтинг сайтов России.

 NoFollow.ru НоФоллоу, поисковый каталог сайтов.


Hristianstvo.ru Христианство, каталог христианских сайтов.


Alexa.com Алекса ком, всемирный рейтинг сайтов.

 

Телефонные справочники онлайн.

AllInform.ru Алл Информ, телефонный справочник.

Bizly.ru  Бизли, Россия, Украина, Белоруссия, Казахстан.

Cataloxy.ru Каталоксы, бизнес каталог компаний.

E-Adres.ru Евро Адрес, справочник компаний России.

GMStar.ru Дж М Стар, справочник организаций.

  J Sprav.ru Жи Справ ру, организации России и СНГ.

K   KtoGdeEst.com Кто Где Есть ком, Москва.

Spr.ru   Спр ру, справочник по предприятиям.

Yell.ru   Йелл ру, справочник компаний с отзывами.

YPag.ru ЙПаг ру, бизнес справочник по СНГ.

 

 

Англоязычные поисковые системы.

Aol.com Аол | Entireweb.com Энтиревеб |

Gigablast.com Гигабласт | Info.com Инфо ком |

InfoSpace.com Инфо Спейс | Search.com Сеарч ком |

WebSearch.com Веб Сеарч | Yahoo.com Яху |

Yippy.com Йиппи

 

поисковые системы и сайты интернета, поисковики для раскрутки и продвижения сайта.

Поисковая система интернета – специализированный сайт для пользователей (лицо поискового сайта) , программа-паук для поиска информации в сети Интернет, располагается на сервере (отдельном компьютере, подключенном к интернету), база данных собранной информации о сайтах (кэшированные копии сайтов), а так же комплекс программ по сортировке и ранжированию результатов поиска (движок по выдаче результатов поиска пользователям). Многие поисковые системы ищут текст, изображения, видео и другие типы файлов.

Алгоритм поиска по всемирной паутине World Wide Web Crawler и рейтинг выдачи результатов поиска SERP обычно являются запатентованными технологиями и коммерческой тайной, строго охраняются от конкурентов и раскрутчиков сайтов.

читать далее

Мета поисковая система – её результат поисковой выдачи пользователю основан на компоновке выдачи сразу из нескольких поисковых систем. Рейтинг сайтов интернета строится на основе количества посетителей, повторных визитов, количества просмотренных страниц и времени провождения пользователя на сайте. Каталог сайтов или справочник обычно является структурированной базой данных о сайтах с системой поиска по каталогу, информация собирается и корректируется редакторами.

Одной из главных задач при раскрутке сайта является повышение его ранжирования по поисковым запросам и выход на первые места при продвижении сайта в поисковых системах, попадание сайта в топ yandex ( основной поисковой системе России ) и в топ google ( основной поисковой системе мира ). При продвижении сайта не стоит забывать, особенно на первых порах раскрутки сайта и о менее раскрученных поисковых системах, серьёзных рейтингах сайтов и уважаемых каталогах сайтов, как в сегменте ру или страны таргетинга, так ком и других международных доменов. Этот раздел особенно важен при раскрутке сайта, тут дан

список поисковых систем интернета, где можно проверить видимость сайта и место сайта на страницах выдачи поисковых систем. Нами собраны самые лучшие поисковики, как это было видно из опыта работы в интернете, но мнение субъективно.

Раскрутка сайта – это главная цель данного портала, просто захотелось сделать удобным вход в интернет для людей занимающихся раскруткой сайтов, как рекламой в гугл адвордс, в бегун, яндекс директ и прочих компаниях, так и продвижение сайта в поисковых системах, социальных сетях, на новостных сайтах, оптимизацией сайтов под гугл, яндекс и другие поисковые системы, а так же для желающих легально заработать в интернете

на реальных проектах без дряни.

вот поисковая система яндекс, гугл, мейл ру, рамблер, нигма, спутник, бинг, вебальта, метабот, а так же поисковые сайты интернета – хот лог, ли ру, опен стат, рамблер топ, яка яндекс каталог, алекса и дмоз, и другие интернет поисковики типа евро адрес и бтк онлайн.

entershift.ru

«Яндекс» пришел в Америку — CNews

, Текст: Александр Левашов

Компания «Яндекс» объявила об открытии офиса в США. Его возглавил Виш Махиджани, ранее руководивший поиском в компании Yahoo. Эксперты считают, что таким образом «Яндекс» намерен стать ближе к инвесторам, которые пока боятся русского поисковика.

В настоящее время физически Yandex Laboratories — такое название будет носить американский офис «Яндекса» — еще не существует. Выбирается его месторасположение. Известно лишь, что офис разместится в Силиконовой долине, в районе Сан-Франциско.

До конца 2008 г. «Яндекс» планирует трудоустроить в США около 10 человек. «Хорошие люди нужны, и мы готовы их брать там, где найдем», — заявил Аркадий Волож, генеральный директор компании. Возглавил американское представительство поисковика Виш Махиджани (Vish Makhijani) — бывший руководитель поискового подразделения Yahoo.

Махиджани работал в Yahoo на протяжении последних пяти лет. Заключительная его должность — старший вице-президент группы поиска. Под руководством Махиджани развивались также и другие сервисы, например, Yahoo Answers, Yahoo Local, Yahoo Shopping, Yahoo Personals и Yahoo Travel. Кроме того, в 2003 г. он руководил сделкой Yahoo по покупке Overture, занимающейся размещением контекстной рекламы в результатах поиска.

В «Яндексе» говорят, что американские сотрудники будут работать над развитием поисковых технологий совместно с российскими и украинскими коллегами. В числе прочего планируется продолжить работу над улучшением поиска по мировому интернету.


Виш Махиджани, бывший руководитель поискового подразделения Yahoo, возглавит американский офис «Яндекса»

Офис в США стал уже девятым для «Яндекса». Кроме Москвы, где у поисковика три офиса, компания представлена в Петербурге, Екатеринбурге, Киеве, Одессе и Симферополе.

Эксперты считают, что с открытием американского офиса «Яндекс» надеется стать ближе к будущим инвесторам. «Для общения с инвесторами полезно находиться на их территории, — говорит Леонид Делицын, эксперт-консультант „Финама“. — Инвесторы должны перестать бояться, „Яндекс“ должен стать для них стать знакомым и родным». «Очевидно также, что создание лаборатории добавит ценности компании перед IPO», — уверен Михаил Чупа, директор группы онлайн сервисов «Майкрософт Рус».

«Но с финансовой точки зрения, как нам кажется, открытие такого офиса — крайне затратно, тем более что квалифицированные кадры в США очень дороги», — считает Дмитрий Гришин, генеральный директор Mail.ru. По оценкам Делицына, «человек в Силиконовой долине стоит $100–150 тыс.», то есть в год только на зарплату десяти сотрудников придется потратить $1–1,5 млн. С учетом затрат на офис и компенсации руководителя инвестиции «Яндекса» составят около $3 млн, полагает эксперт «Финама».



cnews.ru

три малоизвестных поисковых системы в сравнении

Наверх
  • Рейтинги
  • Обзоры
    • Смартфоны и планшеты
    • Компьютеры и ноутбуки
    • Комплектующие
    • Периферия
    • Фото и видео
    • Аксессуары
    • ТВ и аудио
    • Техника для дома
    • Программы и приложения
  • Новости
  • Советы
    • Покупка
    • Эксплуатация
    • Ремонт
  • Подборки
    • Смартфоны и планшеты
    • Компьютеры
    • Аксессуары

ichip.ru

Поисковые системы. Компьютерные сайты

Шпаргалка


Поговорим о самых известных поисковиках и не очень известных, но не менее интересных и полезных.

Поисковая система [Search Engine] — компьютерная интернет система, предназначенная для поиска текстовой, графической, аудио информации во Всемирной паутине.


Google — самая крупная поисковая система интернета, поддерживает поиск различной информации, Принадлежит корпорации Google Inc.


Яндекс — самая крупная российская поисковая система, поддерживает поиск различной информации. Принадлежит российской корпорации.


Bing — поисковая система, поддерживает поиск различной информации. Принадлежит корпорации Microsoft.


Поиск@Mail.Ru — российская поисковая система, поддерживает поиск различной информации. Принадлежит компании Mail.Ru.


 Спутник — российская национальная государственная поисковая система и интернет-портал, поддерживает поиск различной информации. Принадлежит компании Ростелеком.


 Yahoo! — американская поисковая система, занимает второе место в мире по популярности, поиск осуществляется поисковой машиной «Bing». Yahoo! еще и интернет-портал который включает в себя один из старейших сервис электронной почты Yahoo! Mail. Пренадлежит компании Verizon Communications.


Baidu — китайская поисковая система, лидер среди китайских поисковых систем.


DuckDuckGo — американская поисковая система c открытым исходным кодом, обеспечивает полную конфиденциальность и приватность пользователей (не сохраняет логи, не использует cookie). Выдает только качественные результаты,  используя как собственного робота, так и другие поисковые системы Yahoo!, Яндекс, Bing, «Википедия», Search.


Webalta — российская поисковая система, использует скрипты, которые без согласия пользователя устанавливают сайт start.webalta.ru в качестве стартовой страницы и поисковой системы по умолчанию в браузерах. Стоит ли пользоваться такой системой, решать Вам.


not Evil — поисковая система в сети тор, не использует рекламу, не следит за пользователями, интуитивно понятный интерфейс.


MSN — веб-портал, созданный компанией Microsoft.


YaCy — свободно распространяемая децентрализованная поисковая система, построенная по принципу одноранговой сети (P2P). Основной программный модуль,  функционирует на компьютерах пользователей сети YaCy. Исследуя Интернет, пользователи пополняют общую базу данных индексов.


AOL Inc. — американская поисковая система, популярная в 2000 х годах.


Pipl — поисковая система, в приоритете которой поиск информации о конкретном человеке в сети. Источниками информации являются профили социальных сетей, комментарии, списки участников и различные базы данных.


Ask — поисковая система,  основная цель поиск ответов на вопросы. Принадлежит InterActiveCorp.


FindSounds — поисковая система звуковых файлов, содержит в своей базе только звуковые файлы разных форматов — wav, mp3, aiff, au (звучания музыкальных инструментов и звуковых эффектов — крики животных, скрежет машин, звон, стук, сирены, жужжание насекомых, грохот взрывов и стрельбы, всплеск воды и т.д.).


Рамблер — первая русская поисковая система в Интернете, созданная в 1996г.


Wolfram|Alpha — вычислительно-поисковая система, выдаёт готовый ответ на запрос пользователя. Результаты поиска в виде ответов, решений, графиков, научных фактов, конвертирует различные величины и т.д.


Openstat — интернет проект, предназначенный для оценки посещаемости веб-сайтов.


Boardreader — поисковая система, которая работает с форумами, сообществами, досками объявлений.


Ixquick — это метапоисковая, анонимная  система. Принадлежит голландской компании Surfboard Holding BV.


Dogpile  — метапоисковая система, которая использует результаты Google, Yahoo!, Yandex и других популярных поисковых систем.


GigaBlast — поисковая система, в базе хранится более 12 миллиардов проиндексированных веб-страниц.


Academic.ru — поисковая система по базе словарей, энциклопедий, книжных магазинов и фильмов.


Жёлтые страницы — система поиска по желтым страницам (сведения о предприятиях и организациях).


LiveInternet — интернет-портал, предоставляющий услуги поиска, статистики сайтов, ведения онлайн-дневников и другие сервисы.


Ищите удобно, ищите профессионально… экспериментируйте и результат может вас удивить.


Понравилась статья — поставь «лайк»:


Шпаргалка:

Google — самый популярныйЯндекс — самый популярный в России
Bing — поисковик MicrosoftПоиск@Mail.Ru — поисковик mail.ru
Спутник — РостелекомYahoo! — второй в мире по популярности
Baidu — популярный в КитаеDuckDuckGo — с открытым исходным кодом
not Evil — поисковик TopMSN — интернет портал Microsoft
YaCy — одноранговыйAOL Inc. — американский поисковик
Ask — вопрос-ответFindSounds — поисковик звуковых файлов
Pipl — поиск людейРамблер — русский поисковик
Wolfram — вычислительнаяOpenstat — оценка посещаемости сайтов
Boardreader — по форумамIxquick — анонимный
Dogpile — метапоисковаяGigaBlast — поисковик с большой базой
Academic.ru — по словарямЖёлтые страницы — по желтым страницам
LiveInternet — портал

compnote.ru

Американцы выбирают Яндекс, а россияне – Google


Поисковики осуществляют полицейские функции, но у пользователей все еще есть пространство для маневра, и интернет все еще является территорией свободы, считают эксперты.

11 апреля Яндекс анонсировал услугу автоматического определения номеров для своего мобильного приложения, выпущенного для устройств на базе Android.

Сервис выглядит удобным: отныне пользователи будут сразу понимать, от какой организации исходит тот или иной звонок, даже если данного номера нет в телефонной книге пользователя. Если номер входящего звонка не записан в телефоне адресата, то приложение прежде всего сверится с «Яндекс.Справочником», в котором записаны номера пяти млн организаций и высветит на экран телефона наименование и род деятельности организации.

Если в справочнике номер не обнаружится, то поиск будет производиться по базе отзывов, которые будут оставлять сами пользователи приложения. Например, пользователи могут сообщить о подозрительных номерах, которыми пользуются спамеры или жулики, или занести в эту базу информацию о «благонадежных» номерах.

Таким образом адресат может быть предупрежден о нежелательном звонке до того как снимет трубку. Информация будет предоставляться даже по пропущенным вызовам. Разработчики сервиса утверждают, что таким образом пользователи смогут помочь друг другу избежать нежелательных звонков.

Некоторые комментаторы увидели в данной разработке шаг к более пристальному слежению за пользователями, сбору информации о них. На условиях анонимности мы расспросили эксперта в области IT-технологий о сущности данной разработки и тенденции, которую она выражает:

«Конечно, любое мобильное приложение – это дырка в безопасности вашей информации. Это данность, которую нужно иметь в виду: хотите защитить свои данные – не пользуйтесь мобильными приложениями, а если уж пользуетесь, – учитывайте этот факт. В этом смысле идея Яндекса никак не коварнее, чем сотни других разработок других платформ», — заявил специалист, отметив, что аналогичные разработки есть у Google, а Яндекс, как известно, борется за ту же рыночную и технологическую нишу.

По словам собеседника Tipler, Google является более могущественной конторой, а потому ее «тоталитарные приемчики» куда сильнее.

«В этом смысле Яндекс выглядит достаточно привлекательной альтернативой мировому монополисту не только для граждан России, но и для жителей других государств, желающих отдохнуть от всевидящего ока большого брата в объятиях брата малого. Ведь Google анализирует поисковые запросы, и уже неоднократно история поисковых запросов пользователя становилась уликой в суде. Преимущество Яндекса еще и в том, что его поиск по российскому сегменту мировой сети более удобный, релевантный и глубокий», — пояснил он.

Эксперт добавил, если вас беспокоит, что данные о вашей интернет-активности могут быть использованы против вас, вам следует пользоваться поисковиком, аффилированным со спецслужбами, которым до вас меньше всего дела. Поэтому американцы охотно пользуются российским Яндексом, а россияне – американскими Google или DuckDuckGo. Кроме того есть еще и китайская Baidu. Также современному пользователю следует обращаться к различным поисковым системам в зависимости от характера запроса.

Возвращаясь к вопросу о сборе информации в поисковиках, собеседник Tipler еще раз подчеркнул, что она существует, и к этому надо подходить с открытыми глазами: если ради удобств, которые дает то или иное приложение, вы готовы предоставить о себе определенные данные – тогда все в порядке.


tipler.ru

Поисковая система — Википедия

Поиск информации во Всемирной паутине был трудной и не самой приятной задачей, но с прорывом в технологии поисковых систем в конце 1990-х годов осуществлять поиск стало намного удобней

Поиско́вая систе́ма (англ. search engine) — это компьютерная система, предназначенная для поиска информации[источник не указан 308 дней]. Одно из наиболее известных применений поисковых систем — веб-сервисы для поиска текстовой или графической информации во Всемирной паутине. Существуют также системы, способные искать файлы на FTP-серверах, товары в интернет-магазинах, информацию в группах новостей Usenet.

Для поиска информации с помощью поисковой системы пользователь формулирует поисковый запрос[1]. Работа поисковой системы заключается в том, чтобы по запросу пользователя найти документы, содержащие либо указанные ключевые слова, либо слова, как-либо связанные с ключевыми словами[2]. При этом поисковая система генерирует страницу результатов поиска. Такая поисковая выдача может содержать различные типы результатов, например: веб-страницы, изображения, аудиофайлы. Некоторые поисковые системы также извлекают информацию из подходящих баз данных и каталогов ресурсов в Интернете.

Поисковая система тем лучше, чем больше документов, релевантных запросу пользователя, она будет возвращать. Результаты поиска могут становиться менее релевантными из-за особенностей алгоритмов (см. «Пузырь фильтров»[⇨]) или вследствие человеческого фактора[⇨]. По состоянию на 2015 год самой популярной поисковой системой в мире является Google, однако есть страны, где пользователи отдали предпочтение другим поисковикам. Так, например, в России «Яндекс» обгоняет Google больше, чем на 10 %[⇨].

По методам поиска и обслуживания разделяют четыре типа поисковых систем: системы, использующие поисковых роботов, системы, управляемые человеком, гибридные системы и мета-системы[⇨]. В архитектуру поисковой системы обычно входят:

  • поисковый робот, собирающий информацию с сайтов сети Интернет или из других документов,
  • индексатор, обеспечивающий быстрый поиск по накопленной информации, и
  • поисковик — графический интерфейс для работы пользователя[⇨].

На раннем этапе развития сети Интернет Тим Бернерс-Ли поддерживал список веб-серверов, размещённый на сайте ЦЕРН[3]. Сайтов становилось всё больше, и поддерживать вручную такой список становилось всё сложнее. На сайте NCSA был специальный раздел «Что нового!» (англ. What’s New!)[4], где публиковали ссылки на новые сайты.

Первой компьютерной программой для поиска в Интернете была программа Арчи[en] (англ. archie — архив без буквы «в»). Она была создана в 1990 году Аланом Эмтэджем (Alan Emtage), Биллом Хиланом (Bill Heelan) и Дж. Питером Дойчем (J. Peter Deutsch), студентами, изучающими информатику в университете Макгилла в Монреале. Программа скачивала списки всех файлов со всех доступных анонимных FTP-серверов и строила базу данных, в которой можно было выполнять поиск по именам файлов. Однако, программа Арчи не индексировала содержимое этих файлов, так как объём данных был настолько мал, что всё можно было легко найти вручную.

Развитие и распространение сетевого протокола Gopher, придуманного в 1991 году Марком Маккэхилом (Mark McCahill) в университете Миннесоты, привело к созданию двух новых поисковых программ, Veronica[en] и Jughead[en]. Как и Арчи, они искали имена файлов и заголовки, сохранённые в индексных системах Gopher. Veronica (англ. Very Easy Rodent-Oriented Net-wide Index to Computerized Archives) позволяла выполнять поиск по ключевым словам большинства заголовков меню Gopher во всех списках Gopher. Программа Jughead (англ. Jonzy’s Universal Gopher Hierarchy Excavation And Display) извлекала информацию о меню от определённых Gopher-серверов. Хотя название поисковика Арчи не имело отношения к циклу комиксов «Арчи»[en], тем не менее Veronica и Jughead — персонажи этих комиксов.

К лету 1993 года ещё не было ни одной системы для поиска в вебе, хотя вручную поддерживались многочисленные специализированные каталоги. Оскар Нирштрасс (Oscar Nierstrasz) в Женевском университете написал ряд сценариев на Perl, которые периодически копировали эти страницы и переписывали их в стандартный формат. Это стало основой для W3Catalog, первой примитивной поисковой системы сети, запущенной 2 сентября 1993 года[5].

Вероятно, первым поисковым роботом, написанным на языке Perl, был «World Wide Web Wanderer» — бот Мэтью Грэя (Matthew Gray) из Массачусетского технологического института в июне 1993 года. Этот робот создавал поисковый индекс «Wandex». Цель робота Wanderer состояла в том, чтобы измерить размер всемирной паутины и найти все веб-страницы, содержащие слова из запроса. В 1993 году появилась и вторая поисковая система «Aliweb». Aliweb не использовала поискового робота, но вместо этого ожидала уведомлений от администраторов веб-сайтов о наличии на их сайтах индексного файла в определённом формате.

JumpStation[en], [6] созданный в декабре 1993 года Джонатаном Флетчером, искал веб-страницы и строил их индексы с помощью поискового робота, и использовал веб-форму в качестве интерфейса для формулирования поисковых запросов. Это был первый инструмент поиска в Интернете, который сочетал три важнейших функции поисковой системы (проверка, индексация и собственно поиск). Из-за ограниченности ресурсов компьютеров того времени индексация и, следовательно, поиск были ограничены только названиями и заголовками веб-страниц, найденных поисковым роботом.

Первой полнотекстовой индексирующей ресурсы при помощи робота («craweler-based») поисковой системой, стала система «WebCrawler»[en], запущенная в 1994 году. В отличие от своих предшественниц, она позволяла пользователям искать по любым словам, расположенным на любой веб-странице — с тех пор это стало стандартом для большинства поисковых систем. Кроме того, это был первый поисковик, получивший широкое распространение. В 1994 году была запущена система «Lycos», разработанная в Университете Карнеги-Меллон и ставшая серьёзным коммерческим предприятием.

Вскоре появилось множество других конкурирующих поисковых машин, таких как: «Magellan»[en], «Excite», «Infoseek»[en], «Inktomi»[en], «Northern Light»[en] и «AltaVista». В некотором смысле они конкурировали с популярными интернет-каталогами, такими как «Yahoo!». Но поисковые возможности каталогов ограничивались поиском по самим каталогам, а не по текстам веб-страниц. Позже каталоги объединялись или снабжались поисковыми роботами с целью улучшения поиска.

В 1996 году компания Netscape хотела заключить эксклюзивную сделку с одной из поисковых систем, сделав её поисковой системой по умолчанию на веб-браузере Netscape. Это вызвало настолько большой интерес, что Netscape заключила контракт сразу с пятью крупнейшими поисковыми системами (Yahoo!, Magellan, Lycos, Infoseek и Excite). За 5 млн долларов США в год они предлагались по очереди на поисковой странице Netscape[7][8].

Поисковые системы участвовали в «Пузыре доткомов» конца 1990-х[9]. Несколько компаний эффектно вышли на рынок, получив рекордную прибыль во время их первичного публичного предложения. Некоторые отказались от рынка общедоступных поисковых движков и стали работать только с корпоративным сектором, например, Northern Light[en].

Google взял на вооружение идею продажи ключевых слов в 1998 году, тогда это была маленькая компания, обеспечивавшая работу поисковой системы по адресу goto.com[en]. Этот шаг ознаменовал для поисковых систем переход от соревнований друг с другом к одному из самых выгодных коммерческих предприятий в Интернете[10]. Поисковые системы стали продавать первые места в результатах поиска отдельным компаниям.

Поисковая система Google занимает видное положение с начала 2000-х[11]. Компания добилась высокого положения благодаря хорошим результатам поиска с помощью алгоритма PageRank. Алгоритм был представлен общественности в статье «The Anatomy of Search Engine», написанной Сергеем Брином и Ларри Пейджем, основателями Google[12]. Этот итеративный алгоритм ранжирует веб-страницы, основываясь на оценке количества гиперссылок на веб-страницу в предположении, что на «хорошие» и «важные» страницы ссылаются больше, чем на другие. Интерфейс Google выдержан в спартанском стиле, где нет ничего лишнего, в отличие от многих своих конкурентов, которые встраивали поисковую систему в веб-портал. Поисковая система Google стала настолько популярной, что появились подражающие ей системы, например, Mystery Seeker[en](тайный поисковик).

К 2000 году Yahoo! осуществлял поиск на основе системы Inktomi. Yahoo! в 2002 году купил Inktomi, а в 2003 году купил Overture, которому принадлежали AlltheWeb[en] и AltaVista. Затем Yahoo! работал на основе поисковой системы Google вплоть до 2004 года, пока не запустил, наконец, свой собственный поисковик на основе всех купленных ранее технологий.

Фирма Microsoft впервые запустила поисковую систему Microsoft Network Search (MSN Search) осенью 1998 года, используя результаты поиска от Inktomi. Совсем скоро в начале 1999 года сайт начал отображать выдачу Looksmart[en], смешанную с результатами Inktomi. Недолго (в 1999 году) MSN search использовал результаты поиска от AltaVista. В 2004 году фирма Microsoft начала переход к собственной поисковой технологии с использованием собственного поискового робота — msnbot[en]. После проведения ребрендинга компанией Microsoft 1 июня 2009 года была запущена поисковая система Bing. 29 июля 2009 Yahoo! и Microsoft подписали соглашение, согласно которому Yahoo! Search[en] работал на основе технологии Microsoft Bing. На момент 2015 года союз Bing и Yahoo! дал первые настоящие плоды. Теперь Bing занимает 20,1 % рынка, а Yahoo! 12,7 %, что в общем занимает 32,60 % от общего рынка поисковых систем в США по данным из разных источников.

Поиск информации на русском языке[править | править код]

В 1996 году был реализован поиск с учётом русской морфологии на поисковой машине Altavista и запущены оригинальные российские поисковые машины Рамблер и Апорт. 23 сентября 1997 года была открыта поисковая машина Яндекс. 22 мая 2014 года компанией Ростелеком была открыта национальная поисковая машина Спутник, которая на момент 2015 года находится в стадии бета-тестировании. 22 апреля 2015 года был открыт новый сервис Спутник. Дети специально для детей с повышенной безопасностью.

Большую популярность получили методы кластерного анализа и поиска по метаданным. Из международных машин такого плана наибольшую известность получила «Clusty»[en] компании Vivisimo[en]. В 2005 году в России при поддержке МГУ запущен поисковик «Нигма», поддерживающий автоматическую кластеризацию. В 2006 году открылась российская метамашина Quintura, предлагающая визуальную кластеризацию в виде облака тегов. «Нигма» тоже экспериментировала[13] с визуальной кластеризацией.

Высокоуровневая архитектура стандартного краулера

Основные составляющие поисковой системы: поисковый робот, индексатор, поисковик[14].

Как правило, системы работают поэтапно. Сначала поисковый робот получает контент, затем индексатор генерирует доступный для поиска индекс, и наконец, поисковик обеспечивает функциональность для поиска индексируемых данных. Чтобы обновить поисковую систему, этот цикл индексации выполняется повторно[14].

Поисковые системы работают, храня информацию о многих веб-страницах, которые они получают из HTML-страниц. Поисковый робот или «краулер» (англ. Crawler) — программа, которая автоматически проходит по всем ссылкам, найденным на странице, и выделяет их. Краулер, основываясь на ссылках или исходя из заранее заданного списка адресов, осуществляет поиск новых документов, ещё не известных поисковой системе. Владелец сайта может исключить определённые страницы при помощи robots.txt, используя который можно запретить индексацию файлов, страниц или каталогов сайта.

Поисковая система анализирует содержание каждой страницы для дальнейшего индексирования. Слова могут быть извлечены из заголовков, текста страницы или специальных полей — метатегов. Индексатор — это модуль, который анализирует страницу, предварительно разбив её на части, применяя собственные лексические и морфологические алгоритмы. Все элементы веб-страницы вычленяются и анализируются отдельно. Данные о веб-страницах хранятся в индексной базе данных для использования в последующих запросах. Индекс позволяет быстро находить информацию по запросу пользователя[15].

Ряд поисковых систем, подобных Google, хранят исходную страницу целиком или её часть, так называемый кэш, а также различную информацию о веб-странице. Другие системы, подобные системе AltaVista, хранят каждое слово каждой найденной страницы. Использование кэша помогает ускорить извлечение информации с уже посещённых страниц[15]. Кэшированные страницы всегда содержат тот текст, который пользователь задал в поисковом запросе. Это может быть полезно в том случае, когда веб-страница обновилась, то есть уже не содержит текст запроса пользователя, а страница в кэше ещё старая[15]. Эта ситуация связана с потерей ссылок (англ. linkrot[en]) и дружественным по отношению к пользователю (юзабилити) подходом Google. Это предполагает выдачу из кэша коротких фрагментов текста, содержащих текст запроса. Действует принцип наименьшего удивления, пользователь обычно ожидает увидеть искомые слова в текстах полученных страниц (User expectations[en]). Кроме того, что использование кэшированных страниц ускоряет поиск, страницы в кэше могут содержать такую информацию, которая уже нигде более не доступна.

Поисковик работает с выходными файлами, полученными от индексатора. Поисковик принимает пользовательские запросы, обрабатывает их при помощи индекса и возвращает результаты поиска[14].

Когда пользователь вводит запрос в поисковую систему (обычно при помощи ключевых слов), система проверяет свой индекс и выдаёт список наиболее подходящих веб-страниц (отсортированный по какому-либо критерию), обычно с краткой аннотацией, содержащей заголовок документа и иногда части текста[15]. Поисковый индекс строится по специальной методике на основе информации, извлечённой из веб-страниц[11]. С 2007 года поисковик Google позволяет искать с учётом времени создания искомых документов (вызов меню «Инструменты поиска» и указание временного диапазона).

Большинство поисковых систем поддерживает использование в запросах булевых операторов И, ИЛИ, НЕ, что позволяет уточнить или расширить список искомых ключевых слов. При этом система будет искать слова или фразы точно так, как было введено. В некоторых поисковых системах есть возможность приближённого поиска[en], в этом случае пользователи расширяют область поиска, указывая расстояние до ключевых слов[15]. Есть также концептуальный поиск[en], при котором используется статистический анализ употребления искомых слов и фраз в текстах веб-страниц. Эти системы позволяют составлять запросы на естественном языке. Примером такой поисковой системы является сайт ask com.

Полезность поисковой системы зависит от релевантности найденных ею страниц. Хоть миллионы веб-страниц и могут включать некое слово или фразу, но одни из них могут быть более релевантны, популярны или авторитетны, чем другие. Большинство поисковых систем использует методы ранжирования, чтобы вывести в начало списка «лучшие» результаты. Поисковые системы решают, какие страницы более релевантны, и в каком порядке должны быть показаны результаты, по-разному[15]. Методы поиска, как и сам Интернет со временем меняются. Так появились два основных типа поисковых систем: системы предопределённых и иерархически упорядоченных ключевых слов и системы, в которых генерируется инвертированный индекс на основе анализа текста.

Большинство поисковых систем являются коммерческими предприятиями, которые получают прибыль за счёт рекламы, в некоторых поисковиках можно купить за отдельную плату первые места в выдаче для заданных ключевых слов. Те поисковые системы, которые не берут денег за порядок выдачи результатов, зарабатывают на контекстной рекламе, при этом рекламные сообщения соответствуют запросу пользователя. Такая реклама выводится на странице со списком результатов поиска, и поисковики зарабатывают при каждом клике пользователя на рекламные сообщения.

Существует четыре типа поисковых систем: с поисковыми роботами, управляемые человеком, гибридные и мета-системы[16].

  • системы, использующие поисковые роботы
Состоят из трёх частей: краулер («бот», «робот» или «паук»), индекс и программное обеспечение поисковой системы. Краулер нужен для обхода сети и создания списков веб-страниц. Индекс — большой архив копий веб-страниц. Цель программного обеспечения — оценивать результаты поиска. Благодаря тому, что поисковый робот в этом механизме постоянно исследует сеть, информация в большей степени актуальна. Большинство современных поисковых систем являются системами данного типа.
Эти поисковые системы получают списки веб-страниц. Каталог содержит адрес, заголовок и краткое описание сайта. Каталог ресурсов ищет результаты только из описаний страницы, представленных ему веб-мастерами. Достоинство каталогов в том, что все ресурсы проверяются вручную, следовательно, и качество контента будет лучше по сравнению с результатами, полученными системой первого типа автоматически. Но есть и недостаток — обновление данных каталогов выполняется вручную и может существенно отставать от реального положения дел. Ранжирование страниц не может мгновенно меняться. В качестве примеров таких систем можно привести каталог Yahoo[en], dmoz и Galaxy.
  • гибридные системы
Такие поисковые системы, как Yahoo, Google, MSN, сочетают в себе функции систем, использующие поисковых роботов, и систем, управляемых человеком.
Метапоисковые системы объединяют и ранжируют результаты сразу нескольких поисковиков. Эти поисковые системы были полезны, когда у каждой поисковой системы был уникальный индекс, и поисковые системы были менее «умными». Поскольку сейчас поиск намного улучшился, потребность в них уменьшилась. Примеры: MetaCrawler[en] и MSN Search.

Google — самая популярная поисковая система в мире с долей на рынке 69,24 %. Bing занимает вторую позицию, его доля 12,26 %[17].

Самые популярные поисковые системы в мире[18]:

Поисковая системаДоля рынка в июле 2014Доля рынка в октябре 2014Доля рынка в сентябре 2017
Google68,69 %58,01 %69,24 %
Bing17,17 %29,06 %12,26 %
Baidu6,22 %8,01 %6,48 %
Yahoo!6,74 %4,01 %5,19 %
AOL0,13 %0,21 %1,11 %
Excite0,22 %0,00 %0,00 %
Ask0,13 %0,10 %0,24 %

Азия[править | править код]

В восточноазиатских странах и в России Google — не самая популярная поисковая система. В Китае, например, более популярна поисковая система Soso.

В Южной Корее поисковым порталом собственной разработки Naver пользуется около 70 % жителей[19]Yahoo! Japan и Yahoo! Taiwan — самые популярные системы для поиска в Японии и Тайване соответственно[20].

Россия и русскоязычные поисковые системы[править | править код]

Яндексом пользуются 53,3 % пользователей в России (Google — 42,9 %)[21].

Согласно данным LiveInternet в декабре 2017 года об охвате русскоязычных поисковых запросов[22]:

  • Всеязычные:
  • Англоязычные и международные:
  • Русскоязычные — большинство «русскоязычных» поисковых систем индексируют и ищут тексты на многих языках — украинском, белорусском, английском, татарском и других. Отличаются же они от «всеязычных» систем, индексирующих все документы подряд, тем, что, в основном, индексируют ресурсы, расположенные в доменных зонах, где доминирует русский язык, или другими способами ограничивают своих роботов русскоязычными сайтами.

Некоторые из поисковых систем используют внешние алгоритмы поиска.

Количественные данные поисковой системы Google[править | править код]

Число пользователей Интернета и поисковых систем и требований пользователей к этим системам постоянно растёт. Для увеличений скорости поиска нужной информации крупные поисковые системы содержат большое количество серверов. Сервера обычно группируют в серверные центры (дата-центры). У популярных поисковых систем серверные центры разбросаны по всему миру[23].

В октябре 2012 года Google запустила проект «Где живёт Интернет», где пользователям предоставляется возможность познакомиться с центрами обработки данных этой компании[24].

О работе дата-центров поисковой системе Google известно следующее[23]:

  • Суммарная мощность всех дата-центров Google, по состоянию на 2011 год, оценивалась в 220 МВт.
  • Когда в 2008 году Google планировала открыть в Орегоне новый комплекс, состоящий из трёх зданий общей площадью 6,5 млн м², в журнале Harper’s Magazine подсчитали, что такой большой комплекс потребляет свыше 100 МВт электроэнергии, что сравнимо с потреблением энергии города с населением 300 000 человек.
  • Ориентировочное число серверов Google в 2012 году — 1 000 000.
  • Расходы Google на дата-центры составили в 2006 году — $1,9 млрд, а в 2007 году — $2,4 млрд.

Размер всемирной паутины, проиндексированной Google на декабрь 2014 года, составляет примерно 4,36 миллиарда страниц[25].

Поисковые системы, учитывающие религиозные запреты[править | править код]

Глобальное распространение Интернета и увеличение популярности электронных устройств в арабском и мусульманском мире, в частности, в странах Ближнего Востока и Индийского субконтинента, способствовало развитию локальных поисковых систем, учитывающих исламские традиции. Такие поисковые системы содержат специальные фильтры, которые помогают пользователям не попадать на запрещённые сайты, например, сайты с порнографией, и позволяют им пользоваться только теми сайтами, содержимое которых не противоречит исламской вере.

Незадолго до мусульманского месяца Рамадан, в июле 2013 года, миру был представлен Halalgoogling[en] — система, выдающая пользователям только халяльные «правильные» ссылки[26], фильтруя результаты поиска, полученные от других поисковых систем, таких как Google и Bing. Двумя годами ранее, в сентябре 2011 года, был запущен поисковый движок I’mHalal, предназначенный для обслуживания пользователей Ближнего Востока. Однако этот поисковый сервис пришлось вскоре закрыть, по сообщению владельца, из-за отсутствия финансирования[27].

Отсутствие инвестиций и медленный темп распространения технологий в мусульманском мире препятствовали прогрессу и мешали успеху серьёзного исламского поисковика. Очев

ru.wikipedia.org

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *