Система рейтинга: преступления и наказания / Хабр

30.06.2019 alexxlab

Содержание

преступления и наказания / Хабр

Китайское государство развёртывает обширную систему ранжирования, которая будет отслеживать поведение его огромного населения и выставлять оценки жителям на основе их «социального кредита».

Система социального кредита, о которой впервые было объявлено в 2014, создана с целью укрепления идеи о том, что «сохранять доверие прекрасно, а разрушать его – отвратительно», как написано в правительственном пояснении к проекту. Программу планируется запустить полностью к 2020 году, но она уже сейчас проходит стадию обкатки на миллионах людей. И участие в ней обязательно.

На данный момент система работает по частям – за некоторые её части отвечает администрация города, за другие – частные технологические платформы, хранящие персональные данные.

Социальный кредит человека, как и личная кредитная история, может повышаться и понижаться в зависимости от его поведения. Точная методология держится в секрете – но среди примеров нарушений упоминается плохое вождение, курение в запрещённых местах, покупка слишком большого количества видеоигр и распространение лживых новостей.

1. Запрет на полёты и поездки на поезде

Зал ожидания на вокзале Ханчжоу, февраль 2016

Китай уже начал наказывать людей ограничениями на поездки. Девяти миллионам людей запретили покупать билеты на местные авиалинии, как сообщила в марте Channel News Asia, цитирующая официальную статистику. Также им придётся распрощаться с комфортом –трём миллионам людей запретили покупать билеты бизнес-класса на поезда.

Итоговая система будет наказывать ещё и плохих пассажиров. Потенциальные нарушения – поездка без билета, праздношатание перед посадочными воротами, курение в запрещённых местах.

2. Регулирование скорости интернета

Такой информацией поделилась Рэйчел Ботсман, автор, опубликовавший часть книги на тему техбезопасности на Wired в прошлом году. Точный механизм данного метода пока неизвестен.

Согласно Foreign Policy, кредитные системы отслеживают своевременную оплату людьми счетов, примерно как системы, отслеживающие кредитную историю – но они добавляют сюда и моральную сторону дела. Среди других спорных нарушений – слишком большая трата времени на видеоигры, траты денег на легкомысленные покупки и посты в соцсетях. Также, особенно после террористических атак на службу безопасности аэропортов, караться будет и распространение ложных новостей.

3. Запрет вам и вашим детям на обучение в лучших школах

Студенты исполняют гимн страны на игровой площадке во время поднятия флага в школе Шанхая, 27 сентября 2017

17 человек, отказавшихся в прошлом году от прохождения службы в армии, не смогут получить высшее образование, обучаться в старших классах или продолжить своё обучение, пишет Beijing News [трудности перевода: оригинальная статья написана по-китайски, но, судя по онлайн-переводчику, на самом деле этим людям аннулировали все достижения выше средней школы, и им предписано вернуться, и проходить обучение заново; также им запретили выезд за границу и покупку недвижимости / прим. перев.]

Гражданам с низким социальным кредитом будет запрещено отправлять своих детей в дорогие частные школы, сказала Ботсман. Неясно, действует ли уже этот запрет.

4. Запрет на получение лучших рабочих мест

«Дом народных собраний», здание парламента в Пекине, одно из крупнейших государственных зданий Китая

«Нарушающие доверие» индивидуумы не смогут заниматься управленческими работами в государственных учреждениях и крупных банках. Некоторые преступления, вроде мошенничества и хищений, также сильно повлияют на социальный кредит.

5. Запрет на заселение в лучшие отели

Государственный пятизвёздочный отель Пекин

Людям, отказавшимся служить в армии, также запретили отдыхать в определённых местах и отелях. При этом государство как награждает людей, так и наказывает. Люди с высоким социальным рейтингом будут быстрее получать разрешение на посещение таких мест, как Европа.

В 2015 году неизвестная женщина в Пекине также сообщила BBC, что ей разрешили забронировать в отеле номер без залога наличными, потому что у неё был высокий социальный кредит.

6. Публичное порицание плохих граждан

Презрительный взгляд президента Китая Си Цзиньпиня в декабре 2017

Ещё одна доступная тактика – публичное порицание. Правительственная записка от 2016 года поощряет компании проверять чёрный список перед тем, как нанимать людей на службу и заключать с ними контракты. Однако перед добавлением в такой список человеку должно будет прийти судебное уведомление, и им разрешается подавать апелляцию на это решение в течение 10 дней после получения уведомления. Пока непонятно, когда этот список начнёт работать.

Прототип чёрного списка уже существует, и его уже используют для наказания

В списке слева указаны имена людей и заретушированные идентификационные номера, а справа – названия компаний.

Ли Сяолин, юрист, попавший в этот список в 2015, обнаружил, что не может купить билеты на самолёт, чтобы вернуться домой из рабочей поездки, как писала Human Rights Watch. У него также не принимали заявления на открытие кредитных карт.

Существует и список хороших граждан

BBC утверждает, что крупнейший китайский сайт знакомств Baihe отдаёт предпочтение учётным записям хороших граждан.

Граждане также могут получать скидки на счета по электроэнергии, брать вещи в аренду без залога и получать пониженный процент по кредиту в банке

Байкшеринг в Китае

Такие преимущества были доступны людям из Жунчэна на востоке Китая. Городской совет запустил систему социального кредита для граждан, которую изучила Foreign Policy.

Люди положительно отзываются о системе

Перекрёсток в Гуандуне

Несмотря на немного страшноватый имидж системы — организация Human Rights Watch высказала своё недовольство ею, а Ботсман назвала её «футуристической версией Старшего брата, вышедшего из-под контроля» – некоторые граждане считают, что эта система помогает им становиться лучше. 32-летний предприниматель, представившийся Foreign Policy, как Чен, сказал: «У меня такое ощущение, что за последние шесть месяцев поведение людей становилось всё лучше и лучше. К примеру, за рулём теперь мы всегда останавливаемся перед пешеходными переходами. Если не остановишься, потеряешь очки. Сначала мы волновались по поводу потери очков, но теперь уже привыкли к этому».

Рейтинговая система, которая может изменить мир / Блог компании LevelPride / Хабр

Принято считать, что для увеличения продаж в основе любого стартапа должна лежать уникальная, полезная идея, позволяющая хотя бы чуть-чуть изменить этот мир к лучшему. Мы уверены, что наша идея как раз из таких, правда, на уровне продаж это пока никак не сказывается. И виной тому не качество идеи, а неопределенность в её коммерциализации. С одной стороны наша идея интересна и ей пользуются люди, но с другой совершенно не понятно за что можно брать деньги. Кстати, забегая вперед, мы будем благодарны тому кто сможет помочь советом с вопросом конвертации идеи в деньги.

Актуальность вопроса
Казалось бы совсем недавно мировое сообщество предсказало появление социальных сетей. Сегодня, когда общение все больше и больше уходит в онлайн предполагается появление различных рейтинговых систем. Систем которые могли бы уже ранжировать, не сайты а пользователей сети. Эта идея не будет казаться такой уж абсурдной, если мы откроем обсуждение популярных событий на любом новостном ресурсе. Разные люди вступают друг с другом в ожесточенную полемику даже не видя, кто находиться на другом конце «провода». Возникает вопрос. Почему? Ведь если в реальной жизни к вам подойдет бомж и предложит обсудить ситуацию в Сирии, вы же его проигнорируете. Или же попробуйте представить в реальной жизни ситуацию, когда семиклассник просвещает профессора истории относительно политической ситуации в стране. В жизни это выглядит дико, в сети встречается сплошь и рядом.

Совершенно ясно, что при общении в сети мы не можем идентифицировать человека, по возрасту, одежде, социальному положения. Значит для сохранения нормального общения должна быть уникальная оценка, некоторый ранк, который позволит всем показать, важность того или иного пользователя.

Нужно сказать, что эта идея не оригинальна. Уже неоднократно она обсуждалась и здесь и на хабре. При этом некоторые системы уже существуют, но пока они, в основном, оценивают только социальные связи, количество друзей и т. д.

Простой подход
Мы решили создать систему, которая позволила бы сразу понять, с кем ты имеешь дело. Систему, которая бы учитывала твой кругозор, образованность, наличие проф. навыков и т.д. А самое главное, систему, которая бы позволяла выявлять таланты и транслировать их обществу. Сегодня, к сожалению, это ещё одна проблема, в век перегруженности информацией реальные таланты, обладающие значительными достижениями, теряются среди постов о кисках и фотографий еды.

LevelPride.com это по сути портфолио. Предназначено оно в основном для образовательного сообщества: школьников, студентов, преподавателей, но любой может зарегистрироваться и вносить в систему свои достижения. Это могут быть грамоты, сертификаты, победы в конкурсах и т.д. Страницу с портфолио могут просматривать все пользователи сети. За каждое внесенное в систему достижение пользователю начисляется определенное количество баллов.

В сумме все баллы для одного пользователя составляют его так называемый LP–уровень. Благодаря этому уровню можно строить различные рейтинги. Рейтинг пользователей того или иного учебного заведения или рейтинг учебных заведений на основании достижений обучающихся, или выявить самого спортивного, или самого научного студента в том или ином вузе или городе.

К сожалению, вся эта штука реализуется силами всего нескольких человек, знаний которых не хватает для реализации всего задуманного, и за все время не было привлечено ни копейки инвестиции. Однако, несмотря на это, идея, как и любая хорошая идея, способная изменить мир к лучшему, работает.

Кто пользуется?
Сегодня некоторые вузы использую систему для выявления лучших студентов и назначения для них повышенных стипендий. Нет нужды отрабатывать данные всех претендентов, достаточно взять за основу рейтинг, предоставленный системой. При этом все прозрачно, любой может посмотреть, за что тому или иному человеку была назначена стипендия.

Помимо вузов систему используют школы, просматривают работодатели.

В ней удобно проводит различные конкурсы, выявлять лучших в той или иной области. Транслировать талантливых ребят, например, работодателям, или абитуриентов транслировать вузам.

Миссия
Основная миссия «прайда» это выявление и транслирование талантливых людей обществу. Для этого мы реализуем различные проекты. Например, уже два года подряд составляем рейтинг лучших студентов. Последний раз в составлении рейтинга приняло участие более полусотни российских вузов.

В преддверии приемной компании создаем и публикуем каталог талантливых абитуриентов. Вузы смотрят этот каталог и приглашают поступать к себе достойных абитуриентов.

Однако, при очевидной полезности, ответ на вопрос коммерциализации не является очевидным.

P.S. Данная статья это посыл к дискуссии по вопросам существования рейтинговых систем вообще и данной системы в частности. Как вы видите их будущее? Какими они могут быть и т.д.

Система рейтинговой оценки в CMS / Хабр

Я разрабатываю проект на модульной системе, написанной одним питерским програмистом. Достаточное время уже стоит вопрос о рейтинговой системе для этой CMS. Универсальной, ориентированной не только на блоги, но и на другие типы сайтов, где основной контент — не обязательно записи блога (а, например, фото-сайты или сообщества и т.д.). Речь пойдёт о накрутках, виртуалах, потенциальных социальных уязвимостях рейтинговых систем. Суть проблемы описана под катом.

Накрутки

С рейтингом все упирается в накрутки. Причем, не важно сознательные или бессознательные. Хорошая в этом плане система на хабре, но здесь ее не смогли сделать простой и изящной, в итоге есть два визуально не связанных рейтинга. На самом деле, система не плохая, но недостаточно гибкая. Кроме того, она хорошо работает на больших сообществах. На малых с ней будут проблемы. На хабре голоса даются ежедневно. Что мешает зарегистрировать десяток аккаунтов и влиять на рейтинг, если голоса выдаются каждый день? Мешает система инвайтов. А если сайт с открытой регистрацией?

Виртуалы. LiveStreet

Для сравнения — LiveStreet начисляет настоящий рейтинг только за посты. То есть чисто блоговое решение. Очевидное, если на сайте планируется блог. А если нет? Хотелось рейтинг свести к одному показателю. Без системы раздельного голосования за пользователя и за его сообщения. То, с чем разработчик системы столкнулся лично на своих проектах: «Пользователь регистрирует десяток виртуалов и начинает их „прокачивать“, голосуя друг за друга. В закрытом автивном сообществе это не работает, но таких мало.» Такая система рейтинга которую предлагает лайвтстрит работает только в одном конкретном случае — в случае блогосайта. Во всех прочих случаях она получается очень уязвима. Не технически, а социально-уязвима. Вот способ прокачать лайвстритовского персонажа: создаем топик, публикуем его, голосуем за него полсотней виртуалов, после чего убираем топик в черновики или удаляем. Рейтинг при этом никуда не девается. Следующая дырка: представим себе что на сайте достатоно давно живет тусовка. Они привыкли друг к другу и относятся к знакомым предвзято. Они, как правило, голосуют друг за друга и, так как они давно на сайте, рейтинг их растет просто с фантастической скоростью… То есть это фактически те же 10 виртуалов о которых написано выше, только за ними стоят живые люди. Более того, всех десятерых это положение дел устраивает: формально они правил не нарушают, делают приятно знакомому, и сами не остаются в накладе. Или представьте себе фотосайт, где человек может выложить пачку в пару сотен фотографий, под каждой оставить по комментарию, а затем пройтись виртуалами по всей этой куче и плюсануть.

(200 + 200) * 10 витруалов = 4000 голосов за день

Честный получится рейтинг? Нет.

Ну и что же получается? Идеального решения нету?

На самом деле есть. Просто надо учитывать взаимное влияние голосов.
Предположим, есть два пользователя с рейтингом 1. Допустим, при голосовании рейтинг передается полностью. То есть первый проголосовал за второго — у того стал рейтинг 2, второй проголосовал за первого — у первого стал рейтинг 3 и так до бесконечности. А надо сделать так, чтобы передавалась только та часть, которая была получена без «голосуемого». Рейтинг должен передаться без взаимной накрутки. Только то, что было у пользователя отдастся другому даже после того, как другой за него проголосовал. Тут возникает новый способ накрутки: первый пользователь голосует за второго, второй за третьего, треитй — за первого (между третьим и первым можно вставить еще несколько). Кстати, создать трех пользователей (или договориться с двумя людьми) — совсем не проблема.

Как же быть?

Копировать чужое решение рейтинговой системы, которое узнаваемо и не скопировано только ленивым — не хочется. Делать свое плохое — тоже. Как сделать хорошее — пока не знаем.
Важна не конкретная техническая реализация, а предложения по системе рейтинга в целом.
А можно ли каким-то образом усложнить схему с пользователями и взаимной накруткой? Можно. Так как рейтинг переходит достаточно мелкими порциями, то можно проверять голоса какого пользователя составляют самую большую долю в рейтинге… Или?…
Давайте порассуждаем, уважаемые Хабралюди.

как в Китае вводят систему социального рейтинга :: Бизнес :: РБК

— отказ в соцобеспечении;

— особо тщательный досмотр на таможне;

Читайте на РБК Pro

— запрет на занятие руководящих должностей в пищевой и фармацевтической промышленности;

— отказ в авиабилетах и спальном месте в ночных поездах;

— отказ в местах в люксовых гостиницах и ресторанах;

— запрет на обучение детей в дорогих частных школах.

Отличить честность от нечестности в понимании китайского руководства очень легко — разница та же, что между соблюдением или несоблюдением законов. Но стоит учесть, что китайские законы намного подробнее регламентируют человеческое существование, чем российские.

Пилотный проект

Быть честными китайцев учил еще Конфуций. В его жизнеописаниях есть такая притча: когда он был чиновником, некто предложил ему взятку и заверил, что никто не узнает. Мудрец отвечал: «Я знаю, ты знаешь, Небо знает. Кто не знает?» Коммунистическое руководство Китая, заменившее собой конфуцианское Небо, никогда не могло смириться с тем, что оно чего-то не знает о своих гражданах. Поэтому еще при Мао Цзэдуне наладило систему «дан-ань» — личных дел граждан. В каждой папке «дан-ань» есть физические данные, фото, послужной список, характеристики от начальников и товарищей, отчеты об успеваемости и правонарушениях, членство в клубах и общественных организациях и т.п.

Все это хранится в бумажном виде в государственных архивах — областных и центральном. Это инструмент не только громоздкий, но и труднодоступный. Менеджер отеля или авиалинии не сможет быстро добраться до «дан-аня», чтобы понять, какого обращения заслуживает клиент. К тому же бумажная папка не отвечает требованиям информационной безопасности — ее содержимое не защищено от чиновничьего произвола. А значит, Компартия Китая не вполне может полагаться на эти данные, вырабатывая социальную политику. Все эти проблемы решено устранить с помощью информационных технологий, которые и указаны в качестве основного инструмента Системы соцрейтинга. «Это лучше, чем традиционный способ, — говорит The Wall Street Journal Мэн Тянуан, политолог из пекинского университета Цинхуа. — Раньше <…> политика определялась на основе суждений отдельных лиц».

Традиционный способ проверки благонадежности не прибавил честности народу. Национальный опрос 2013 года показал: меньше половины граждан считают, что большинству людей можно доверять, меньше 30% относятся к незнакомцам без подозрения. Объявив о запуске Системы социального рейтинга, руководство объяснило, как будет лечить народ от недоверчивости.

Пока в пилотном режиме в нескольких десятках городов запущены только отдельные ее элементы. Китай — страна закрытая, о нюансах применения системы на практике официально не сообщается. Корреспонденты The Wall Street Journal посмотрели, как она работает в областном центре Ханчжоу на востоке Китая. Пока все выглядит нестрашно. Вот местная жительница зашла в метро по льготному проездному своего сына — штраф в $6 плюс выговор от смотрителя. Выговор устный, хотя вокруг развешаны объявления, что нарушителям грозит вычет баллов в системе. Представитель метрополитена объяснил, что реальное ухудшение рейтинга грозит за повторные злоупотребления. Китаянка не особо переживает, говорит, что, если этот случай всплывет, объяснит, что взяла проездной сына по ошибке. Но множество нар

Отечественное агентство присвоило России рейтинг выше S&P и Moody’s :: Финансы :: РБК

Финансы , 23 сен 2019, 17:18

В рейтинге от АКРА важнее макроэкономические показатели, чем качество институтов и санкции

Первый суверенный рейтинг, который Россия получила от отечественного агентства, оказался на уровне A-, то есть выше, чем данные S&P, Fitch и Moody’s. Экономисты считают это оправданным

Фото: Дмитрий Серебряков / ТАСС

Рейтинговое агентство АКРА, созданное в 2015 году по инициативе ЦБ, впервые присвоило России долгосрочный кредитный рейтинг. Рейтинг в иностранной валюте установлен на уровне А- со стабильным прогнозом, такой же — и в национальной валюте.

Рейтинг АКРА присвоен по международной шкале и соответствует нижней ступени высокого кредитного качества: вероятность дефолта у эмитента низкая, а платежеспособность высокая. Рейтинги от «большой тройки» (S&P, Moody’s и Fitch), которые присваивались России с 1990-х, никогда не достигали высшей категории A. Западные агентства ухудшили оценку России в 2014 году, после введения санкций за присоединение Крыма. S&P и Moody’s присвоили ей «мусорный» рейтинг, чем спровоцировали развитие отечественной рейтинговой отрасли, и отказались от такой оценки только в 2018 году.

Лучше «тройки»

Рейтинг АКРА на две-три ступени выше рейтингов, присвоенных России иностранными агентствами. Сейчас рейтинг страны по версии S&P — BBB-, по версии Moody’s — на уровне, соответствующем BBB-. Fitch оценивало Россию выше остальных глобальных агентств и не опускало рейтинг России до «мусорной» категории BB, сейчас он находится на уровне BBB. Таким образом, рейтинг от АКРА на две ступени выше рейтинга от Fitch и на три — от S&P и Moody’s.

У России уже был рейтинг категории А. По версии китайского агентства Dagong (последняя оценка — в 2017 году, в 2018 году у Dagong отозвали аккредитацию), он находится на уровне А со стабильным прогнозом, то есть даже выше, чем по версии АКРА. Японское рейтинговое агентство JCR последний раз поднимало российский рейтинг в 2018 году — до BBB-. Такой же рейтинг — от немецкого Scope.

Рейтинговая система, оценки и на что они влияют – Помощь

Рейтинг поста или комментария на Пикабу — показатель интереса аудитории.

Зарегистрированные пользователи ставят плюсы за то, что им нравится, и минусуют контент, который им не нравится. Оценки пользователей формируют рейтинги постов и комментариев.

В свою очередь, рейтинг аккаунта складывается из баллов за посты и комментарии. Каждый голос за пост изменяет рейтинг аккаунта на 1 балл, а голос за комментарий — на 0.5 балла.

Пикабу с самого создания работает на рейтинговой системе. Она затрагивает почти все аспекты сайта. Например, рейтинг помогает:

Показывать в топе актуальные посты. Чем больше плюсов ставят пользователи, тем выше поднимается пост. Чем выше находится пост, тем больше пользователей его увидят.
Определять качество контента. Пикабушники выражают свое мнение с помощью оценок и таким образом создают рейтинг. Мнение аудитории считается одним из основных показателей актуальности.
Мотивировать к новым публикациям. Пост набирает высокий рейтинг, когда он нравится многим людям. Положительный отклик публики доставляет удовольствие, и автору хочется пилить новые посты.
Регулировать возможности пользователей. Доступ к некоторым функциям зависит от рейтинга аккаунта. Это один из способов противодействия спаму на ресурсе, и не только.
Поддерживать порядок на ресурсе. Если пользователя активно минусуют, значит, его действия вызывают негатив у большинства людей. Обычно такую реакцию провоцируют тролли. Чтобы остановить провокацию негатива такими людьми, на Пикабу действует блокировка профилей с очень низким рейтингом.
Проводить закрытое тестирование. Некоторые обновления настолько масштабные, что невозможно отловить все ошибки силами команды Пикабу. Поэтому некоторые функции запускаем для части пользователей, отбирая их по рейтингу. Добровольцы сообщают нам про ошибки, разработчики стараются их исправить. А когда обновление делают доступным для всех, основные баги уже исправлены, и так мы получаем меньше негатива.

5 звезд или большие пальцы вверх / вниз — какая система оценок подходит для вашего приложения?

Персонализированный UX лучше UX. В пользовательском интерфейсе есть что-то восхитительное, что кажется, будто оно создано специально для вас. Это верно во время адаптации и тем более верно, когда пользователи вкладывают время и данные в ваш продукт.

Во время адаптации вы можете попросить своих пользователей выбрать категории, которые подходят им, или контент, который им интересен, чтобы создать персонализированный ранний пользовательский опыт. Но как насчет постоянных пользователей? Как вы впервые воссоздаете удовольствие от входа на персонализированную панель управления?

Один из простейших (по крайней мере, на первый взгляд) и наиболее распространенных способов выполнения постоянной персонализации — это позволить пользователям оценивать контент приложения — будь то оценка в звездочках, большие пальцы вверх или вниз, сердечки или другая форма оценки.

Фактически, если вы начнете искать, вы увидите эту тактику повсюду. Netflix, Amazon, Yelp, Google, Youtube, Pandora — все используют рейтинги, чтобы персонализировать взаимодействие с пользователем.

В этой статье мы подробно рассмотрим, как именно рейтинговые системы способствуют вовлечению и удержанию пользователей. Мы также рассмотрим различные виды рейтинговых систем и выясним, какой вариант (если таковой имеется) лучше всего подходит для вашего варианта использования.

Как рейтинговые системы способствуют вовлечению пользователей

Рейтинги служат разным целям для разных продуктов и разных пользователей.Прежде чем выбрать, какую систему оценки использовать в своем продукте, важно подумать о том, чего можно (и не может) достичь пользовательский рейтинг. Например:

Пользовательские рейтинги помогают персонализировать контент, который видит каждый пользователь. Каждый рейтинг представляет собой точку данных, которую можно использовать в сложных алгоритмах для автоматизации персонализации. И эта персонализация со временем становится более точной с рекомендациями — чем больше пользователь оценивает, тем умнее становится ваш продукт. Это особенно важно для продуктов на основе контента, таких как Netflix или YouTube, которые полагаются на интеллектуальную персонализацию контента для доставки контента нужным пользователям.
Совокупные рейтинги или обзоры пользователей помогают информировать пользователей, а направлять принятие решений. — независимо от того, есть ли у вас алгоритм персонализации или нет. Например, новый пользователь на Amazon по-прежнему получит пользу от обычных отзывов пользователей, даже если они не получат персонализированных предложений. Эта система наиболее полезна для приложений электронной коммерции, которые требуют более длительного времени для принятия решения о покупке.
Любая рейтинговая система дублирует отзывов пользователей для вашей команды. Эта обратная связь помогает компаниям понять, является ли контент, который они предлагают, ценным, и дает представление о том, как вы можете со временем улучшить предложения.Таким образом, рейтинги могут принести пользу продуктам независимо от того, имеют ли они встроенную сложную персонализацию.

Выбор системы рейтинга будет зависеть от того, какой из этих факторов наиболее важен для вашего продукта. 5-звездочная рейтинговая система может быть идеальной для оказания влияния на сложные решения о покупке, в то время как простые пальцы вверх / вниз могут быть лучше для вашего алгоритма.

Приведем хорошо известный пример:

Почему Netflix переключился с звездного рейтинга на «большой палец вверх / большой палец вниз»

Netflix (in), как известно, отказался от своей классической системы рейтинга от 1 до 5 в пользу двоичной оценки «палец вверх / палец вверх» рейтинговая система вниз в 2017 году.

В дополнение к новой рейтинговой системе Netflix теперь отображает процент совпадений (до 100%), который предсказывает, насколько пользователю понравится шоу или фильм.

Как выглядит интерфейс Netflix в 2020 году с опциями «палец вверх» и «вниз» и с прогнозированием совпадений.

По словам Кэмерона Джонсона, директора Netflix по инновациям в продуктах, новая рейтинговая система получила на 200% больше оценок в тестах A / B.

Это отчасти из-за того, как работала старая система рейтингов Netflix: звезды, которые каждый пользователь видел рядом с программой, отражали прогнозы Netflix о том, насколько пользователю понравится ее просмотр.Чем больше пользователей оценивали то, что они смотрели, тем точнее становились эти прогнозы.

Но большинство пользователей этого не понимали. Люди привыкли видеть звездные рейтинги на Amazon или Yelp, где количество звезд отражало среднее значение отзывов всех остальных. Многие пользователи Netflix просто не чувствовали себя обязанными оценивать вещи, когда думали, что их мнение было всего лишь «каплей в корзину всех обзоров Netflix».

Как выглядел интерфейс Netflix в 2017 году до изменений. (Источник)

Система «большой палец вверх / палец вниз», с другой стороны, «широко понимается как подразумевающая, что вы тренируете алгоритм, чтобы знать, что вам нравится.

И двоичная система рейтингов не только привела к увеличению количества оценок пользователей. Это также привело к более честной оценке собственных предпочтений пользователей при просмотре. Это потому, что когда дело доходит до рейтинга фильмов и шоу, звезды отражают предпочтения, которые люди хотят, чтобы имели, а не то, как люди на самом деле ведут себя.

Вице-президент Netflix по продуктам Тодд Йеллин объяснил, что компания постепенно осознала, что поведенческие данные являются более ценным средством прогнозирования контента, который пользователи действительно хотят потреблять.«Пользователи будут оценивать документальные фильмы на 5 звезд, а глупые фильмы — всего на 3 звезды, но все равно смотрят глупые фильмы чаще, чем документальные фильмы с высоким рейтингом».

Это изменение раздражало некоторых из 100 миллионов подписчиков Netflix, которые упустили нюанс недвоичной системы. Один пользователь Reddit красиво резюмировал жалобы, написав: «Проблема с большими пальцами вверх / вниз в том, что теперь нет абсолютно никакой разницы между« Я думаю, я не ненавидел этот фильм »и« Это величайший фильм. Я когда-либо видел в своей жизни и хочу видеть больше подобных.«»

Но это был не первый раз, когда крупный поставщик контента отдавал предпочтение большим пальцам, а не звездам.

YouTube сделал такой же переход в 2009 году.

Они перешли на этот шаг после того, как поняли, что большинство пользователей оценивают только те видео, которые им нравятся, с меньшая часть рейтинговых видео, которые они абсолютно ненавидят.

Пользователи редко ставили видео 2-, 3- или 4-звездочные, что приводило к J-образной кривой — довольно частый побочный эффект использования 5-звездочной системы оценки в неверный контекст.

Источник: YouTube

Но хотя более простая система оценок могла бы улучшить взаимодействие пользователей с Netflix и YouTube, переход на двоичную систему может быть неправильным решением для вашего продукта .

Помните, что правильный выбор продукта зависит от ваших уникальных целей. Давайте подробнее рассмотрим каждую из различных систем оценки.

Звездные рейтинги помогают пользователям принимать сложные решения.

Звездные рейтинги помогают людям чувствовать себя более уверенно в своих решениях. Такая рейтинговая система обычно используется платформами электронной коммерции, поскольку помогает принимать решения о покупке, особенно на крупных платформах, где в противном случае выбор предметов для продажи мог бы быть огромным.

Звездные рейтинги часто сопровождаются качественными обзорами, которые помогают глубже проанализировать ситуацию. Это важно не только для решений о розничных покупках, как на Amazon, но и для сложных решений с реальными последствиями. Подумайте: Booking.com (выбор номера в отеле), Rover (поиск питомца для домашних животных), Zocdoc (выбор врача) и т. Д. Рейтинг

звезд помогает владельцам домашних животных быть уверенными в выборе питомца на Rover.

Качественные обзоры увеличивают время взаимодействия, но могут задерживать ключевые действия.

Повышение сложности с помощью звездочек и качественных обзоров — хорошая комбинация, если время на сеанс является важным показателем взаимодействия для вашего продукта.

Например, качественные обзоры, используемые вместе с системой оценки звезд, являются частью того, что делает TripAdvisor таким удобным для просмотра.

Более того, когда пользователи проявляют больше творчества в своих обзорах, они могут стать предметом гордости и стать предметом гордости. Yelp проделал отличную работу по геймификации своих обзоров, чтобы значительно расширить свою пользовательскую базу.

Yelp даже размещает на своей домашней странице рандомизированные обзоры, чтобы побудить пользователей внести свой вклад.

В отличие от OpenTable путь к активации короче.Они занимаются тем, чтобы помогать людям бронировать места, и могут не захотеть поощрять бесцельный просмотр, который не приводит к конверсии. Они просят рецензентов оценивать их обеды на основе множества факторов — от качества обслуживания до уровня шума.

В то время как обзоры OpenTable включают качественную обратную связь, в их пользовательском интерфейсе визуальный акцент делается на количественной оценке, что позволяет пользователям легко просматривать информацию и принимать своевременные решения.

Оценки «Нравится» и «Избранное» лучше всего подходят для прогнозируемой персонализации контента.

Мы уже узнали о том, что Netflix перешел с 5-звездочной системы на бинарную.И хотя Netflix может быть одной из первых компаний, которые приходят на ум, когда вы думаете об «алгоритмической персонализации», они далеко не одиноки.

Другие продукты, зависящие от персонализации, уже давно используют двоичные рейтинги. Это потому, что двоичные рейтинговые системы лучше подходят для прогнозирования персонализации контента.

Например, Pandora подбирает радиостанции на основе ваших предпочтений прослушивания. Чтобы получить обратную связь, они используют простой вариант «палец вверх» или «палец вниз». При выборе большого пальца вниз также пропускается песня — это эффективный способ поощрить позитивное взаимодействие со стороны пользователей, которые ненавидят песню, которую они слышат!

И, конечно же, Youtube использует двоичную систему рейтинга в своем приложении Youtube Music:

Продукты со сложными автоматизированными алгоритмами персонализации и курирования, как правило, предпочитают двоичные системы оценки.

Чем больше вариантов оценки вы даете пользователям, тем больше умственных усилий вы требуете от пользователей. Двоичная система не только снижает когнитивную нагрузку на пользователей, но и позволяет собирать большие наборы данных, а это означает, что со временем персонализация вашего продукта станет более интеллектуальной.

Сердечки, звездочки и помидоры — альтернативные системы оценки

Звездочки и большие пальцы — две самые популярные системы оценки, но не единственные. Некоторые сайты обзоров используют, например, 10-балльную рейтинговую шкалу (IMBd) или 100-балльную шкалу (Rotten Tomatoes).А алгоритм Facebook теперь поддерживает несколько смайликов.

И, конечно же, есть сердечки или фавориты. Сердца часто используются платформами социальных сетей — Twitter, Instagram — и приложениями для электронной коммерции — Etsy, Rent the Runway — для предоставления более персонализированного опыта. Как работает эта персонализация, варьируется от продукта к продукту.

В Instagram канал каждого пользователя персонализируется на основе сложного (и, казалось бы, постоянно развивающегося) алгоритма, который учитывает избранные наряду с рядом других факторов.

На Etsy эта персонализация немного проще: пользователи могут сохранять товары или продавцов в свои избранные, как для создания коллекции самых любимых товаров для будущих покупок, так и для влияния на предложения, которые они видят от Etsy.

Рейтинговые системы направлены на повышение вовлеченности пользователей.

Состоят ли они из звездочек, больших пальцев или сердечек, все рейтинговые системы в конечном итоге ориентированы на вовлеченность пользователей. Правильная форма и масштаб рейтинговой системы для вашего приложения — это та форма, с которой ваши пользователи больше всего взаимодействуют.

Более активное участие пользователей (что само по себе является отличным результатом) означает больше данных, которые можно использовать для обеспечения еще более персонализированного UX. В результате мы получаем более устойчивый и интеллектуальный продукт, который со временем становится только лучше.

Новые вопросы о рейтинговой системе — Stack overflow на русском Переполнение стека
Около
Продукты
Для команд
Переполнение стека Общественные вопросы и ответы
Переполнение стека для команд Где разработчики и технологи делятся частными знаниями с коллегами
Вакансии Программирование и связанные с ним технические возможности карьерного роста
Талант Нанимайте технических специалистов и создавайте свой бренд работодателя
Реклама Обратитесь к разработчикам и технологам со всего мира
Новые вопросы по рейтинговой системе — Stack overflow на русском
Переполнение стека
Около
Продукты
Для команд
Переполнение стека Общественные вопросы и ответы
Переполнение стека для команд Где разработчики и технологи делятся частными знаниями с коллегами
Вакансии Программирование и связанные с ним технические возможности карьерного роста
Талант Нанимайте технических специалистов и создавайте свой бренд работодателя
Реклама Обратитесь к разработчикам и технологам со всего мира
О компании
Рейтинговая система — это… Что такое рейтинговая система?
Рейтинговая система — Рейтинговая система, Зенсур в Интернете… Универсал-Лексикон
рейтинговая система — Balų sistema statusas T sritis Kūno kultūra ir sportas apibrėžtis Sportinių rezultatų vertinimas balais. Bal sistema vertinama gimnastikos, dailiojo čiuožimo, dailiojo plaukimo, šuolių į vandenį ir kitų sporto šakų varžybose. atitikmenys: англ.…… Sporto terminų žodynas
рейтинговая система — reitingavimo sistema statusas Aprobuotas sritis Finansai apibrėžtis Sistema, apimanti visus rizikos vertinimo metodus, processus, control, duomenų rinkimo ir informacinių technologiza…
рейтинговая система — существительное система классификации по качеству, достоинствам или количеству • Син.: ↑ система подсчета очков • Гиперонимы: ↑ система классификации… Полезный английский словарь
Рейтинговая система Королевского флота — Рейтинговая система Британского королевского флота использовалась Британским Королевским флотом между серединой 17-го и серединой 19-го века для классификации парусных кораблей по количеству и весу. их орудий.Происхождение…… Википедия
рейтинговая система (ы) или рейтинги — также известная как система рейтингов фильмов MPAA (Американская ассоциация киноискусства), впервые официально введенная в конце 1968 года; это относится к постоянно развивающейся системе классификации фильмов, обычно основанной на соответствии возрасту, и суждениям… Глоссарий кинематографических терминов
Рейтинговая система Эло — Chess Go Рейтинговая система Эло — это метод для расчета… Wikipedia
Система оценки фильмов — Родительский контроль перенаправляется сюда.Информацию о сингапурских сериалах см. В разделе «Родительский контроль» (сериал). Чтобы узнать о песне Judas Priest, см. Parental Guidance (песня). Система рейтинга фильмов предназначена для классификации фильмов по пригодности… Wikipedia
Американская кинематографическая ассоциация система рейтинга фильмов — перенаправления с рейтингом R здесь. Для получения рейтинга R в других странах см. Система рейтинга кинофильмов. PG 13 перенаправляется сюда. Информацию о борцовской команде см. PG 13 (профессиональная борьба).Система рейтинга фильмов Американской ассоциации киноискусства…… Wikipedia
Шахматная рейтинговая система — Шахматная рейтинговая система — это система, используемая в шахматах для расчета оценки силы игрока на основе его результатов по сравнению с другими игроками. Они используются такими организациями, как ФИДЕ, Шахматная федерация США (USCF), Международная…… Википедия
Рейтинговая система Glicko — Рейтинговая система Glicko и рейтинговая система Glicko 2 представляют собой шахматные рейтинговые системы, аналогичные рейтинговой системе Эло: метод оценки силы игрока в играх на ловкость, таких как шахматы.Он был изобретен Марком Гликманом как усовершенствование…… Википедии
Универсальная рейтинговая система
| Домашняя страница
Мы ожидаем, что некоторые люди оспорят представление о том, что игры, в которые играют с медленным контролем времени, могут быть смешаны с более быстрыми играми в рамках единой рейтинговой системы. Одно из широко распространенных (хотя, по общему признанию, субъективных) убеждений состоит в том, что классические шахматы категорически отличаются от быстрых шахмат и еще больше от блиц-шахмат, и эти три типа шахмат следует разделять.
Однако есть еще один способ думать об этом. Что, если классика, рапид и блиц мало чем отличаются друг от друга? Что, если все они раскрывают информацию об универсальных шахматных способностях игрока, при том понимании, что игры становятся более хаотичными и менее информативными по мере увеличения скорости игры?
Если вы согласны с этой концепцией, то, возможно, есть способ эффективно объединить настольные игры со всеми временными контролем в единую рейтинговую систему, использовать единый пул данных для анализа и создать единый «универсальный» рейтинг. для каждого игрока.Как мы могли сказать объективно, а не субъективно, является ли это шагом в правильном направлении или шагом в неправильном?
Если мы считаем, что наличие трех отдельных рейтинговых систем (и, следовательно, трех отдельных рейтингов для каждого игрока) является лучшим подходом, чем наличие одной универсальной рейтинговой системы (и одного универсального рейтинга для каждого игрока), то это не означает, что Стандарт Эло ФИДЕ рейтинги, рассчитываемые только на основе партий, сыгранных с медленным контролем времени, являются более чистым и превосходным показателем игровой силы в классических шахматах, чем универсальный рейтинг, испорченный играми с более быстрым контролем времени? Точно так же не могли бы мы ожидать, что быстрые рейтинги ФИДЕ Эло (рассчитанные только на основе быстрых игр) лучше подходят для измерения навыков игроков в быстрых шахматах, чем тот же универсальный рейтинг, который смешивает более быстрые игры с более медленными играми, которые предположительно требуют разных навыков для успеха. ? И то же самое с Блицем? Как нам решить, какие рейтинги работают лучше?
Есть несколько способов оценить точность рейтинговой системы, но мы предлагаем максимально простой и понятный метод, который вы можете себе представить.Мы задали один простой вопрос…
«Когда игра заканчивается решающим результатом (не ничьей), выиграл ли игрок с более высоким рейтингом или игрок с более низким рейтингом?»
Если бы рейтинги игроков были полностью случайными и не имели никакого отношения к истинной шахматной силе, то ровно 50% решающих партий было бы выиграно игроком с более высоким рейтингом. С другой стороны, если бы рейтинги игроков были абсолютно точными, то теоретически 100% всех решающих игр было бы выиграно игроком с более высоким рейтингом.Хотя это явно недостижимый стандарт, 75% — 80% — более разумная цель, и мы полагали, что можно разработать систему рейтинга, которая бы точно предсказывала результаты решающих игр (отбрасывая результаты вничью) с большей скоростью, чем существующие рейтинговые системы.
После создания моделей, лежащих в основе URS ™, мы решили проверить нашу теорию. Мы начали с ежемесячного расчета рейтингов URS ™ Ratings за последние несколько лет.В результате были получены результаты, которые можно было напрямую сравнивать с тремя наборами ежемесячных рейтингов ФИДЕ Эло, чтобы увидеть, какие рейтинги (с начала месяца, когда игралась игра) лучше предсказывали исход решающих партий.
Мы использовали один и тот же набор рейтингов URS ™ для определения рейтингового фаворита URS ™ во всех играх. С другой стороны, мы использовали рейтинги FIDE Standard для определения фаворита рейтинга FIDE Elo в стандартных играх, рейтинги FIDE Rapid для определения фаворита рейтинга FIDE Elo в быстрых играх и рейтинги FIDE Blitz для определения фаворита рейтинга FIDE Elo. в блиц играх.Поскольку рейтинговые системы ФИДЕ Rapid и Blitz вступили в силу только в 2012 году, мы решили дать этим рейтингам отсрочку в один год, и поэтому мы начали сравнивать результаты за все месяцы с января 2013 года по декабрь 2016 года.
Наглядный пример процесса, которому следовали, воссоздан ниже. Эта иллюстрация основана на результатах недавно завершившегося чемпионата мира по блицу, который проходил в Дохе с 29 по 30 декабря 2016 года.
Для простоты мы можем рассмотреть только частичную кросс-таблицу, в которую входят только девять игроков с рейтингом 2800+ в рейтинг-листе Блиц ФИДЕ от 1 декабря 2016 года. Затем мы отсортируем этих игроков как по их блиц-рейтингам ФИДЕ, так и по их рейтингам URS ™ по состоянию на 1 декабря 2016 года. В результате получатся следующие две таблицы:
Сравнение таблиц показывает явные различия. Например, гроссмейстер Владислав Артемьев был посеян впереди гроссмейстера Хикару Накамуа на основании их рейтингов ФИДЕ Эло Блиц перед турниром, но значительно отстал от Накамуры в рейтинге URS ™.
Как только будут доступны фактические результаты игры, мы заполняем кросс-таблицы и сравниваем результаты. Мы просто игнорируем все, что ниже и слева от диагональной линии, поскольку это зеркальное отображение информации в правом верхнем углу. Мы также игнорируем ничьи и матчи, в которых игроки имеют одинаковые рейтинги, поскольку в этих редких случаях нет игроков с «более высоким рейтингом» или «с более низким рейтингом».
Это генерирует таблицу, в которой все, что обозначено цифрой 1 в области справа и над диагональю, отражает правильный прогноз, в котором победил игрок с более высоким рейтингом.Все, что равно нулю в этой же области, является ошибочным прогнозом. Все ячейки, которые мы не принимаем во внимание, показаны серым цветом, включая решающие результаты, показанные слева и под диагональю. Правильные прогнозы (значения «1») показаны синим, а пропущенные прогнозы (значения «0») красным:
Таким образом, когда мы используем рейтинги ФИДЕ Блиц Эло, две победы Магнуса Карлсена (против Максима Вашье-Лаграва и Теймура Раджабова с более низким рейтингом) были правильными прогнозами, а его поражение от Сергея Карякина (также с более низким рейтингом) представляет собой упущенный прогноз.Всего было четыре правильных прогноза и пять промахов, при этом общий коэффициент прогнозов (по этой крошечной выборке из девяти игр) составил 44%. Особо следует отметить поражение Артемьева от более низкого рейтинга Накамура и поражение Мамедьярова от менее рейтингового Карякина. Также обратите внимание на дополнительные отметки «X», чтобы напомнить нам о том, что мы игнорируем любые результаты Ароняна-Непомнящего и Карякина-Раджабова, где у игроков были одинаковые рейтинги ФИДЕ, или результаты Непомнящего-Вашье-Лаграва, где игроки имели одинаковые рейтинги URS ™.
Когда мы проводим такой же анализ с использованием рейтингов URS ™, мы получаем следующие результаты:
С точки зрения URS ™, победа Накамуры над Артемьевым является правильным прогнозом, как и победа Карякина над Мамедьяровым. Таким образом, для этой части кросс-таблицы URS более успешно классифицировала игроков с вероятностью 67%. Хотя набор данных явно слишком мал, чтобы делать выводы, приведенный выше пример должен служить для иллюстрации того, как мы можем объективно сравнить точность двух разных рейтинговых списков, применимых к одним и тем же играм.
Очевидно, что результаты начинают иметь значение только тогда, когда мы начинаем рассматривать гораздо более крупные наборы данных. Следовательно, мы применили ту же методику ко всем четырем группам и всем игрокам на недавно завершившихся чемпионатах мира по рапиду и блицу (открытый рапид, открытый блиц, женский рапид и женский блиц). Мы обнаружили, что рейтинги URS ™ работали лучше, чем рейтинги FIDE Blitz, при прогнозировании результатов блиц-игр, а также работали лучше, чем рейтинги FIDE Rapid, при прогнозировании быстрых игр.
Ниже приводится общий обзор результатов:
В приведенной выше таблице к крайнему правому столбцу применен градиент цвета, так что числа, близкие к нулю, являются белыми, в то время как более положительные числа имеют более глубокий / темный синий цвет, а отрицательные числа (если они есть) были бы красными. Более глубокие синие цвета показывают, где превосходство URS ™ более выражено.
Но это всего лишь 1667 решающих игр. Что, если мы закидываем более широкую сеть и просматриваем больше игр? Что, если мы посмотрим на все блиц-партии, все быстрые и все классические партии за весь четырехлетний период с 2013 по 2016 год?
Мы сделали это, и вот результаты:
На постоянной основе, из года в год и во всех трех рейтинговых категориях, рейтинговая система URS ™ постоянно лучше предсказывала результаты.
К настоящему времени вы, вероятно, уже понимаете, к чему мы идем. Наши результаты показывают, что рейтинги URS ™ лучше определяют, кто выиграет в классической шахматной партии, чем рейтинги FIDE Standard. (Одинаковые) рейтинги URS ™ лучше определяют, кто выиграет в быстрые шахматы, чем рейтинги ФИДЕ Rapid, и (те же) рейтинги URS ™ лучше определяют, кто выиграет в блиц-шахматной партии, чем рейтинг ФИДЕ. Блиц-рейтинги.
Что это говорит о аргументе, что три типа шахмат должны быть изолированы в рамках отдельных рейтинговых систем?
Эти результаты предполагают, что рейтинги URS ™ на самом деле повсеместно лучше, чем рейтинги Эло, при определении того, кто собирается выиграть данную шахматную партию.Мы также считаем это объективным свидетельством в пользу вывода о том, что рейтинги URS ™ более точны по всему спектру средств контроля времени, чем рейтинги Elo из отдельных рейтинговых списков, поддерживаемых ФИДЕ.
Со статистической точки зрения важно отметить, были ли результаты за 2016 год такими же успешными, как и за период с 2013 по 2015 годы. Это важно, потому что, когда мы оптимизировали внутреннюю работу URS ™ в 2016 году, мы скорректировали очень небольшое количество параметров системы (примерно десять) до соответствующих значений.Мы сделали это с помощью статистической методологии, которая включала в себя прогнозирование результатов реальных игр в период с 2013 по 2015 год, а затем отслеживание того, насколько хорошо наша рейтинговая система делает соответствующие прогнозы. Данные о результатах игры за 2016 год использовались только как данные «вне выборки», что означает, что они никогда не использовались как часть какого-либо сравнительного упражнения, пока мы не завершили полную и окончательную разработку нашей рейтинговой системы. Таким образом, поведение и результаты 2016 года можно рассматривать как последний тест. Мы, конечно же, продолжим отслеживать поведение URS ™ в 2017 году и далее.
Приведенный выше анализ рассматривал только общие числа по всему пулу игроков. Однако, возможно, URS ™ хорошо работает для одного сегмента рейтингового пула, но не для всего? Например, известно, что система Эло работает намного лучше, когда игроки имеют большую игровую историю, часто встречаются друг с другом и играют более последовательно. Следовательно, он имеет тенденцию лучше функционировать для верхней части рейтингового пула по сравнению со всем пулом.
Конечно, в верхнюю часть рейтингового пула входит лишь малая часть игр, в которые играют сегодня.Это проиллюстрировано приведенной ниже круговой диаграммой, которая показывает относительную частоту игр между игроками с разной силой на основе стандартного рейтинга ФИДЕ игрока с более низким рейтингом в каждой игре.
В течение рассматриваемого четырехлетнего периода было сыграно всего 4000 решающих партий, в которых оба игрока имели рейтинг 2600+. Фактически, было более 600 решающих игр, сыгранных игроками с более низким рейтингом, на каждую 1 решающую игру, сыгранную между 2600+ игроками с рейтингом.Срез настолько мал, что вы едва можете увидеть синий срез, помеченный как «a) Оба игрока FIDE 2600+» в правом верхнем углу таблицы.
Мы проверили каждую из этих десяти групп игр, начиная от элитных игр среди игроков 2600+ и заканчивая играми с участием хотя бы одного игрока с рейтингом ниже 1400. Затем мы сравнили, насколько хорошо система URS ™ предсказывала победителей. всех решающих партий по сравнению с рейтингом ФИДЕ тех же игроков.
Независимо от того, анализируете ли вы маленький срез, представляющий элитные игры, или больший срез с самыми слабыми игроками, или где-то посередине, все ячейки синего цвета по всей доске.Это означает, что на каждом уровне силы игрока URS ™ лучше предсказывает результаты, чем соответствующие рейтинги Elo. Иногда результаты были лишь немного лучше, иногда — значительно лучше, но хуже никогда не было. Ни в одном случае.
И хотя URS ™ специально оптимизирован для измерения силы игроков в классических шахматах, на самом деле именно в быстрых и блиц-шахматах URS ™ действительно демонстрирует свое превосходство. Включая классические результаты в рейтинги, которые используются для прогнозирования быстрых и блиц-игр, мы позволяем нашей рейтинговой системе делать более точные прогнозы вверх и вниз по рейтинговому списку:
Вы можете заметить, что даже через четыре года результатов некоторые столбцы заполнены редко, всего несколько тысяч игр.На самом деле это не так уж и удивительно, если учесть, насколько малы были срезы для самых мощных игр на круговой диаграмме, представленной ранее в этой статье.
Также может оказаться интересным провести более подробную проверку силы игроков в сравнении с более конкретными темпами игры, чтобы увидеть, есть ли в каких-либо областях, где на самом деле рейтинги ФИДЕ Эло работали лучше, чем URS ™ при прогнозировании результатов игры. Чтобы получить достаточно данных, чтобы рассмотреть это в двух измерениях, мы объединили самые сильные категории в одну большую категорию «Оба рейтинга 2000+», чтобы у нас было пять примерно равных по размеру групп игр.Затем мы могли увидеть, есть ли какие-либо общие группы игроков и конкретные временные ограничения (или диапазоны контроля времени), где универсальные рейтинги действительно были хуже. Самой очевидной целью будет самый медленный контроль времени для самых сильных игроков, так как это, как правило, место, где система Эло работает лучше всего. Игры на этом уровне обычно менее случайны, и большинство игроков имеют стабильные сильные стороны и часто сталкиваются друг с другом. Поэтому неудивительно, когда выяснилось, что именно здесь рейтинги ФИДЕ Эло были относительно лучшими.Тем не менее, ячейки оставались постоянно синими, причем некоторые области были глубже других, что убедительно свидетельствует о том, что рейтинги URS ™ на самом деле повсеместно превосходят рейтинги ФИДЕ Elo при прогнозировании результатов игр:
Загрузите полный пресс-релиз здесь.