|
|
|
|
|
|
|
|
|
|
ну или есть гроссмейстер уровня 2550-2600 - а через пару лет игры в определённых условиях у него 2222.
Это я конкретно про Индию (но она не единственное такое место на карте, а на другом конце есть Сербия или Куба совецких времён)
И что мы после етой аномалии будем делать?
Если система рейтингов так лажает географически - можем ли мы её считать какой-то научной основой для анализа чего-то?
(до рейтингов та же фигня была с понятиями "совецкий кмс" и "московский перворазрядник") |
|
|
номер сообщения: 8-575-142963 |
|
|
|
Billy Bоnes: KomodoLove: Но ведь именно такие «разговоры на коленке» и указывают, куда специалистам потом копать. |
Так куда специалистам копать дальше? Хоть намекните. |
Отличный вопрос. И здесь как раз можно очертить вектор, куда «копать», чтобы выйти из круга догадок:
Сравнение выборок «онлайн vs оффлайн» по группам соперников.
- Берём конкретных игроков (например, Шиманов, но не только его).
- Смотрим результативность против соперников 2700+ за доской и онлайн.
- Считаем разницу, проверяем значимость (условно: 30% оффлайн → 50% онлайн).
Анализ точности ходов.
- Сопоставление совпадений с движком в партиях онлайн и оффлайн.
- Разница в паттернах (скорость принятия решений, доля «единственных ходов»).
Динамика во времени.
- За какой период держится «аномалия»: один турнир, месяц, год?
- Если эффект сохраняется годами — это весомее, чем серия «удачных» матчей.
Сравнение с контрольной группой.
- Взять нескольких других гроссмейстеров схожего уровня (2550-2650 за доской).
- Проверить, показывают ли они аналогичные скачки онлайн.
- Если нет - аномалия становится убедительнее.
То есть «куда копать» специалистам вполне ясно: методично отделять апстрики и особенности формата от устойчивых расхождений в уровне игры.
Без такого анализа у нас остаются впечатления. Но сами впечатления - это повод для исследования, а не «сотрясание пикселей». |
|
|
номер сообщения: 8-575-142964 |
|
|
|
bazar: ну или есть гроссмейстер уровня 2550-2600 - а через пару лет игры в определённых условиях у него 2222.
Это я конкретно про Индию (но она не единственное такое место на карте, а на другом конце есть Сербия или Куба совецких времён)
И что мы после етой аномалии будем делать?
Если система рейтингов так лажает географически - можем ли мы её считать какой-то научной основой для анализа чего-то?
(до рейтингов та же фигня была с понятиями "совецкий кмс" и "московский перворазрядник") |
вы правильно подмечаете проблему географических «карманов». Она есть и в классическом Эло, и в любой замкнутой системе - если пул соперников изолирован, то рейтинг может «уплывать» вверх или вниз. Индия, Сербия времён СССР, даже онлайн-платформы с отдельными пулами - всё это примеры.
Но важный момент:
Географическая «разболтанность» объясняет расхождения между разными пулами, которые мало пересекаются.
В нашем случае сравнение идёт внутри одного пула. Тот же игрок (Шиманов и пр.) играет и онлайн, и оффлайн против одних и тех же топов - Каруаны, Карлсена, и т.д. Здесь нет «индийского пузыря» или «сербского перворазрядника». Это прямая кросс-проверка.
Поэтому ваша аналогия про «советского кмс» верна в общем, но не применима напрямую к рассматриваемой ситуации. Рейтинг ФИДЕ может быть и не идеальным «научным инструментом», но как только игроки регулярно пересекаются за доской и онлайн, мы получаем именно то, что нужно для анализа: сравнение результативности против одних и тех же соперников в близких условиях.
И если именно там фиксируется разрыв в 150–200 пунктов, то это уже не «индийский эффект» и не локальный пузырь, а что-то иное. |
|
|
номер сообщения: 8-575-142965 |
|
|
|
О диссертациях о чем-то сложном речь не идет.
ПРостая аналогия. Санэпидемический контроль, лаборатории химической проверки и подобное. Проверка делается лаборантами, нередко их уровень относительно невысокий в научной области. Но они делают все по проверенным методикам, в том числе стат проверка гипотез и т.д. Вы не сможете интуитивно на вкус определить качество и химический состав, например отобранной воды, разве что в совсем запущенныхз случаях поймете, что качество плохое.
Возникл подозрения- делайте анализы. Пускай первичные анализы в "низовой лаборатории". А вот если эти анализы говрят о "плохой воде",то уже тогда можно и нужно бить тревогу. Не до того, как кому-то что-то показалось... Потом уже требуется более точное исследование и т.д
Сначала Крамник должен был проверить свои данные на статистическую аномалию, привлекая каких-то специалистов ( условных лаборантов).И поднимать шум в случае показанной "статистической значимости".А он не сделал этого ни разу.( если какая-то такая работа и проводилась, то не до, а после, подсчистка явных хвостов)
Тот же Чессрей , насколько помню, хотел помогать вначале тому же Крамнику. И охотно бы сделал, если бы просто попросили. Я даже думаю, что и сейчас, при нормальном разговоре и просьбе сделает. Нужно ли это Крамнику и его сторонникам?! |
|
|
номер сообщения: 8-575-142966 |
|
|
|
KomodoLove:
Без такого анализа у нас остаются впечатления. Но сами впечатления - это повод для исследования, а не «сотрясание пикселей». |
Приблизительно то же самое здесь говорилось не раз. Как Вы оцениваете объем подобной работы? Сколько ресурсов - человеческих и денежных она потребует? По плечу ли она "команде специалистов", занимающихся ней в свободное время?
И еще. Пока не определены критерии и четкий протокол работы с подозреваемыми, какой смысл может иметь обнародование подозрения? Кроме индивидуального террора? |
|
|
номер сообщения: 8-575-142967 |
|
|
|
xajik: О диссертациях о чем-то сложном речь не идет.
ПРостая аналогия. Санэпидемический контроль, лаборатории химической проверки и подобное. Проверка делается лаборантами, нередко их уровень относительно невысокий в научной области. Но они делают все по проверенным методикам, в том числе стат проверка гипотез и т.д. Вы не сможете интуитивно на вкус определить качество и химический состав, например отобранной воды, разве что в совсем запущенныхз случаях поймете, что качество плохое.
Возникл подозрения- делайте анализы. Пускай первичные анализы в "низовой лаборатории". А вот если эти анализы говрят о "плохой воде",то уже тогда можно и нужно бить тревогу. Не до того, как кому-то что-то показалось... Потом уже требуется более точное исследование и т.д
Сначала Крамник должен был проверить свои данные на статистическую аномалию, привлекая каких-то специалистов ( условных лаборантов).И поднимать шум в случае показанной "статистической значимости".А он не сделал этого ни разу.( если какая-то такая работа и проводилась, то не до, а после, подсчистка явных хвостов)
Тот же Чессрей , насколько помню, хотел помогать вначале тому же Крамнику. И охотно бы сделал, если бы просто попросили. Я даже думаю, что и сейчас, при нормальном разговоре и просьбе сделает. Нужно ли это Крамнику и его сторонникам?! |
Аналогия с лабораторией хорошая, но, по-моему, вы её трактуете слишком односторонне.
В реальности процесс устроен именно так:
Сначала подозрение. Кто-то замечает, что вода мутная, запах странный или вкус необычный. Это не «научный результат», а сигнал.
Потом проверка. Лаборатория делает анализ по методике. Если результаты подтверждают - включается следующий уровень контроля.
В истории с Крамником он как раз выступил на стадии №1 - зафиксировал подозрения. Да, он не «лабoрант», и статистическую гипотезу проверить не смог. Но и не обязан - точно так же, как житель не обязан сам ставить спектрометр, если вода из крана пахнет хлоркой. Его дело - сказать: «что-то не так».
Дальше действительно нужны «лаборанты» - тот же Чессрей и другие специалисты, которые умеют копать статистически. И тут я с вами согласен: правильный путь - не только шуметь, но и передать материалы тем, кто умеет работать с массивом данных.
Но важный момент: если вы требуете, чтобы «сначала были анализы», а только потом сигнал - вы переворачиваете логику процесса. Без сигналов никто и анализы делать не будет. Именно поэтому сравнение корректнее: Крамник сказал «вода мутная», а уже дальше должны подключаться те, кто умеет делать замеры.
И вот в этом смысле вопрос «нужно ли это Крамнику и его сторонникам» звучит странно. Нужно не им - нужно всему сообществу. Потому что если расхождения между оффлайном и онлайном действительно есть, то разбираться обязаны не отдельные личности, а вся система. |
|
|
номер сообщения: 8-575-142968 |
|
|
|
Billy Bоnes: KomodoLove:
Без такого анализа у нас остаются впечатления. Но сами впечатления - это повод для исследования, а не «сотрясание пикселей». |
Приблизительно то же самое здесь говорилось не раз. Как Вы оцениваете объем подобной работы? Сколько ресурсов - человеческих и денежных она потребует? По плечу ли она "команде специалистов", занимающихся ней в свободное время?
И еще. Пока не определены критерии и четкий протокол работы с подозреваемыми, какой смысл может иметь обнародование подозрения? Кроме индивидуального террора? |
Вы поднимаете два важных аспекта - и оба заслуживают отдельного ответа.
Объём работы.
Да, если ставить задачу «прогнать топ-1000 шахматистов онлайн/оффлайн», то это десятки человеко-месяцев и серьёзные ресурсы. Но ведь для первичной проверки объём гораздо меньше:
- берём несколько показательных кейсов (Шиманов, пара других имён со схожей динамикой),
- собираем выборку партий онлайн и оффлайн против соперников определённого уровня,
- считаем базовую статистику (проценты очков, совпадения с движком).
Такой анализ - не «грант на годы», а работа уровня энтузиастов с нормальными навыками статистики и доступом к базам партий. Да, «в свободное время» это медленнее, но в принципе по силам.
Смысл обнародования подозрений.
Если под «обнародованием» понимать публичные обвинения в стиле «этот человек точно читер», то да - это сродни террору. Но если речь идёт о формулировке исследовательского вопроса («есть расхождение, которое требует проверки»), то это нормальная часть научного и спортивного процесса.
Иначе получится парадокс: пока нет анализа, мы обязаны молчать → анализа никто не делает, потому что запроса нет → тема исчезает. Обнародование как раз и даёт импульс для проверки, вопрос в том, как именно его подать.
Правильная форма: «замечено статистическое несоответствие, нужно исследование». Неправильная форма: «этот шахматист точно мошенник». Крамник, увы, часто переходил в эмоциональную плоскость, и это ослабляло его позицию. Но сам факт того, что он поднял вопрос, - важен и полезен. |
|
|
номер сообщения: 8-575-142969 |
|
|
|
Сказать- "вода мутная", это в очередной раз сказать. что в онлайне люди читерят. А бегать по "высшим инстанциям", митинговать на площади с лозунгом- "В воде явное превышение свинца. мышьяка,( да чего угодно- что не нравится в данный момент)- накажите виновных за аномалию !" - это, исмхо, совсем другое. без анализов, без "первичной справки" из лаборатории., даже без понмания, сколько "этого свинца" допустимо по нормам..
утрировано |
|
|
номер сообщения: 8-575-142971 |
|
|
|
xajik: Сказать- "вода мутная", это в очередной раз сказать. что в онлайне люди читерят. А бегать по "высшим инстанциям", митинговать на площади с лозунгом- "В воде явное превышение свинца. мышьяка,( да чего угодно- что не нравится в данный момент)- накажите виновных за аномалию !" - это, исмхо, совсем другое. без анализов, без "первичной справки" из лаборатории., даже без понмания, сколько "этого свинца" допустимо по нормам..
утрировано |
но ведь разница именно в том, что «сказать вода мутная» ≠ «кричать на площади, что завод травит людей».
Есть три уровня:
Наблюдение. Крамник (или кто-то другой) видит несоответствие: за доской 2600, онлайн вдруг «равный» 2800. Это визуальная мутность воды.
Первичная проверка. Тут нужны «лаборанты» - тот же Чессрей, специалисты по статистике и античитерским алгоритмам. Их задача - провести базовый анализ: выборка партий, % очков, совпадения с движками. Если всё в порядке - снимаем вопросы. Если нет - копаем глубже.
Тревога. Только если анализ показал реальные отклонения, можно говорить о «свинце в воде» и требовать расследования.
Проблема Крамника в том, что он перепрыгнул сразу с уровня №1 на уровень №3: из «подозрений» в «публичные обвинения». Это действительно ослабило его позицию. Но было бы ошибкой говорить, что он вообще не должен был фиксировать «мутность».
То, что вы называете «обнародованием подозрений», может быть сделано по-разному. Если это лозунг «онлайн полон мошенников» - да, это митинг. Если это формулировка исследовательского вопроса («есть разрыв между оффлайном и онлайном у конкретных игроков, нужно проверить») - то это сигнал в лабораторию, без которого проверка вообще не начнётся. |
|
|
номер сообщения: 8-575-142973 |
|
|
|
в этой аналогии вода чистой вообще не бывает, чистая вода=умозрительная конструкция. Она всегда была есть и будет мутная. И боле-мене все ето понимают, но потом приходит условная Грета (Крамник в нашем случае) и начинает делать карьеру по сбору донатов на продажу БАДов. |
|
|
номер сообщения: 8-575-142974 |
|
|
|
KomodoLove:
Есть три уровня:
Наблюдение. Крамник (или кто-то другой) видит несоответствие: за доской 2600, онлайн вдруг «равный» 2800. Это визуальная мутность воды.
Первичная проверка. Тут нужны «лаборанты» - тот же Чессрей, специалисты по статистике и античитерским алгоритмам. Их задача - провести базовый анализ: выборка партий, % очков, совпадения с движками. Если всё в порядке - снимаем вопросы. Если нет - копаем глубже.
Тревога. Только если анализ показал реальные отклонения, можно говорить о «свинце в воде» и требовать расследования.
Проблема Крамника в том, что он перепрыгнул сразу с уровня №1 на уровень №3: из «подозрений» в «публичные обвинения». Это действительно ослабило его позицию. Но было бы ошибкой говорить, что он вообще не должен был фиксировать «мутность».
. |
Крамник «перепрыгнул на 3-й уровень» после многомесячных попыток достучаться до тех людей, которые могли бы организовать «первичную проверку». Ответы от этих «людей» мы хорошо слышали… |
|
|
номер сообщения: 8-575-142975 |
|
|
|
В сторону от тем последних страниц.
На Чесскоме есть в статистических данных игрока характеристика- число победных стриков ( последовательная серия) по жанрам ( блиц, пуля, рапид, классика- все отдельно). Это есть и на Личесс, но подробно там не смотрел.
Длина стрика на количество сыгранных партий - это немного интересно. В отрыве от всего, не глядя на другие характеристики. Есть игроки с сериями более 90, есть сильные с 70+, обычно у сильных топов с хорошим наигрышем партий- это 50+. есть середняки, у которых не более 20 при большом числе партий ( нестабильность). Например, Д.Гольцев.
Каруана при полутора тысяч игр в пулю серия что-то 45 ( это большая пропорция).
Мурзин, кажется 47 в пулю. Для примера в тот раз пробежался по рейтингу его соперников. От 1200 и по плавной нарастающей. Видимо, игрок получил стартовый в пулю и решил набить руку и рейтинг. Ничего удивительно в 47 в таком случае. Правда, проиграл он сопернику с рейтом около 1900 в пулю, и потом еще нескольким в том же диапазоне 1900-2000, т.е. не топ игрок в пулю даже по этим данным.
А если не смотреть на игрока, на рейтинг его соперников - а это лишь "поскрести поверхность ", совсем не статистика. То можно шуметь об аномалиях. Где это видано, 2 игрока с около 1400 партиями показывают серии 45+.? ! |
|
|
номер сообщения: 8-575-142976 |
|
|
|
не побоюсь обвинений в буквоедстве :)
Сначала все же нужно определиться, что именно хотим исследовать. Проблема-то есть? Какая именно?
Если говорить о игроке, который офлайн показывает 2600 плюс/минус, а онлайн "играет на равных с игроками уровня Каруаны и Карлсена" или "с игроками 2800", то может быть и есть предмет для разговора
Но ведь ничего подобного и близко нет. Покажите такого игрока сначала. Если говорить о Шиманове, с которого все это началось, так как раз не играет он на равных ни с Карлсеном, ни с 2800. Откуда вдруг возникли как само собой "уровня Карлсена" и "2800"?
Если вернуться к Шиманову, то даже "играет на равных с игроками 2700-2800" нет.
Есть "играет на равных в течение некоторого периода с некоторой произвольно выбранной группой игроков"
Если посмотреть на другой период или на другую группу игроков или переопределить критерий отбора (мне все же очень кажется, что для сравнения подгрупп в игре онлайн надо брать рейтинги в игре онлайн) - то ли есть та самая "аномалия", то ли ее нет
Если даже аномалия есть - насколько она аномальная? насколько аномальна разница в перфомансе в 100/200/300 пунктов?
Насколько это аномалия аномальна - в том смысле, что если верить исходному твиту Крамника, таких игроков, которые совсем не стоят против "неприкасаемых", но неплохо играют с 2700-2800 - как минимум больше одного
То есть, вообще говоря, прежде чем думать про "объяснения", хочется понять, что именно мы хотим объяснить, и есть ли что объяснять
И с еще одной другой стороны - таких "аномалий" Крамник выдает одну за другой. Каждую проверять?
Почему они более аномальны, чем, скажем, та же разница в игре онлайн и офлайн самого Крамника (двести с хвостом пунктов) или разница в игре Крамника в товарищеских матчах и в турнирах (тоже двести с хвостом пунктов), не очень понятно |
|
|
номер сообщения: 8-575-142977 |
|
|
|
FIBM:
Крамник «перепрыгнул на 3-й уровень» после многомесячных попыток достучаться до тех людей, которые могли бы организовать «первичную проверку». Ответы от этих «людей» мы хорошо слышали… |
Не так это совершенно. Первичная проверка проходит просто постоянно. Вторичная- часто, когда есть явные "флаги" или жалобы юзеров. Просьба в лабораторию- показать методики и как конкретно проходит проверка ( а также имя, место жительства и зарплату лаборанта)-никто выполнять не будет по разным причинам. В том числе и неоднократно озвученным.
Розенталь сделал "вторичную" проверку стриков Накамуры. По своей модели. Но ведь и он фальсификатор, как утверждает Крамник! |
|
|
номер сообщения: 8-575-142978 |
|
|
|
vov: не побоюсь обвинений в буквоедстве :)
Сначала все же нужно определиться, что именно хотим исследовать. Проблема-то есть? Какая именно?
Если говорить о игроке, который офлайн показывает 2600 плюс/минус, а онлайн "играет на равных с игроками уровня Каруаны и Карлсена" или "с игроками 2800", то может быть и есть предмет для разговора
Но ведь ничего подобного и близко нет. Покажите такого игрока сначала. Если говорить о Шиманове, с которого все это началось, так как раз не играет он на равных ни с Карлсеном, ни с 2800. Откуда вдруг возникли как само собой "уровня Карлсена" и "2800"?
Если вернуться к Шиманову, то даже "играет на равных с игроками 2700-2800" нет.
Есть "играет на равных в течение некоторого периода с некоторой произвольно выбранной группой игроков"
Если посмотреть на другой период или на другую группу игроков или переопределить критерий отбора (мне все же очень кажется, что для сравнения подгрупп в игре онлайн надо брать рейтинги в игре онлайн) - то ли есть та самая "аномалия", то ли ее нет
Если даже аномалия есть - насколько она аномальная? насколько аномальна разница в перфомансе в 100/200/300 пунктов?
Насколько это аномалия аномальна - в том смысле, что если верить исходному твиту Крамника, таких игроков, которые совсем не стоят против "неприкасаемых", но неплохо играют с 2700-2800 - как минимум больше одного
То есть, вообще говоря, прежде чем думать про "объяснения", хочется понять, что именно мы хотим объяснить, и есть ли что объяснять
И с еще одной другой стороны - таких "аномалий" Крамник выдает одну за другой. Каждую проверять?
Почему они более аномальны, чем, скажем, та же разница в игре онлайн и офлайн самого Крамника (двести с хвостом пунктов) или разница в игре Крамника в товарищеских матчах и в турнирах (тоже двести с хвостом пунктов), не очень понятно |
ваш комментарий — это как раз то, что я и называю «сместить акцент с сути». Попробую по пунктам:
«Покажите игрока, который реально играет на равных с Карлсеном»
Но ведь никто не говорил, что Шиманов вдруг «равен Карлсену» на дистанции тысяч партий. Речь идёт о другом: его результаты онлайн против пула игроков 2700–2800 заметно выше, чем за доской. Это и есть наблюдаемое расхождение. Если использовать вашу же формулировку: «играет на равных в течение некоторого периода с выбранной группой» - этого уже достаточно, чтобы задать вопрос: почему онлайн выборка так резко расходится с оффлайном?
«Нужно брать онлайн-рейтинг для онлайн»
Да, корректное сравнение требует аккуратной методики. Но проблема в том, что Эло именно для того и придуман, чтобы быть универсальным мерилом силы. Если один и тот же игрок в одной среде стабильно держится 2600, а в другой вдруг проявляет 2700+, то вопрос «почему так» остаётся, даже если пересчитать локальные рейтинги.
«Аномалия или нет?»
В науке аномалия не равна «доказанный факт», а значит «наблюдение, которое не объясняется привычной моделью». И если таких наблюдений не одно, а несколько (как вы сами пишете: «как минимум больше одного»), то это веский повод для анализа.
«Каждую проверять?»
Да, каждую. Это и есть нормальная работа: проверять гипотезы, а не отмахиваться. Если Крамник выдает «аномалии одну за другой» - часть из них может оказаться надуманной, часть статистическим шумом, а часть - настоящими выбросами. Выяснить это можно только через проверку, а не через «ну и что, у самого Крамника тоже разница».
Ваша позиция выглядит так, будто вы хотите объявить проблему несуществующей до тех пор, пока не будет приведён игрок, который на глазах у всех за полгода обыграл Карлсена в +10. Но это подмена. Вопрос стоит мягче: почему устойчиво повторяющиеся онлайн-результаты против пула топов расходятся с тем, что тот же игрок показывает оффлайн? Если на него нет ответа - это и есть «аномалия», достойная внимания. |
|
|
номер сообщения: 8-575-142979 |
|
|
|
xajik: Хочу повторить "простую "мысль. Аномалия- это то, что доказано статистически. Статистическая проверка гипотез и тому подобное. Какие-то странные данные в табличке аномалиями не являются , пока нет этих доказательств. Вручную на "коленке" такой массив данных не обрабатывается, чтобы доказать это- Нескольких "Крамников" не хватит. Потому без специалистов, например, Чессрея, не о чем говорить. |
А когда чувак с 2500 5 раз подряд обыгрывает Карлсена - это же тоже не доказанная аномалия? Я правильно понимаю? |
|
|
номер сообщения: 8-575-142980 |
|
|
|
xajik: FIBM:
Крамник «перепрыгнул на 3-й уровень» после многомесячных попыток достучаться до тех людей, которые могли бы организовать «первичную проверку». Ответы от этих «людей» мы хорошо слышали… |
Не так это совершенно. Первичная проверка проходит просто постоянно. Вторичная- часто, когда есть явные "флаги" или жалобы юзеров. ! |
Подмена понятий. Вы просто любые действия называете «первичной проверкой». А речь идет о конкретных вопросах и о «первичной проверки» этих КОНКРЕТНЫХ ВОПРОСОВ. Посудите сами: есть вопрос о разнице между силой игры в онлайне/оффлайне, а чесском на это отвечает у нас есть методики, которые говорят, что все нормально. Это не есть «проверка», так как банально «методика чесскома» не подходит для ответа на этот вопрос.
(По аналогии: вопрос о «мутности воды», а вы отвечаете, что все в порядке, у меня есть методика проверки наличия «примесей в чугуне».) |
|
|
номер сообщения: 8-575-142981 |
|
|
|
bazar: в этой аналогии вода чистой вообще не бывает, чистая вода=умозрительная конструкция. Она всегда была есть и будет мутная. И боле-мене все ето понимают, но потом приходит условная Грета (Крамник в нашем случае) и начинает делать карьеру по сбору донатов на продажу БАДов. |
Ваша аналогия красивая, но слишком скептическая. Если принять её буквально, то разговор становится бессмысленным: «вода всегда мутная, значит, проверять нечего». Но это не так.
- Вода никогда не идеально чистая, верно. Но именно потому и существуют стандарты - допустимые нормы примесей. Важно не то, что в воде «что-то есть», а то, в каких концентрациях.
- В шахматах аналогично: никто не требует «идеальной» корреляции онлайн/оффлайн. Но если расхождение в 50-100 Эло - это «примеси в норме», то скачок в 200+ пунктов - уже повод проверить, не превышен ли лимит.
Теперь про «Грету». Крамник действительно делает это эмоционально, и часто перегибает. Но ведь появление громкого «будильника» не отменяет того, что повод для проверки есть. Считать, что любой, кто говорит о проблеме, «делает карьеру на БАДах», - значит заранее обесценивать любой сигнал тревоги.
Да, онлайн-блиц никогда не будет «чистой водой» - там всегда будут и особенности формата, и апстрики, и удобные/неудобные соперники. Но если мы заранее махнём рукой: «всё мутно, всегда так было», - то тогда и обсуждать нечего. А ведь мы тут именно обсуждаем, где заканчивается «естественная мутность», и начинается уже что-то, что требует лабораторного анализа. |
|
|
номер сообщения: 8-575-142982 |
|
|
|
«Нужно брать онлайн-рейтинг для онлайн» это вообще как бы, ну как бы вам сказать то...
Так ни одного читера не поймаешь?
Если у кого-то в реальном спорте результаты без допинг-контроля и с ним расходятся в разы, вы что, тоже будете вещать, что "для игр без допинг-контроля нужно брать результаты без него, а там ничего подозрительного нет"? А ведь вы сейчас предлагаете по факту то же самое, брать рейтинги там, где легко читерить, чтобы оценивать вероятность читерства. |
|
|
номер сообщения: 8-575-142984 |
|
|
|
я не обесцениваю любой сигнал тревоги - в первом выступлении Крамника даже я нашёл 2-3 зерна, требующих дальнейшей работы, все свои сигналы Крамник обесценил сам.
Но помимо общего согласия в том что работа со статаномалиями (если их получше сформулировать) интересна - я отмечу ещё и то что на мой взгляд вы чересчур переоцениваете сам рейтинг ЭЛО в качестве инструмента для подобной работы - он напоминает скорее грязный нож мясника чем стерилизованный скальпель хирурга. Не случайно ФИДЕ с такой силой до сих пор противится обсчёту единого (для разных видов и контролей) рейтинга, а то что мы наблюдаем расхождения между обсчётами разных рейтингов - ну, а как иначе-то? У каждого игрока 6 разных рейтингов (три наци и три ФИДЕ), а ещё разные рейтинги на каждой платформе по разным видам - они все ЭЛО, и все одинаково грязные, ИМХО непригодные для вашей программы исследований. |
|
|
номер сообщения: 8-575-142985 |
|
|
|
И снова к реальности.
Кто будет устанавливать единые для всех платформ критерии подозрительности?
Кто будет способен/обязан проводить по ним проверки? |
|
|
номер сообщения: 8-575-142986 |
|
|
|
bazar: я не обесцениваю любой сигнал тревоги - в первом выступлении Крамника даже я нашёл 2-3 зерна, требующих дальнейшей работы, все свои сигналы Крамник обесценил сам.
Но помимо общего согласия в том что работа со статаномалиями (если их получше сформулировать) интересна - я отмечу ещё и то что на мой взгляд вы чересчур переоцениваете сам рейтинг ЭЛО в качестве инструмента для подобной работы - он напоминает скорее грязный нож мясника чем стерилизованный скальпель хирурга. Не случайно ФИДЕ с такой силой до сих пор противится обсчёту единого (для разных видов и контролей) рейтинга, а то что мы наблюдаем расхождения между обсчётами разных рейтингов - ну, а как иначе-то? У каждого игрока 6 разных рейтингов (три наци и три ФИДЕ), а ещё разные рейтинги на каждой платформе по разным видам - они все ЭЛО, и все одинаково грязные, ИМХО непригодные для вашей программы исследований. |
согласен, тут есть два уровня разговора:
Крамник и его стиль.
Да, вы правы - он сам обесценил многие свои сигналы, подавая их в форме эмоций и обвинений. Поэтому нормальный научный разговор должен идти отдельно от его «медийного шума».
Эло как инструмент.
Тут я бы уточнил: я вовсе не идеализирую Эло. Это действительно скорее «грязный нож мясника», чем стерильный скальпель. И в том числе поэтому ФИДЕ держит разные рейтинги для разных контролей - система слишком грубая, чтобы работать «универсально».
Но вот в чём принципиальное различие:
- Когда мы говорим о сравнении разных эпох, разных регионов, разных пулов - Эло действительно рассыпается, и тут ваш аргумент справедлив.
- Когда мы говорим об одном и том же игроке в одно и то же время, играющем против тех же соперников и оффлайн, и онлайн - тогда Эло работает не как «абсолютный эталон», а как агрегатор конкретных результатов. И здесь он вполне годится, чтобы фиксировать расхождения.
Другими словами: для глобальных исследований Эло «грязный». Для точечных сравнений в пределах одного пула - достаточный. Это как линейка: да, она кривая на миллиметр, но если у вас на глазах кто-то вырос на 20 см, вам не нужен лазерный измеритель, чтобы заметить разницу.
Ваша критика Эло справедлива, но она не отменяет факта, что разрыв в 150–200 пунктов, фиксируемый этой системой при прочих равных условиях, - это всё равно аномалия, требующая анализа. |
|
|
номер сообщения: 8-575-142990 |
|
|
|
да, согласен, ну, почти - дело в том что у одного человека одновременно много разных рейтингов - и они как правило (а не как аномалия) существенно отличны промеж собой.
Например, если мы ищем аномалии в игре онлайн на какой-то платформе - ну очевидно что агрегирует результаты именно рейтинг этой платформы, а вовсе не ФИДЕшные три рейтинга, агрегировавшие совсем другие результаты других турниров по другим правилам. И тут очень-очень много поводов для злоупотреблений |
|
|
номер сообщения: 8-575-142991 |
|
|
|
Billy Bоnes: И снова к реальности.
Кто будет устанавливать единые для всех платформ критерии подозрительности?
Кто будет способен/обязан проводить по ним проверки? |
эти вопросы решаются просто:
Критерии. Их должны задавать сами платформы (FIDE, Chess.com, Lichess) совместно с экспертами по античиту. Это уже делается: есть метрики совпадений с движками, аномалии по скорости ходов, статистика по пулу соперников.
Проверка. Проводят независимые античитерские команды у каждой платформы, плюс можно подключать внешних аналитиков (Chessreya и др.).
То есть «единый центр» не нужен - достаточно, чтобы у каждой площадки были прозрачные правила и методики. А обсуждения в духе Крамника как раз подталкивают их к доработке критериев и к более открытой проверке. |
|
|
номер сообщения: 8-575-142993 |
|
|
|
bazar: да, согласен, ну, почти - дело в том что у одного человека одновременно много разных рейтингов - и они как правило (а не как аномалия) существенно отличны промеж собой.
Например, если мы ищем аномалии в игре онлайн на какой-то платформе - ну очевидно что агрегирует результаты именно рейтинг этой платформы, а вовсе не ФИДЕшные три рейтинга, агрегировавшие совсем другие результаты других турниров по другим правилам. И тут очень-очень много поводов для злоупотреблений |
Согласен: у игрока много рейтингов, и сравнивать «всё со всем» нельзя. Решение - локальная методика + кросс-проверка:
Онлайн анализ - только внутри платформы.
Берём рейтинг и партии этой платформы, строим ожидаемый % очков по разнице рейтингов и сравниваем с фактом. Смотрим устойчивый «оверперф» (эквивалент +150–200 Эло) на длинной дистанции и по бинам соперников.
Контроль на “злоупотребления”.
- Пререгистрация критериев (порог эффекта, объём выборки, периоды).
- Никакого ручного отбора: прогоняем всех с достаточным числом партий.
- Открытая методика + код, независимая репликация.
Кросс-сверка с оффлайном - как отдельный слой.
Мы не смешиваем рейтинги, а сравниваем дельту: стабильный уровень за доской vs стабильный «оверперф» онлайн. Где есть пересечения соперников - отдельно отмечаем.
Так снимается и вопрос «много рейтингов», и риск «подгонки»: каждый прогоняется по одной и той же сетке, внутри одной платформы; «аномалией» считаем только сильный, длительный и реплицируемый сдвиг. |
|
|
номер сообщения: 8-575-142994 |
|
|
|
KomodoLove:
А вот онлайн-картина выглядит иначе: там внезапно получается, что тот же самый игрок даёт серию матчей или целые турниры, где выходит «на равных» с людьми, до которых он за доской никогда не дотягивал. |
указаный игрок было во вторниках 1 раз вторым, пару раз третьим и еще несколько - в пятерке. с кем он вышел на равных, бога ради? какой "системный сдвиг"?
его результат "аномально высок" против двух игроков - шонга и бортника; с ними в этой статистике он + много на дистанции в десяток партий суммарно, что на масштабе в 50 партий всего разумеется вносит некоторое отклонение от нормы - и это примерно все, что там есть "аномального" |
|
|
номер сообщения: 8-575-142995 |
|
|
|
KomodoLove: Но обратите внимание: в оффлайне у него было достаточно турниров, чтобы хотя бы раз закрепиться выше 2700 — и этого не произошло. |
и это тоже не верно. что бы "закрепиться выше 2700" нужно в хороший день пвчечку этих 2700 обыграть. турниров, где это было технически возможно, у него за последние несколько лет было - два чм по блицу. в первом из которых за два тура до финиша у него был перформанс за 2700, включая ничбю с тем самым накамурой, с которым он "не может играть". в итоге перф упал до 2685 после баранок от магнуса и кеймера. |
|
|
номер сообщения: 8-575-142996 |
|
|
|
FIBM: xajik: FIBM:
Крамник «перепрыгнул на 3-й уровень» после многомесячных попыток достучаться до тех людей, которые могли бы организовать «первичную проверку». Ответы от этих «людей» мы хорошо слышали… |
Не так это совершенно. Первичная проверка проходит просто постоянно. Вторичная- часто, когда есть явные "флаги" или жалобы юзеров. ! |
Подмена понятий. Вы просто любые действия называете «первичной проверкой». А речь идет о конкретных вопросах и о «первичной проверки» этих КОНКРЕТНЫХ ВОПРОСОВ. Посудите сами: есть вопрос о разнице между силой игры в онлайне/оффлайне, а чесском на это отвечает у нас есть методики, которые говорят, что все нормально. Это не есть «проверка», так как банально «методика чесскома» не подходит для ответа на этот вопрос.
(По аналогии: вопрос о «мутности воды», а вы отвечаете, что все в порядке, у меня есть методика проверки наличия «примесей в чугуне».) |
Нет. Тут как раз аналогия работает нормально Рутинная (иногда чаще чем ежедневно) проверка воды, систематическая проверка продуктов и т.д.- это аналогично автоматической проверке Чесскома и Личесса, и мных площадок. "Полуторная поверка"- это когда у лаборанта что-то "зазвенело" в анализах, он перепроверяет плюс требует совета. Вторичная- это подключение модераторов и т.д. В случае Ригана и его методов- первичной, наверно. можно назвать проверка на "дребезг" ( есть флаг или нет) арбитрами соответсвию "нормализации" . Вторичной-более глубокая тщательная и несколькими разными методиками того же Ригана ( часто им самим).
По поводу примесей в чугуне Чесскома.
1. Продолжая "лить воду" . Чесском "отвечает" за "качество воды в кране". Какое качество воды в водозаборе - не его дело. Хотя можно предположить, что если качество "из крана" в норме, то и загрязнения бочками в "водохранилище" вряд ли выливают. То есть игра Шиманова- не вызывает у них статистических претензий. У него вода в кране нормальная.
2. Это "не волнует" Чесском в том числе и потому, что сравнение онлайн и отб, и попытка "переноса рейтингов"- это очень сложная и большая тема. Это не под силу Чесскому ( или очень затратно)...
Пример Шиманова. Если он не читерит за доской (отб).И не читерит в онлайне ( по уверениям Чесскома), то какая существенная практическая разница в том, что его рейтинги в разных жанрах не совсем совпадают? Если в водохранилище вода в норме по стандартам и из крана, то какая разница, что химический состав несколько различается ? Речь о конкретном примере, глобальные вопросы "переноса рейтингов" по-своему интересны, но пока никто их не решал . |
|
|
номер сообщения: 8-575-142997 |
|
|
|
KomodoLove:
- Пререгистрация критериев (порог эффекта, объём выборки, периоды).
- Никакого ручного отбора: прогоняем всех с достаточным числом партий.
- Открытая методика + код, независимая репликация. |
и да, вам к чессрею. он именно этим и занимается, чем приводит крамника в состояние иступления |
|
|
номер сообщения: 8-575-142998 |
|
|
|
Billy Bоnes: И снова к реальности.
Кто будет устанавливать единые для всех платформ критерии подозрительности?
Кто будет способен/обязан проводить по ним проверки? |
Почти во всех игровых онлайн процессах, где есть деньги и люди "играют на деньги", есть независимые комиссии и проверки. На игровых сайтах висят "наклейки"- проверено ГОСТОМ игровой комиссии острова М.,одобрено группой экспертов Л. и т.д
Чесском в свое время делал что-то подобное. Например, Американская шахм. федерация что-то там у них одобрила , лет 7 назад. Но кто входил в ту комиссию- не совсем понятно, хотя можно спросить...Также у них было нескоько экспертиз у сторонних организаций.
Но общего подхода нет, как и общих "Гостов" тут, и это не очень хорошо. Фиде не будет это делать, вероятно, потому, что они выбрали вариант , отличающийся от "статистического доказательства мошенничества". |
|
|
номер сообщения: 8-575-142999 |
|
|
|
|
|
|
|
|
Copyright chesspro.ru 2004-2025 гг. |
|
|
|