Vladimir Kramnik publica a segunda parte de sua metodologia de detecção de fair play, hoje no World Chess

GMVladimir Kramnik, o 14º campeão mundial de xadrez incontestável, incendiou o jogo com suas investigações reveladoras sobre trapaças. Agora seus relatórios estão completos.
Na semana passada, o World Chess publicou aParte Um, estabelecendo a premissa de suas descobertas: detectar o uso de engine é um problema de benchmarking. Estamos de volta para finalizar o trabalho com aParte Dois, explicando o método real.
O ponto central de Kramnik é que a maioria dos sistemas antidoping comete um erro: eles calculam a média de tudo. Eles analisam a precisão geral de um jogador, ou a porcentagem de lances que correspondem à melhor escolha do engine, em todas as suas partidas de uma só vez.
O que os trapaceiros fazem
Um trapaceiro sofisticado derrota isso facilmente. Ele usa o engine apenas em momentos críticos ou partidas críticas, e joga o resto honestamente. Suas médias permanecem dentro da faixa humana normal.
Kramnik compara isso a um médico que relata a temperatura média de seus pacientes — metade com febre, metade com frio — e conclui que a enfermaria está saudável. A média é insignificante quando esconde duas coisas muito diferentes.
Sua solução é usar um amplo conjunto de parâmetros separados, cada um com seu próprio benchmark, em vez de um único número combinado. Exemplos incluem precisão em apuros de tempo (10 segundos ou menos no relógio), taxa de erros, desempenho em posições piores e a proporção de lances difíceis que um jogador encontra.
Um trapaceiro pode manter seus números gerais normais, mas não consegue manter todas essas medidas individuais normais ao mesmo tempo.
O artigo mostra dois gráficos. O primeiro é das partidas consecutivas de blitz online do GMMagnus Carlsen: seus dois níveis de precisão mais comuns estão próximos, que é a aparência do jogo limpo.
O segundo é de um jogador não nomeado com rating abaixo de 2600, cujos dois níveis mais comuns estão distantes — um no nível dos dez melhores, outro no nível de grande mestre fraco. A média entre eles parece normal. A diferença entre eles é o sinal de alerta.
Kramnik também aborda a principal crítica à sua abordagem — que isolar "blocos" suspeitos de partidas é escolher a dedo. Sua resposta: a detecção de trapaças não é análise de dados padrão. A análise padrão pressupõe dados limpos; aqui você não pode presumir que qualquer partida foi jogada de forma justa, então isolar os trechos suspeitos é o único método que funciona.
Baixe a parte 2 do artigo de Kramnik sobre detecção de trapaças.