czwartek, 23 października 2014

Statystyka, szachowy ranking i jego zmiany: drobne matematyczne cuda szachowe okiem amatora (3)

Wiele razy zastanawiałem się nad tym jak mogą nam pomagać wykresy w tym, aby lepiej realizować nasz szachowy potencjał. Jednym z takich przykładów jest wykres (i zawarte w nim dane), który jest generowany na podstawie rozegranych partii na serwerze FICS. Tym razem omówię po kolei poszczególne elementy, a potem ich wpływ i znaczenie związane z odczytywaniem istotnych informacji na temat naszego poziomu gry (jako uzyskiwanych wyników przeciwko zawodnikom w danym przedziale) oraz określeniem przedziału rankingowego przeciwników, którzy optymalnie wpłyną na nasz rozwój szachowy.

Najważniejsze jest to, aby być świadomym, że wykres (w tym wypadku słupkowy) jest to tylko pewne narzędzie, które dostarcza nam informacji, które WYŁĄCZNIE po poprawnej interpretacji mogą służyć do wyciągnięcia prawidłowych wniosków i sformułowania zaleceń co do naszej pracy (treningu). Pamiętajmy, że nie muszą one oznaczać "jedynej prawdy", lecz raczej wskazują kierunek poszukiwań. Dzięki temu możemy łatwiej wyłowić istotne wnioski i dzięki temu wiedzieć co w naszej grze należy poprawić czy chociażby na co zwrócić uwagę.

Wracamy do wykresu i jego interpretacji.

Karta hipotetycznego zawodnika prezentującego osiągnięcia w roku 2014 (do 22 października)
(w postaci wykresu słupkowego) na podstawie partii standard rozegranych na serwerze FICS

Jest to wykres zawodnika, utworzony w dniu wczorajszym (2014-10-22) za rok 2014. Oznacza to, że zawiera on analizę (prezentację) danych za okres blisko 10 pełnych miesięcy.

Jego nagłówek można przetłumaczyć jako: "rozkład rankingu przeciwników i uzyskiwane osiągnięcia". Po lewej stronie mamy opis "ilość przeciwników" (wartości od 0 do 40), zaś po prawej "uzyskany ranking" (skala od 0 do 2500).

Teraz bardziej istotne informacje. Zielone słupki (a dokładniej podane wartości liczbowe nad nimi) oznaczają ilość przeciwników (z którymi rozgrywaliśmy partie), zaś czerwone - ranking uzyskany. Pod spodem mamy podane odpowiednie przedziały rankingowe (naszych przeciwników); tutaj jest ich 10: od 1300 do 2300 (każdy co 100 punktów).

Niebieska elipsa ukazuje nam przedział rankingowy 1500-1600. Jakie dane możemy z niego odczytać? Otóż zawodnik rozegrał partie przeciwko 11 przeciwnikom. Biorąc pod uwagę ich (oraz swój) ranking, uzyskał z nimi wynik rankingowy (ang. rating performance) w wysokości 1835 punktów. Analogicznie w przedziale 1700-1800 rozegrał partie przeciwko 36 przeciwnikom z uzyskanym wynikiem rankingowym 2027.

W jaki sposób można wyciągać wnioski z tego typu danych ukazanych na wykresie? Ja to robię tak: posługuję się kilkoma założeniami, dzięki którym wyciągam bardziej wiarygodne wnioski.

1. Jeśli zawodnik rozgrywa partie przeciwko wielu różnym przeciwnikom, to prawdopodobieństwo tego, że "znalazł system" (sposób na wygrywanie) na jednego (lub kilku) przeciwników jest bardzo małe. Pamiętajmy bowiem, że wraz ze wzrostem ilości przeciwników zwiększa się także różnorodność rozgrywanych przez nich pozycji oraz tzw. stylu gry. To z kolei powoduje, że musimy się wykazać większą siłą gry (czy też jak kto woli: dużo głębszym bądź bardziej wszechstronnym zrozumieniem gry i umiejętnościami), po to, aby ogrywać dużo bardziej różnorodnych przeciwników.

2. Jeśli zawodnik uzyskuje wynik ponad maksymalną wartość przedziału rankingowego, oznacza to, iż radzi sobie z ogrywaniem zawodników z tej grupy. Przykładowo jeśli przedział wynosi 1500-1600, a zawodnik uzyskuje wynik (tzw. ranking uzyskany) znacznie powyżej 1600 (powiedzmy 1750-1850), wówczas można stwierdzić, że "już umie (tzn. nauczył się) ogrywać przeciwników mających ranking od 1500 do 1600".

3. Im większa różnica pomiędzy wartością przedziału rankingowego a uzyskiwanym wynikiem, tym bardziej prawdopodobne, że dalsze rozgrywanie partii przeciwko tej grupie przeciwników nie będzie wpływało pozytywnie na rozwój szachowy. Inaczej mówiąc: wpływ na wzrost poziomu i zrozumienia gry będzie znikomy (czy nawet zerowy). Dochodzi do tego jeszcze to, że jeśli (stale) rozgrywamy partie z zawodnikami bardzo mocno odbiegającymi od naszego maksymalnego poziomu - wówczas istnieje bardzo duże niebezpieczeństwo, że nasze błędy (zwłaszcza te istotne dla naszego rozwoju!) nie będą w ogóle wykazywane (tzn. ujawniane w czasie gry) przez naszego przeciwnika. To z kolei najczęściej prowadzi do stagnacji, a więc zatrzymania się w szachowym rozwoju (a niekiedy nawet i regresu - czyli cofania się w rozwoju!).

4. Im większa ilość partii przeciwko danej grupie zawodników, tym większe prawdopodobieństwo, że wyciągane przez nas wnioski będą (maksymalnie) wiarygodne. Chodzi głównie o to, aby wnioski były opierane na możliwie jak największej liczbie partii. Jeśli jest to co najmniej wartość 50-60 partii, wówczas można śmiało założyć, że uzyskiwane wyniki nie są dziełem przypadku, lecz umiejętności.

Zobaczmy teraz jak te wyżej opisane założenia będą miały wpływ na wyciągane przez nas wnioski. Poniżej poszczególne grupy podzielone na kategorie (w nawiasie ilość przeciwników).

A. 1500-1600: 1835 (11)
B. 1600-1700: 1954 (38)
C. 1700-1800: 2027 (36)
D. 1800-1900: 1990 (25)
E. 1900-2000: 1994 (10)
F. 2000-2100: 1633 (3)
G. 2100-2200: 1771 (2)
H. 2200-2300: 2228 (1)

Moim zdaniem wynik można uznać za istotny (jak kto woli: wiarygodny), gdy rozgrywamy partie (w danym przedziale rankingowym) przeciwko co najmniej 8-10 przeciwnikom. Wówczas można przyjąć, że nie mamy opracowanego schematu, którym stale ogrywamy kilku przeciwników (tzw. "klientów") na podstawie bardzo dobrej znajomości (analizy) ich stylu gry czy też rodzajów popełnianych błędów.

Z powyższego wynika, że w przypadku A "przebicie" wynosi 235 pkt (obliczane jako różnica pomiędzy uzyskanym wynikiem a maksymalną granica rankingową: tutaj jest to: 1835-1600), w B - 254, w C - 227, zaś w D już tylko 90 pkt.

Powiedziałem wcześniej (założenie nr 3), że im większe przebicie przedziału, tym mniejsza szansa na to, że dalsze granie partii przeciwko zawodnikom z danego przedziału (grupy) będzie pomagało w polepszeniu poziomu gry (czy jak kto woli: głębszego jej zrozumienia).

Tak jest w przypadku mocnego przebijania w przypadkach A, B oraz C (w każdym wypadku po nieco ponad 200 punktów). Oznacza to w naszym przypadku, iż dalsza gra przeciwko zawodnikom z przedziału 1500-1800 nie będzie pomagała w rozwoju szachowym.

A co się dzieje dalej? Otóż w przypadku D (przedział 1800-1900 i wynik uzyskany 1990) przebicie wynosi już jedynie 90 oczek. Niemniej dalej jest "na plusie" (i do tego wartość jest większa niż kilka punktów). Tak więc dalsze ogrywanie przeciwników z tej grupy również nie da oczekiwanych wyników (w domyśle: lepszego poziomu gry). Jednak już w przypadku E mamy zupełnie inny obraz. Z analizy danych wynika bowiem, że przebicie jeszcze nie jest nawet zerowe (1994-2000 =-6, tak więc już niewiele brakuje do "przebicia zerowego"), więc dobrze było jeszcze trochę pograć, tak aby przebicie było na poziomie co najmniej +30 punktów.

Czy warto natomiast grywać już z zawodnikami z grupy 2000-2100? Jest to jak najbardziej wskazane, ponieważ wyniki uzyskiwane w tym przedziale są bardzo słabe - zaledwie 1633 (chociaż było także jedynie 3 przeciwników), a więc nie było jeszcze możliwości zobaczenia (sprawdzenia) na ile skutecznie jest w stanie nasz zawodnik stawić opór tym, którzy przekroczyli już poziom 2000.

Warto jeszcze zwrócić uwagę na to jak łatwo można się złapać, gdy nie jesteśmy uważni i bezkrytycznie odnosimy się do cyferek (statystyk). Przykładowo: w przypadku H wynik jest zadziwiająco niebotyczny! Raz jeszcze zobaczmy: 2200-2300: 2228 (1). Skąd taki wysoki wynik? Otóż dzięki jedynej partii (remisowi) przeciwko zawodnikowi mającemu 2228. Czy można to uznać zatem za wiarygodne?! Absolutnie nie! To jedynie przykład, który ma służyć za przestrogę. Nie wolno bowiem wyciągać (wiarygodnych) wniosków na podstawie jednej partii z jednym przeciwnikiem.

Jakie zatem wnioski ogólne możemy wyciągnąć z naszych rozważań? Zalecenie jest bardzo proste:
1) trzeba całkowicie zaniechać (lub ograniczyć do absolutnego minimum) rozgrywania partii z zawodnikami poniżej poziomu 1900,
2) konieczne jest rozgrywanie coraz więcej partii z (różnymi) przeciwnikami w grupie 2000-2100,
3) obowiązkowo należy nauczyć się skuteczniej ogrywać zawodników z przedziału 1900-2000 (tak, aby uzyskać przebicie na poziomie co najmniej +30 punktów).

Można bowiem stwierdzić, że nasz analizowany zawodnik już bardzo dobrze opanował sztukę ogrywania "słabeuszy" (do poziomu 1900 na FICS), zaczyna coraz lepiej (skuteczniej) walczyć z tymi w przedziale 1900-2000, ale przeciwko zawodnikom 2000-2100 jeszcze nie jest w stanie "pokazać pazurów". Idealnie byłoby zatem ustalić przedział poszukiwanych przeciwników na 1950-2050. W ten sposób będzie możliwy optymalny postęp, pomimo tego, że będzie to wymagało dodatkowej pracy (chociażby analizy partii, wyciąganie wniosków i praca nad najbardziej istotnymi słabościami).

Mam cichą nadzieję, że pokazałem w jaki sposób można wyciągać istotne wnioski na podstawie informacji, które są nam dostępne. Oczywiście należy stale pamiętać o tym, że nie jest to najlepszy (a tym bardziej jedyny!) sposób analizy danych. Dlaczego? Chociażby z uwagi na to, iż brakuje istotnej danej: ilości rozgrywanych partii. Zupełnie inaczej traktujemy wynik "przebicia" danej grupy (np. +60), gdy rozegraliśmy 20 partii, a całkiem inaczej gdy było to 200 partii. Niemniej na pewno tego typu wykresy można wykorzystać do wyznaczenia kierunku naszej dalszej pracy nad szachami. Jednym z takich drogowskazów może być przykładowo określenie przedziału rankingowego przeciwników, którzy w optymalnym stopniu pomogą nam w odkryciu naszych słabych stron (zakładamy, iż dzięki ich dobrej grze wyjdą na wierzch nasze najbardziej istotne błędy i słabości). Natomiast dzięki temu nasz trening będzie dużo bardziej efektywny i przy solidnej pracy szybciej będziemy w stanie przebić się na kolejny poziom szachowego mistrzostwa.

Przy okazji przypominam, że to co prezentuję to moje indywidualne podejście do tematu odbioru danych statystycznych - co wcale automatycznie nie oznacza to, że jest ono dobre. Staram się jedynie dzielić moimi doświadczeniami i wiedzą (opinią) związaną z tym tematem. Jestem absolutnie pewien, iż osoby, które znają się dobrze na statystyce, wyciąganiu z nich najbardziej istotnych informacji oraz wniosków - zapewne byłyby w stanie o niebo lepiej przedstawić dane zagadnienia. Na razie jednak nie znam takiego miejsca (zwłaszcza w języku polskim), które omawia i wyjaśnia tego typu tematy (a poszukiwałem nieco i nie udało mi się znaleźć). Dlatego moim zadaniem jest pobudzić do zrealizowania tego zadania przez innych - zwłaszcza jeśli nie spodoba im się to co i jak na ten temat pisuję. Jeśli na podstawie moich wypocin uda się kogoś sprowokować (zachęcić) do fachowego i przystępnego wyjaśnienia takiego obszaru szachowej wiedzy to na pewno byłoby to dla mnie duże wyróżnienie i jednocześnie poczucie dumy.