poniedziałek, 1 kwietnia 2013

Statystyka, szachowy ranking i jego zmiany: drobne matematyczne cuda szachowe okiem amatora (2)

Tym razem chciałbym pokazać na „żywym przykładzie” dlaczego przypisywany do nas ranking nie jest tym samym co nasze cechy, które można nazwać obiektywnymi. Jeśli bowiem mamy 180 cm wzrostu i ważymy 80-85 kg i posiadamy niebieskie (błękitne) lub brązowe (piwne) oczy, to jest to informacja praktycznie dla wszystkich niezależna, prawda? Natomiast uzyskiwany ranking (zarówno ten wysoki jak i niski) może być bardzo podatny na przekłamania. Zwłaszcza wtedy, gdy nie chcemy bądź nie potrafimy krytycznie podchodzić do tego co widzimy. Być może poniższy krótki wykład pomoże w „opadnięciu klapek założonych na oczy”, wszystkim tym którzy są pewni, że „twój ranking zawsze mówi prawdę o tobie”. Czy aby naprawdę? Przyjrzyjmy się zatem temu co tak naprawdę powinien dla nas znaczyć ranking i uzyskiwane przez nas wyniki.

Na serwerze FICS funkcjonuje bardzo rozbudowany system rankingowy oparty o świetny system rankingowy opracowany przez profesora Marka Glickmana – nazywany roboczo „systemem Glicko” (tak, oprócz systemu profesora ELO są także inne stosowane w praktyce).

Poniżej prezentuję stronę autora systemu rankingowego używanego w szachach (właśnie na serwerze FICS, ale także przez inne federeacje – między innymi amerykańską USCF).

Dodatkowo dość „prosto” opisane systemy rankingowe Glicko i ulepszona wersja, czyli Glicko-2. Fascynująca lektura dla tych, którzy lubią wiedzieć skąd co się bierze, co oznacza i znają język angielski. Dobrze jest kilka razy przeczytać te dokumenty, gdyż fachowy język może na początku nieco odstraszać. Zapewniam jednak, że większość najistotniejszych informacji można zrozumieć  (dokumenty w formacie PDF).

System jest naprawdę bardzo zaawansowany, jednak jeśli nie rozumiemy jego istoty, lecz spoglądamy wyłącznie na cyferki stojące przy naszym nicku, wówczas możemy się nieźle nabrać. Co to oznacza w praktyce? Otóż przy początkowym „rozruchu” dzięki wykorzystywaniu pewnych cech (dzięki znajdowanych w nich „lukach”) systemu rankingowego Glicko (stosowanego na FICS) można dość szybko zdobyć relatywnie bardzo wysoki ranking. Warto podkreślić jednak, że w zamian za „szybkie nabicie” system ukazuje wyraźnie, że nasz ranking nie jest ustabilizowany (a więc dla tych co wiedzą co znaczy mała wartość „RD” – bardzo mało wiarygodny).

Postanowiłem sprawdzić w praktyce jak zachowa się ranking, gdy z początkowego poziomu (na serwerze FICS każdemu zawodnikowi jest nadawany ranking 1720 przed rozegraniem pierwszej partii) uda się wygrać kilkanaście partii pod rząd – i to bez zaliczenia porażki, remisu czy bez „ustawianych partii”. Dodam, że eksperyment przeprowadzałem w okresie niecałych 7 miesięcy. Żaden z uczestników nie był świadomy, że jest jego uczestnikiem – był to zatem tak zwany eksperyment naturalny.

Rozgrywałem partie szachowe nie klasyczne, lecz tak zwane „Szachy 960” (znane również jako szachy Fischera lub szachy losowe). I ku mojemu wielkiemu zdziwieniu udało mi się zrealizować mój pomysł, a przy tym uzyskać dość wysoki ranking – bo aż nieco ponad 2100. Zatem z początkowego poziomu 1720, po wygraniu 15 partii z rzędu z zawodnikami o średnim rankingu 1600 – system dodał do wyjściowego rankingu aż 380 oczek. Tak więc pokazałem i udowodniłem sobie, że można bez ogromnych wyrzeczeń... osiągnąć ranking 2100. Tak, właśnie dzięki "sztuczkom z rankingiem" lub wykorzystaniu jego specyficznych elementów ("krytycznych luk").

Zmiany rankingowe (kolor zielony) przy 14 wygranych partiach pod rząd - aż do przecięcia rankingu 2100.

Pojawia się jednak pytanie czy tego typu osiągnięcie należy traktować poważnie i bardzo się z niego cieszyć. Według mnie z pozytywnego (zakończonego sukcesem) przeprowadzenia eksperymentu na pewno tak, natomiast w sensie szachowego rozwoju – raczej należy patrzeć na ten wynik nieco humorystycznie, ze znacznym przymrużeniem oka... i dużym dystansem. Dlaczego?

Otóż dopiero po rozegraniu znacznie większej ilości partii byłaby szansa, aby można było w pełni zachwycać się takim wynikiem. No dobrze – ale jak duża musi być ta „znacznie większa ilość partii”? Według mnie dopiero po rozegranych co najmniej 100 partiach można mówić o takim elemencie jak wiarygodność rankingu.

Jaką wartość w praktyce ma dla nas ten eksperyment? Według mnie z pewnością należy zwrócić uwagę na następujące zagadnienia. Mianowicie musimy zwracać szczególną uwagę na to czym jest ranking, jakie jest jego znaczenie i jak do niego podchodzić. Oto moje wskazówki:
  1. Ranking (uzyskany wynik) osiągnięty w bardzo krótkim przedziale czasu nie powinien być traktowany poważnie. Dlaczego? Geniuszem przez 5 minut może być każdy z nas, ale bycie silnym zawodnikiem codziennie to już domena tylko nielicznych. Jak mawiał jeden z amerykańskich młodych arcymistrzów (GM Hikaru Nakamura): „Forma szachowa może być chwilowa, zaś klasa zawodnika jest zawsze stała”.

  2. Ranking (uzyskany wynik) osiągnięty w bardzo niewielu partiach również nie powinien być traktowany poważnie. Remisowanie bądź też ogrywanie mistrzów w 3 partiach rocznie nie świadczy o naszym mistrzostwie. Jednak ogrywanie (bądź remisowanie) mistrzów w co trzeciej partii – to już bardzo duże osiągnięcie.

  3. Na początkowym okresie rozgrywanych partii może dochodzić do wielu zaburzeń (zarówno pozytywnych jak i negatywnych) – dotyczy to zarówno grania przez Internet jak też grania w realu po dłuższej przerwie. Warto o tym szczególnie pamiętać, gdy nasz poziom ulega zmianie – zwłaszcza, gdy cofamy się o 2 kroki, by zaraz wystrzelić 3 lub 4 do przodu.

  4. Ranking (uzyskany wynik) osiągnięty ze zbyt słabymi przeciwnikami nie powinien być traktowany poważnie. Ogrywanie głuchych i ślepych (z całym szacunkiem dla tej grupy graczy), którzy grają jedynie dla zabawy – raczej nie będzie świadczyło o tym, że jesteśmy silnymi zawodnikami, tylko znaleźliśmy się w grupie w której „jednooki wśród ślepców jest królem”. Na pewno świadczy to o jednym – dobrze (lub znakomicie) radzimy sobie ze słabymi przeciwnikami. Pytanie czy rozwiązywanie zadań z matematyki na poziomie szkoły podstawowej lub gimnazjalnej naprawdę świadczy o tym, że jesteśmy biegli w matematyce?

  5. Ranking (uzyskany wynik) powinien być analizowany w odniesieniu do pewnych okresów czasu – przede wszystkim porównywany z wynikami osiągniętymi poprzednio. Jeśli poprzednio nasz ranking wynosił 1200, 1300, 1400, 1500, 1600 a obecnie stale utrzymujemy poziom rankingowy 1650-1700, to z pewnością widać wyraźnie, że robimy postępy. Z kolei jeśli poprzednie okresy rankingowe układały się następująco: 1900, 1800, 1700, 1600 i doszliśmy do poziomu 1550-1500, który stale utrzymujemy i nie możemy wbić się na kolejny (wyższy), to co to może oznaczać? Zwykle albo jest to kryzys szachowy (popularny „spadek formy” bądź regres) albo też nadany ranking początkowy był zdecydowanie zbyt wysoki i następuje „bolesna kalibracja”.

  6. Ranking (uzyskany wynik) powinien być ZAWSZE krytycznie interpretowany. Tutaj wiele osób zapomina, że mat na szachownicy jest jednoznacznie interpretowany, natomiast „magia rankingu” sprawia, że wiele ludzi kompletnie głupieje, wariuje oraz traci poczucie radości z szachów – właśnie dlatego, że nie rozumie dobrze tego co się kryje za „magicznymi cyferkami”. Im mniejszy zasób wiedzy o rankingu, sposobie jego obliczania i zmian oraz o wnioskach, które powinny być wyciągane dzięki niemu... tym więcej stresu i mniej radości z tej wspaniałej gry. Dobrze zatem wiedzieć, że ranking musi być brany z dystansem!

  7. Ranking (uzyskany wynik) powinien być przede wszystkim elementem, który pomaga nam w określeniu naszych silnych i słabych stron. To chyba jeden z najważniejszych punktów, który powinien stale być noszony w głowie i po każdym turnieju lub meczu – dobrze jest zaglądać do tego punktu, aby nie przeceniać znacznie rankingu a ignorować znaczenie rozwoju szachowego i realizowania naszego potencjału dzięki szachom.

  8. Ranking (uzyskany wynik) powinien być traktowany poważnie dopiero wówczas, gdy jest wiarygodny oraz wtedy gdy jest realnym wynikiem wzrostu siły i jakości gry. Jak już wiele razy podkreślałem – im bardziej wiarygodny ranking (zachowane istotne elementy, które nie zaburzają jego istoty i „czystości”) tym poważniej możemy się mu przyglądać. Co mega ważne – jeśli siła i jakość gry wzrasta (wyrażona i mierzona poziomem, ilością oraz jakością popełnianych błędów), a ranking nie idzie „w parze” z tymi zmianami, wówczas osiągany ranking należy ignorować. Często zdarza się to właśnie wtedy, gdy ostatnio uzyskany ranking był wynikiem naprawdę słabej gry, a w następnych okresach dzięki solidnej pracy i treningowi - „nagle” magicznie nasz poziom rankingowy zdaje się „strzelać w kosmos”. 

  9. Ranking (uzyskany wynik) osiągnięty powinien nas informować o naszych obecnie zaprezentowanych możliwościach oraz pomagać w opracowaniu i uaktualnianiu naszego planu rozwoju i realizowanych celów. W przypadku gdy uzyskiwane wyniki rankingowe można uznać za wiarygodne – wówczas jest to bardzo dobre potwierdzenie tego, że nasza efektywna praca, setki godzin spędzonych przy desce w zaciszu domowym i na turniejach – nie są jedynie wynikiem przypadku. Najczęściej jest to „zwykle poświęcenie” i dawanie z siebie wszystkiego na co w danym dniu i warunkach nas stać. Szczęście można schować do kieszeni – szachy nie są grą losową, zaś wykonywana godzinami efektywna praca w końcu musi przynosić efekty. Tak, szachy są wspaniałym modelem sprawiedliwego podziału – ci, którzy pracują solidnie mają wyniki, a ci którzy udają, że pracują – widzą postęp w grze oraz świetne wyniki tych pierwszych.

  10. Ranking jest tylko lepszym lub gorszym oszacowaniem i przybliżeniem tego co mierzy. Pamiętajmy o tym, że w partiach przez nas rozgrywanych zawartych jest o wiele więcej istotnych informacji aniżeli w „gołym wyniku uzyskanym”. Zbyt teoretycznie? Proszę bardzo. W mojej karierze zdarzyło się, że dwukrotnie uzyskałem „czysty wynik”– czyli właśnie taki w którym dany zawodnik wygrywa wszystkie partie (żadnego remisu). Raz był to „czysty wynik” na dystansie aż 11 rund (uzyskany ranking 1545), a kolejnym razem – po blisko 8 latach – na jedynie 9 rundach (uzyskany ranking 1660). Wyniki pewnie robiące wrażenie na tych, którzy zaczynają swoją przygodę z szachami, prawda? Niemniej żadna z podanych informacji nie powie nam nic o jakości (poziomie) gry zaprezentowanych podczas tych dwóch porównywanych rozgrywek. Natomiast zachowane zapisy partii pozwalają na ich analizowanie – a co za tym idzie na bardzo wszechstronne porównywanie zarówno poczynionego postępu jak też jakości, ilości i poziomu błędów. Warto o tym pamiętać!

Liczę na to, że dzięki temu wykładowi zdecydowana większość graczy będzie bardziej świadoma tego czym jest ranking i na czym polega krytyczne podejście do niego. Byłoby fantastycznie, gdyby dzięki niemu zawodnicy rozmawiali ze sobą w ten (lub podobny sposób): „Wiesz ostatnio analizowałem uzyskiwane przeze mnie rankingi oraz wyniki, które dały mi wiele do myślenia. Zauważyłem, że w partiach z zawodnikami o wysokim rankingu radzę sobie znacznie lepiej (gorzej) niż z zawodnikami o niskim rankingu. Być może są to powody dla których powinienem grać częściej w turniejach silniej obsadzonych, bo dzięki temu szybciej osiągnę zamierzony cel!”. Prawda, że piękne?

PS. Podkreślam wyraźnie, że nie jestem ani statystykiem ani matematykiem, a więc moje przemyślenia mogą zawierać błędy, których nigdy nie popełniliby fachowcy o których wspomniałem. Dlatego warto czytać nie tylko ze zrozumieniem, ale przede wszystkim krytycznym podejściem! Dziękuję za wyrozumiałość. Szczególne podziękowania za inspirację dla profesora Marka Glickmana i profesora Pawła Mola!