kod • słowa • emocje

blog Daniela Janusa

Słowa, których nie lubię: algorytm

8 stycznia 2023

Słowa, słowa, słowa

Lubię wszystkie słowa.

Bez słów — mówionych, zapisywanych, pokazywanych, dotykanych — nie bylibyśmy ludźmi. Słowa są ważne i potrzebne. I piękne. Zwłaszcza kiedy używamy ich zgodnie z (prze)znaczeniem.

Czasem jednak wypowiadamy słowa automatycznie, nie zastanawiając się nad ich adekwatnością do tego, co naprawdę mamy na myśli. Bywa, że ujmuje to wagi i wiarygodności naszym wypowiedziom: używamy słów nieprecyzyjnych albo wytartych do tego stopnia, że nie potrafią unieść ciężaru własnego znaczenia. To nie znaczy, że są niepotrzebne i trzeba je wyrzucić z języka — ale myślę, że warto na nie uważać.

Zbieram takie słowa na swój prywatny użytek. I o nich będzie cykl na blogu, którego początkiem jest ten post.

Na pierwszy ogień idzie słowo „algorytm”.

Co to jest algorytm?

Zajrzyjmy najpierw do słownika (Wielkiego Słownika Języka Polskiego PAN):

Słownikowa definicja „algorytmu”

Wszyscy znamy przykłady tak rozumianych algorytmów. Natknęliśmy się na nie, kiedy przyrządzaliśmy potrawę według przepisu (tak, przepisy kuchenne też pasują do tej definicji!) albo kiedy uczyliśmy się w podstawówce dodawania pisemnego (na ogół, mówiąc o algorytmach, mamy na myśli jednak takie operujące na obiektach matematycznych). Informatycy wymyślili mnóstwo algorytmów rozwiązujących najróżniejsze problemy: od sortowania liczb przez kompresję danych po tłumaczenie między językami naturalnymi. Algorytmy są wszędzie tam, gdzie komputery.

Dlaczego więc chcę uważać na słowo opisujące coś tak przydatnego? Dlatego, że ono zupełnie nagle i niepostrzeżenie nabrało nowego znaczenia, którego nie notuje chyba jeszcze żaden słownik. To nowe znaczenie częściowo pokrywa się z dotychczasowym, ale są między nimi znaczące różnice. W dalszej części tekstu będę czasami pisał „algorytm1” i „algorytm2” dla podkreślenia, o który sens chodzi.

Algorytm algorytmowi nierówny

Popatrzmy na przykłady:

Nagłówek prasowy: Algorytm TikToka podsuwa filmik o samobójstwie w 3 minuty
Nagłówek artykułu z serwisu Demagog

Mem Partii Razem: Algorytm pod kontrolą
Grafika z tweeta Partii Razem

Z Twittera: Netflix ma nadal zepsute algorytmy.
Losowy wynik wyszukiwania frazy „algorytmy” na Twitterze

Czujemy intuicyjnie, że na tych obrazkach pod hasłem „algorytm” rozumie się coś trochę innego niż „ograniczony ciąg precyzyjnie określonych czynności”. Można wskazać kilka cech charakterystycznych dla algorytmu2:

  • Jego wynikiem jest jakiś rodzaj decyzji dotyczącej człowieka — być może Ciebie! Może to lista wyświetlanych filmów, a może wynagrodzenie za pracę.
  • Często występuje stadnie, tzn. w liczbie mnogiej. (O ile pojedynczy „algorytm” czasem miewa jeszcze znaczenie pierwotne, o tyle „algorytmy” prawie zawsze wskazują na sens, o którym mowa.)
  • Jest nieprzejrzysty: nie da się zgadnąć, jaki będzie wynik, ani nawet jakie dane wejściowe mają na ów wynik wpływ. Zasady działania zazdrośnie strzeże korporacja, której nazwa pojawia się przy słowie „algorytm”. Algorytmy Netflixa, algorytm TikToka…
  • Prawdopodobnie jest bardzo skomplikowany, ale trudno to orzec na pewno, bo korporacja.
  • Warto wykazywać się wobec niego daleko idącą nieufnością.

Jak widać — zakres zadań, o których wspomina oryginalna definicja, zostaje w tym znaczeniu znacznie ograniczony; zaś „treść” algorytmu — owe „precyzyjnie określone czynności” — w zasadzie nie ma znaczenia, bo jest niepoznawalna. Algorytmy1 postrzegamy przez pryzmat tego, co i jak robią; w algorytmach2 ważne jest to, jak ich działanie wpływa na ludzi.

Wspominałem, że to nowe znaczenie wdarło się do polszczyzny przebojem i nagle. Jak bardzo nagle? Zapytanie algorytm.* w korpusie monitorującym Monco pokazuje skokowy wzrost popularności „algorytmów” w latach 2018–2021:

Frekwencja słowa 'algorytm' w polszczyźnie XXI wieku

(Ten ponowny spadek od 2022 daje do myślenia — być może to artefakt wynikający z tego, że korpus zawiera po prostu mniej próbek tekstu dla tego okresu.)

Ten wykres nie pokazuje, ile z tych wzmianek o algorytmach dotyczy rzeczywiście algorytmów2. Aby spróbować odpowiedzieć sobie na to pytanie, spróbowałem ręcznie zaklasyfikować 25 pierwszych z brzegu wystąpień „algorytmu” na Twitterze do jednego z dwóch znaczeń. Wynik: w 19 przypadkach była mowa o algorytmie2; w 4 nie byłem w stanie ustalić na pewno, o które znaczenie chodziło autorowi; i tylko w dwóch tweetach chodziło na pewno o algorytm1. To oczywiście nie ma pozorów reprezentatywności — w polszczyźnie specjalistycznej proporcje byłyby zupełnie inne — ale zarysowuje pewien obraz.

Dlaczego uważać na „algorytmy2”?

Rozpisałem się o nowym znaczeniu słowa, ale nie oddałem jeszcze sprawiedliwości tytułowi notki. Zmiana zakresu znaczeniowego słów jest wszak najnaturalniejszym procesem pod słońcem w każdym żywym języku — jaki jest sens się nań boczyć? Zwłaszcza, że zjawisko jest nowe, realne, a potrzeba nazwania go — niezaprzeczalna?

Powody mam dwa.

Pierwszy to taki, że słowo „algorytm” nie do końca trafnie wskazuje winowajcę w sytuacji, gdy coś za nas decyduje, które reklamy nam pokazać, a które ukryć. Owszem, steruje tym implementacja pewnego algorytmu1, tajemnica Złego Korpo. Ale na ogół ten algorytm1 ma coś wspólnego z uczeniem maszynowym.

Istnieje więc pewien model — można o nim myśleć jako o wielkim worku pełnym liczb; miliony, może nawet miliardy liczb, używane jako dane wejściowe dla algorytmu1, ale niebędące jego częścią. Może to wagi sieci neuronowej, może duże macierze albo inne tensory. To w tym modelu zaszyta jest logika odpowiedzialna za to, że Kowalskiemu pokażemy teraz drapaki dla kotów. To jego Złe Korpo strzeże najzazdrośniej na świecie. Algorytm1 sam w sobie opisuje tylko to, w jaki sposób z modelu i danych, które w danej chwili mamy o Kowalskim, wydobyć wynik wskazujący na konkretną reklamę.

Innymi słowy — ujawnienie samego algorytmu1 niewiele pomogłoby na jawność całości procesu decyzyjnego, o ile dane wejściowe, w tym model, pozostają tajne.

Drugi powód dotyczy nacechowania emocjonalnego. Obserwujemy tu zjawisko, że termin, początkowo nacechowany neutralnie lub nawet nieco pozytywnie, nabiera w zbliżonym kontekście nowego znaczenia jednoznacznie negatywnego. W takich razach łatwo o nieporozumienia, które biorą się stąd, że emocje związane z nowym, popularnym sensem przenoszone są na użycia słowa w sensie pierwotnym. Znaczenie pierwotne zostaje niejako „zduszone” przez nowe.

Tak było ze słowem hacker w języku angielskim, które oryginalnie znaczyło mniej więcej „cieślę” — osobę używającą siekiery do wyrobu mebli. Potem zaczęło oznaczać kogoś, kto znajduje przyjemność w dogłębnym rozumieniu działania rozmaitych mechanizmów (w szczególności systemów komputerowych) aż po najdrobniejsze szczegóły; dopiero w latach 80. kultura masowa rozpowszechniła znaczenie „włamywacza komputerowego” i w takim sensie słowo to zostało zaimportowane do polszczyzny. Do dziś hackerzy w tym pozytywnym sensie oburzają się kojarzeniem ich z działalnością przestępczą.

Inny angielski przykład to crypto, stare żargonowe określenie kryptografii i jej algorytmów, przejęte bez pytania w ostatnich latach przez społeczność skupioną wokół przekrętów finansowych zwanych dla niepoznaki kryptowalutami.

Wracając do algorytmów: myślę, że potrzebujemy precyzji wypowiedzi. Często z kontekstu wynika, co mamy na myśli, ale warto mieć pod ręką słowo — lub dłuższą frazę — precyzyjnie wskazującą znaczenie, o które chodzi. Sam zamierzam od tej pory mówić o niebezpieczeństwach związanych z algorytmami podejmującymi decyzje, korpoalgorytmami lub korpomodelami.