OpenAI oznámila opravu široce kritizované chyby v chatbotu ChatGPT: nadměrné používání em pomlčky (-). Během několika měsíců se časté zahrnutí tohoto interpunkčního znaménka stalo charakteristickým rysem, často nespravedlivě připisovaným textu generovanému umělou inteligencí, a to i v případech, kdy je lidští pisatelé používali přirozeně. Tento problém vedl k nařčení z lenosti a závislosti na chatbotech, a to i mezi lidmi, kteří toto interpunkční znaménko prostě preferovali.
Problém s “ChatGPT pomlčkou”
Em pomlčka je již dlouho stylistickou volbou mnoha spisovatelů, používá se k vytváření pauz, zvýraznění frází nebo k označení náhlých změn v myšlení. Frekvence, s jakou se znak objevil ve výstupu ChatGPT – i když uživatelé výslovně požadovali jeho nepřítomnost – však zvýšil skepticismus. „ChatGPT pomlčka“ se stala neúmyslnou značkou pro obsah generovaný AI, bez ohledu na to, zda byl skutečně napsán člověkem.
To vedlo k podivné situaci, kdy spisovatelé, kteří přirozeně používali em pomlčky, čelili neoprávněné kritice. Interpunkce se stala spojenou s nedostatkem originality nebo úsilí, ačkoli její použití předcházelo vzestupu velkých jazykových modelů.
Odezva a oprava OpenAI
OpenAI nějakou dobu nedokázalo tento problém vyřešit. Uživatelé hlásili, že ChatGPT pokračoval v vkládání em pomlček, i když bylo výslovně řečeno, aby to nedělalo. Zdálo se, že problém je způsoben vnitřní chybou v trénování nebo generování výstupu modelu.
Nyní generální ředitel OpenAI Sam Altman potvrdil, že problém byl vyřešen. V příspěvku na X (dříve Twitter) uvedl, že ChatGPT se nyní bude řídit pokyny uživatele, aby se vyhnul em pomlčkám, a označil to za „malé, ale pěkné vítězství“.
Proč je to důležité?
Oprava je důležitá nejen pro pisatele, kterým se toto interpunkční znaménko nelíbí, ale také pro širší diskusi o obsahu generovaném AI. Em pomlčka se stala neúmyslným signálem zapojení AI, i když byla nepřesná. Odstraněním tohoto nedostatku odstraňuje OpenAI jednu vrstvu zbytečné skepse a umožňuje autorům používat interpunkci, aniž by čelili nespravedlivému zkoumání.
Zdůrazňuje také jemné způsoby, jakými mohou modely umělé inteligence uplatňovat stylistické zkreslení jejich výstupu. Skutečnost, že ChatGPT důsledně upřednostňovala em pomlčky, a to i proti uživatelským pokynům, ukazuje, jak tréninková data a interní algoritmy mohou utvářet chování modelu.
Toto rozhodnutí je malým, ale vítaným krokem k tomu, aby byl text generovaný umělou inteligencí méně rozlišitelný od textu psaného lidmi, alespoň pokud jde o interpunkci. Širší problém odhalování obsahu generovaného umělou inteligencí však zůstává, protože modely se neustále vyvíjejí a zlepšují jejich schopnost napodobovat lidské styly psaní.
