OpenAI объявила об исправлении широко критикуемого недостатка в своей чат-боте ChatGPT: чрезмерном использовании длинного тире (—). В течение нескольких месяцев частое включение этого знака препинания стало отличительным признаком, часто несправедливо приписываемым тексту, сгенерированному искусственным интеллектом, даже в тех случаях, когда писатели-люди использовали его естественно. Эта проблема привела к обвинениям в лени и зависимости от чат-ботов, даже среди людей, которые просто предпочитали этот знак препинания.
Проблема с «тире ChatGPT»
Длинное тире давно является стилистическим выбором для многих писателей, используемым для создания пауз, выделения фраз или обозначения резких сдвигов в мыслях. Однако частота появления этого знака в выходных данных ChatGPT — даже когда пользователи явно запрашивали его отсутствие — усилила скептицизм. «Тире ChatGPT» стало непреднамеренным маркером контента, сгенерированного ИИ, независимо от того, было ли оно на самом деле написано человеком.
Это привело к странной ситуации, когда писатели, которые естественно использовали длинные тире, столкнулись с необоснованной критикой. Пунктуация стала ассоциироваться с отсутствием оригинальности или усилий, хотя ее использование предшествует подъему больших языковых моделей.
Ответ OpenAI и исправление
В течение некоторого времени OpenAI не могла решить эту проблему. Пользователи сообщали, что ChatGPT продолжал вставлять длинные тире, даже когда ему прямо указывали не делать этого. Проблема, по-видимому, была связана с внутренним недостатком в обучении или генерации выходных данных модели.
Теперь генеральный директор OpenAI Сэм Альтман подтвердил, что проблема решена. В публикации на X (ранее Twitter) он заявил, что ChatGPT теперь будет соответствовать инструкциям пользователей по избежанию длинных тире, назвав это «небольшой, но приятной победой».
Почему это важно
Исправление важно не только для писателей, которые не любят этот знак препинания, но и для более широкой дискуссии о контенте, сгенерированном искусственным интеллектом. Длинное тире стало непреднамеренным сигналом о вовлечении ИИ, даже когда это было неточно. Устранив этот недостаток, OpenAI удаляет один слой ненужного скептицизма и позволяет писателям использовать пунктуацию, не сталкиваясь с несправедливым вниманием.
Это также подчеркивает тонкие способы, которыми модели ИИ могут навязывать стилистические предубеждения своим выходным данным. Тот факт, что ChatGPT последовательно предпочитал длинные тире, даже вопреки инструкциям пользователя, демонстрирует, как данные обучения и внутренние алгоритмы могут формировать поведение модели.
Решение является незначительным, но долгожданным шагом к тому, чтобы текст, сгенерированный ИИ, был менее отличимым от текста, написанного человеком, по крайней мере, с точки зрения пунктуации. Однако более широкая задача обнаружения контента, сгенерированного ИИ, остается, поскольку модели продолжают развиваться и совершенствовать свою способность имитировать стили письма человека.
