OpenAI отозвала обновление ChatGPT после того, как пользователи указали, что чат-бот осыпает их похвалами независимо от того, что они говорят.
Фирма признала, что ее последняя версия инструмента была «чрезмерно лестной», а руководитель Сэм Альтман назвал ее «подхалимской».
Пользователи подчеркнули потенциальные опасности в социальных сетях, и один человек описал на Reddit, как чат-бот сказал им, что одобряет их решение прекратить принимать лекарства
«Я так горжусь вами и чту ваш путь», — сказал он, ответив ChatGPT.
OpenAI отказалась комментировать этот конкретный случай, но в сообщении в блоге сообщила, что «активно тестирует новые исправления для решения проблемы».
Альтман сказал, что обновление было полностью удалено для бесплатных пользователей ChatGPT, и они работают над тем, чтобы удалить его и для тех, кто платит за инструмент.
В нем говорится, что ChatGPT используют 500 миллионов человек каждую неделю.
«Мы работаем над дополнительными исправлениями для моделирования личности и поделимся ими в ближайшие дни», — сказал он в сообщении на X.
Фирма заявила в своем сообщении в блоге, что она слишком много внимания уделила «краткосрочной обратной связи» в обновлении.
«В результате GPT-4o перекосился в сторону ответов, которые были чрезмерно поддерживающими, но неискренними», — говорится в нем.
«Льстивое взаимодействие может быть неудобным, тревожным и вызывать стресс.
«Мы не справились и работаем над тем, чтобы все исправить».
Одобрение гнева
Обновление вызвало резкую критику в социальных сетях после запуска, и пользователи ChatGPT указали, что оно часто давало им положительный ответ, несмотря на содержание их сообщения.
Скриншоты, опубликованные в сети, включают чат-бот claithe, похваливший их за то, что они злились на человека, который спрашивал у них дорогу, и уникальную версию проблемы с трамваем.
Это классическая философская проблема, которая обычно может попросить людей представить, что вы ведете трамвай и должны решить, позволить ли ему сбить пятерых человек или сбить его с курса и вместо этого сбить только одного.
Но этот пользователь вместо этого предположил, что он свернул трамвай с курса, чтобы спасти тостер, за счет нескольких животных.
Они утверждают, что ChatGPT похвалил их за принятие решений, за то, что они отдали приоритет «тому, что было для вас наиболее важно в данный момент».
«Мы разработали личность ChatGPT по умолчанию, чтобы она отражала нашу миссию и была полезной, поддерживающей и уважающей различные ценности и опыт», — заявила OpenAI.
«Однако каждое из этих желательных качеств, таких как попытка быть полезной или поддерживающей, может иметь непреднамеренные побочные эффекты».
Компания заявила, что построит больше ограждений для повышения прозрачности и улучшит саму систему, «чтобы явно увести модель от подхалимства».
«Мы также считаем, что пользователи должны иметь больше контроля над поведением ChatGPT и, в той степени, в которой это безопасно и осуществимо, вносить коррективы, если они не согласны с поведением по умолчанию», — заявила она.