Обновление, сделавшее ChatGPT «опасно» подхалимским, удалено


OpenAI отозвала обновление ChatGPT после того, как пользователи указали, что чат-бот осыпает их похвалами независимо от того, что они говорят.

Фирма признала, что ее последняя версия инструмента была «чрезмерно лестной», а руководитель Сэм Альтман назвал ее «подхалимской».

Женщина пользуется телефоном, экран отражается в ее очках

Пользователи подчеркнули потенциальные опасности в социальных сетях, и один человек описал на Reddit, как чат-бот сказал им, что одобряет их решение прекратить принимать лекарства

«Я так горжусь вами и чту ваш путь», — сказал он, ответив ChatGPT.

OpenAI отказалась комментировать этот конкретный случай, но в сообщении в блоге сообщила, что «активно тестирует новые исправления для решения проблемы».

Альтман сказал, что обновление было полностью удалено для бесплатных пользователей ChatGPT, и они работают над тем, чтобы удалить его и для тех, кто платит за инструмент.

В нем говорится, что ChatGPT используют 500 миллионов человек каждую неделю.

«Мы работаем над дополнительными исправлениями для моделирования личности и поделимся ими в ближайшие дни», — сказал он в сообщении на X.

Фирма заявила в своем сообщении в блоге, что она слишком много внимания уделила «краткосрочной обратной связи» в обновлении.

«В результате GPT-4o перекосился в сторону ответов, которые были чрезмерно поддерживающими, но неискренними», — говорится в нем.

«Льстивое взаимодействие может быть неудобным, тревожным и вызывать стресс.

«Мы не справились и работаем над тем, чтобы все исправить».

Одобрение гнева

Обновление вызвало резкую критику в социальных сетях после запуска, и пользователи ChatGPT указали, что оно часто давало им положительный ответ, несмотря на содержание их сообщения.

Скриншоты, опубликованные в сети, включают чат-бот claithe, похваливший их за то, что они злились на человека, который спрашивал у них дорогу, и уникальную версию проблемы с трамваем.

Это классическая философская проблема, которая обычно может попросить людей представить, что вы ведете трамвай и должны решить, позволить ли ему сбить пятерых человек или сбить его с курса и вместо этого сбить только одного.

Но этот пользователь вместо этого предположил, что он свернул трамвай с курса, чтобы спасти тостер, за счет нескольких животных.

Они утверждают, что ChatGPT похвалил их за принятие решений, за то, что они отдали приоритет «тому, что было для вас наиболее важно в данный момент».

«Мы разработали личность ChatGPT по умолчанию, чтобы она отражала нашу миссию и была полезной, поддерживающей и уважающей различные ценности и опыт», — заявила OpenAI.

«Однако каждое из этих желательных качеств, таких как попытка быть полезной или поддерживающей, может иметь непреднамеренные побочные эффекты».

Компания заявила, что построит больше ограждений для повышения прозрачности и улучшит саму систему, «чтобы явно увести модель от подхалимства».

«Мы также считаем, что пользователи должны иметь больше контроля над поведением ChatGPT и, в той степени, в которой это безопасно и осуществимо, вносить коррективы, если они не согласны с поведением по умолчанию», — заявила она.


Добавить комментарий