AI Is Funny — Генеративная модель шутки


Могут ли компьютеры рассказать хороший анекдот? Комедия — это просто статистика или только человек может придумать шутку? Генератор шуток, созданный в Эдинбургском университете, предполагает, что ИИ может быть забавным.

Мне нравятся мои шутки, как мой ИИ, эвристический.
Это пример «Мне нравится мой X, как мои Y, Z», и программное обеспечение теперь почти так же хорошо, как люди, в создании забавных примеров. Два исследователя, Саса Петрович и Дэвид Мэтьюз из Школы информатики Эдинбургского университета, составили статистическую модель, которая может генерировать такие шутки — и да, люди, настоящие люди, сочли их забавными:

Мне нравятся мои отношения, как будто мне нравится мой источник, открытый
Мне нравится мой кофе, как будто мне нравится моя война, холодная
Мне нравятся мои мальчики, как мне нравятся мои сектора, плохо

Хорошо, они немного достойны стона, но это узнаваемые шутки.
Используемый метод интересен. Для шуток нужны два существительных, X и Y, и атрибут Z, и предполагается, что:

шутка тем смешнее, чем чаще атрибут используется для описания обоих существительных
шутка тем смешнее, чем реже встречается атрибут
шутка тем смешнее, чем неоднозначнее атрибут, и
шутка тем смешнее, чем более непохожи эти два существительных.

Вы можете убедиться в их разумности, просто посмотрев на несколько примеров, созданных человеком.

Модель как факторный график

Проблема при реализации такой модели заключается в получении необходимых данных. Необходимые частоты слов были собраны из базы данных n-граммов Google, которая была дополнена тегами слов с их частью речи с помощью Wordnet. Затем это было использовано для определения того, как часто каждое существительное встречается с одним и тем же атрибутом, и другой статистики, необходимой для применения приведенных выше правил.
Затем были подмешаны несколько человеческих шуток, собранных из Twitter, и людей попросили оценить набор как смешной или не смешной. Из человеческих шуток 33% были сочтены смешными по сравнению с шутками, сгенерированными компьютером, из которых 16% были смешными. Можно сказать, что в настоящее время ИИ наполовину забавен, чем человек.
На этом шутки не заканчиваются, поскольку авторы также не смогли удержаться от названия своего вычисления логарифмической вероятности шутки как LOcal Log-правдоподобия или LOL, а при ранжировании в соответствии с LOL мы получаем Rank OF Likelihood или ROFL. Хм.
В конце статьи говорится:
«Наконец, мы благодарим жителей офисов 3.48 и 3.38 за то, что они терпят наше хихиканье каждую пятницу днем».
Конечно, при создании шуток не использовалось понимание или творческий подход. Все упражнение посвящено статистической модели, которая имеет высокую вероятность (или должна быть LOL) создания группы слов, которые человек считает смешными.
Одно интересное наблюдение состоит в том, что люди, считающие «смешным», расходились больше по поводу человеческих шуток, чем по поводу компьютерных шуток. Предположительно, человеческие шутки содержат культурные или личные отсылки, которые означают, что некоторые другие люди не понимают шутку.


Добавить комментарий