IBM Watson становится чувствительным


У IBM Watson есть несколько новых API, которые помогают разработчикам добавлять эмоциональный анализ в свои приложения.

Эти службы являются частью открытой платформы IBM Watson. IBM Watson – это платформа, которая использует обработку естественного языка и машинное обучение для анализа больших наборов неструктурированных данных. Согласно IBM, Watson представляет новую эру когнитивных вычислений, когда системы понимают мир так же, как люди: через чувства, обучение и опыт. Все новые API-интерфейсы призваны помочь системам, основанным на машинном обучении, более естественно взаимодействовать с людьми.

Первый из трех новых API-интерфейсов, Tone Analyzer, может использоваться для получения информации об эмоциях, социальных и языковых тонах, отраженных в фрагменте текста, таком как электронное письмо. Согласно сообщению в блоге Watson, эмоциональный тон теперь имеет пять различных эмоциональных подтонов: гнев, страх, радость, грусть и отвращение, взятые из «Колеса эмоций» Плутчика. Категории были расширены из предыдущих негативов, веселья и злости из-за отзывов пользователей.

Второе дополнение, Emotion Analysis, является частью набора API-интерфейсов Watson AlchemyLanguage. Анализ эмоций берет фрагмент текста, например веб-страницу, и возвращает оценки уверенности для гнева, отвращения, страха, радости и печали. Баллы рассчитываются с использованием структуры ансамбля на основе сложного обобщения на основе первоначальных результатов нескольких моделей машинного обучения. Каждая модель нижнего уровня использует комбинацию алгоритмов машинного обучения и языковых функций, таких как слова, фразы, знаки препинания и общие тональности. Идея состоит в том, что пользователи смогут использовать в текстах, таких как обзоры клиентов, опросы и сообщения в социальных сетях. Согласно IBM:
«Теперь компании могут определить, вызвало ли, например, изменение функции продукта реакцию клиентов – радость, гнев или печаль».
Третий API, Visual Recognition, принимает изображение и возвращает оценки для соответствующих классификаторов, представляющих такие вещи, как объекты, события и настройки. Что отличает Visual Recognition от других систем визуального поиска, так это то, что, хотя большинство изображений помечает фиксированным набором классификаторов или общих терминов, Visual Recognition позволяет вам обучать Watson пользовательским классификаторам для изображений и создавать приложения, которые визуально идентифицируют определенные концепции и идеи, так что вы может произвести поиск, адаптированный к потребностям вашего клиента. IBM предлагает розничному продавцу создать бирку, соответствующую стилю своих брюк в новой весенней линейке, чтобы он мог определять, когда в социальных сетях появляется изображение того, кто носит эти брюки.
Очевидно, что на подъеме эмоциональных ставок IBM также добавила эмоциональные возможности к своему механизму преобразования текста в речь и перевыпустила его как Expressive TTS. Утверждается, что это позволит компьютерам выйти за рамки понимания естественного языка, тона и контекста, позволяя им также отвечать соответствующей интонацией.
Система исследовалась и разрабатывалась в течение двенадцати лет, и IBM утверждает, что до сих пор автоматизированные системы полагались на заранее определенный, основанный на правилах корпус слов, в которых использовались ограниченные эмоциональные сигналы, основанные на повышенных или пониженных тонах. Чтобы улучшить это, IBM разработала более тонкий и обширный набор реплик и добавила возможность переключения между выразительными стилями. Это даст разработчикам больше гибкости в создании когнитивных систем, которые могут демонстрировать чувствительность при взаимодействии с людьми.
Первые три API доступны в бета-версии, в то время как Expressive TTS общедоступен. IBM добавляет возможности инструментов и совершенствует свои SDK (Node, Java, Python, iOS Swift и Unity) в Watson, а также добавляет стартовые наборы приложений, чтобы разработчикам было легко и быстро настраивать и создавать с помощью Watson.


Добавить комментарий