Инструмент обработки естественного языка с открытым исходным кодом Microsoft


Microsoft создала BrowseCloud с открытым исходным кодом, приложение на основе ИИ, которое суммирует данные обратной связи с помощью интеллектуальных облаков слов, называемых счетными сетками. Приложение поддерживает создание пользовательских визуализаций с вашим собственным набором данных и сопоставляет метаданные с темами.

Microsoft разработала инструмент, который поможет им управлять данными о клиентах из нескольких цифровых каналов, таких как данные опросов, электронная почта и такие сайты, как Reddit. Команда разработчиков заявляет, что даже для групп внутренних инструментов в Microsoft создается не менее 10 000 документов с отзывами пользователей в квартал.

BrowseCloud призван помочь, суммируя данные обратной связи с помощью интеллектуальных облаков слов, называемых счетными сетками. В облаке слов размер текста просто масштабируется в зависимости от частоты слова. Текст случайным образом разбросан по облакам слов. BrowseCloud отличается тем, что учитывает положение слова в облаке слов. Чтобы использовать его, пользователь щелкает слово в облаке слов, затем просматривает визуализацию, видя, как темы меняются по мере их перемещения.

Приложение позволяет пользователям добавлять свой собственный набор текстовых данных, а затем визуализировать его, просматривая самые большие слова в кластерах вокруг экрана. Вы можете вставить булавку, щелкнув визуализацию, чтобы просмотреть ранжированный список дословных слов (показанных в дальнем правом углу экрана), связанных с закрепленной вами микротемой.

В приложении также есть опции для поиска слова, чтобы сузить визуализацию и ранжированный список. Вы можете соотносить темы с положительными или отрицательными настроениями на экране, глядя на цвет слов в регионе после применения задания анализа настроений. Вы также можете соотнести свои собственные метаданные с темой.
Есть демонстрация, которую вы можете попробовать с галереей моделей и визуализаций с такими данными, как опрос вовлеченности сотрудников Microsoft, называемый MSPoll, и отзывы о системе разработки Windows.
Служба представляет собой приложение машинного обучения ASP.NET Core с зависимостями Azure. Microsoft установила Azure Pipelines для демонстрационного сайта. Также существует приложение командной строки Python для обучения ваших данных, а клиент — это простое приложение, созданное с помощью Angular CLI.


Добавить комментарий