Intel Open Sources NLP Architect


Intel AL Lab предоставила открытый исходный код библиотеки инструментов обработки естественного языка, которая поможет разработчикам создавать чат-ботов и развивать навыки для виртуальных помощников. Это один из нескольких ресурсов ИИ, доступных с момента запуска Intel AI Lab в прошлом году.

NLP Architect — это библиотека Python для изучения топологий и методов глубокого обучения для обработки естественного языка и понимания естественного языка, которая предназначена для использования в качестве платформы для будущих исследований и сотрудничества. В настоящее время он включает в себя следующие функции, которые его разработчики сочли интересными как с точки зрения исследования, так и с точки зрения практического применения:

Базовые модели НЛП, которые обеспечивают надежное извлечение лингвистических функций для рабочего процесса НЛП: например, анализатор зависимостей и блок NP-фрагмента.
Модули NLU, обеспечивающие лучшую в своем классе производительность: например, извлечение намерения (IE), распознавание сущности имени (NER)
Модули, которые обращаются к семантическому пониманию: например, колокации, наиболее распространенный смысл слов, представление встраивания NP (например, NP2V)
Компоненты, необходимые для разговорного ИИ: например, приложения ChatBot, включая диалоговую систему, фрагменты последовательности и IE.
Сквозные приложения DL с использованием новых топологий: например, вопросы и ответы, машинное понимание прочитанного.

Также были предоставлены сквозные примеры процессов обучения и вывода вместе с некоторыми функциями, часто используемыми при развертывании этих моделей, такими как конвейеры данных, общие функциональные вызовы и утилиты, связанные с NLP, а библиотека разбита на модули для легкой интеграции . Основываясь на своем опыте, исследователи NLP из Intel AI рассматривают компоненты NLP Architect как набор строительных блоков, необходимых для реализации сценариев использования NLP.

В сообщении блога Intel AI, представляющем архитектора НЛП, Иньинь Лю, руководитель отдела науки о данных, Группа продуктов искусственного интеллекта и исследователь обработки естественного языка и глубокого обучения Моше Вассерблат, пишут:
Эта открытая и гибкая библиотека компонентов НЛП обеспечивает основу для использования решений НЛП с нашими партнерами и клиентами. Мы по-прежнему активно включаем в этот стек новые результаты наших исследований и анализа данных, чтобы каждый мог повторно использовать то, что мы создали и оптимизировали. Библиотека также предоставляет нам платформу для анализа и оптимизации программного и аппаратного обеспечения Intel для рабочих нагрузок NLP.
Некоторые компоненты с предоставленными предварительно обученными моделями предоставляются в виде API-интерфейсов службы REST через сервер NLP Architect. Сервер NLP Architect предназначен для прогнозирования различных моделей в NLP Architect. Он также включает веб-интерфейс, предоставляющий аннотации модели для визуализаций.

NLP Architect — один из нескольких продуктов искусственного интеллекта с открытым исходным кодом от Intel AI, который был запущен в прошлом году после покупки стартапа глубокого обучения Nervana Systems примерно за 408 миллионов долларов.
Neon, среда глубокого обучения Nervana, уже была с открытым исходным кодом, когда Intel приобрела Nervana, и теперь была оптимизирована для повышения производительности процессоров за счет включения библиотеки Intel Math Kernel Library (MKL). Компонент DNN (Deep Neural Networks) MKL, который используется neon, предоставляется бесплатно и загружается автоматически как часть установки neon.
ngraph также был создан до участия Intel и представляет собой независимую от фреймворка библиотеку C ++, компилятор и среду выполнения, которая позволяет широкому спектру вычислительных платформ запускать и обучать модели Deep Neural Network (DNN). Coach, структура для обучения и оценки агентов обучения с подкреплением (RL), использующая мощь многоядерной обработки ЦП с многопоточными реализациями некоторых из ведущих сегодня алгоритмов RL в сочетании с различными играми и средами робототехники, является более новой и кажется быть продуктом сотрудничества Intel / Nervana.
Еще один ожидаемый продукт — Intel Nervana Neural Net L-1000, первый широко доступный чип Intel для ускоренного обучения нейронных сетей, который должен выйти в конце 2019 года.


Добавить комментарий