У Microsoft Cognitive Toolkit с открытым исходным кодом есть новый веб-сайт вместе с первой бета-версией версии 2.0. Ранее известный как CNTK, задумывался как набор инструментов коммерческого уровня для обучения алгоритмов глубокого обучения, способных учиться подобно человеческому мозгу, и уже бьет рекорды.
Microsoft Cognitive Toolkit — это новое название для своего Computational Network Toolkit (CTNK), который изначально был разработан внутри компании компьютерными учеными, которые хотели использовать глубокое обучение для своих собственных исследований в таких областях, как распознавание речи. Он доступен по лицензии с открытым исходным кодом с апреля 2015 года, сначала на Codeplex, а с начала 2016 года на GitHub, где наблюдается большая активность.
Согласно его описанию на GitHub:
CNTK, Computational Network Toolkit от Microsoft Research, представляет собой унифицированный набор инструментов для глубокого обучения, который описывает нейронные сети как серию вычислительных шагов с помощью ориентированного графа. В этом ориентированном графе листовые узлы представляют входные значения или параметры сети, в то время как другие узлы представляют матричные операции над своими входами. CNTK позволяет легко реализовать и комбинировать популярные типы моделей, такие как DNN с прямой связью, сверточные сети (CNN) и рекуррентные сети (RNN / LSTM). Он реализует обучение методом стохастического градиентного спуска (SGD, обратное распространение ошибок) с автоматическим дифференцированием и распараллеливанием между несколькими графическими процессорами и серверами. CNTK имеет. Мы надеемся, что сообщество воспользуется преимуществами CNTK для более быстрого обмена идеями посредством обмена рабочим кодом с открытым исходным кодом.
Основные особенности последней версии, теперь называемой Microsoft Cognitive Toolkit, включают:
Теперь можно использовать как библиотеку с новыми API C ++ и Python.
Новые примеры и руководства Python
Поддержка сериализации буферов протокола
Поддержка алгоритма Fast R-CNN
Новые автоматизированные процедуры установки
Улучшения в оценочной библиотеке CNTK, включая поддержку API CNTK
В сообщении в блоге, анонсирующем новую бета-версию, Фрэнк Сейде, главный исследователь недавно созданной Microsoft AI and Research Group, который, будучи ключевым архитектором инструментария, на сегодняшний день является его основным участником на GitHub, говорит:
«Мы превратили инструмент исследования в инструмент, который работает в производственных условиях»,
Другая цитата приписывается Крису Басоглу, менеджеру по разработке партнеров в Microsoft, который сыграл ключевую роль в разработке инструментария:
«Одной из основных причин использования Microsoft Cognitive Toolkit является его способность эффективно масштабироваться между несколькими графическими процессорами и несколькими машинами на больших наборах данных»
Он разработан для работы на нескольких графических процессорах и оптимизирован для использования преимуществ оборудования NVIDIA и сетевых возможностей Azure виртуальных машин Azure серии N, которые считаются самыми быстрыми графическими процессорами в общедоступном облаке, которые в настоящее время доступны в предварительной версии.
Хотя Microsoft Cognitive Toolkit 2.0 теперь доступен для внешних разработчиков и специалистов по обработке данных, Microsoft Research продолжает использовать его для прорыва в области распознавания речи. В прошлом месяце мы сообщили, что в его системе коэффициент ошибок по словам (WER) составил 6,3%, что является самым низким показателем в отрасли.
В этом месяце был достигнут еще более важный рубеж — WER в 5,9% в той же задаче распознавания речи Switchboard, которая ставит ее в один ряд с человеческими способностями. Такие улучшения упростят для систем Microsoft, используемых в Skype Translator и Cortana, лучшее понимание того, что пользователи пытаются сказать, даже в шумной обстановке, например, на вечеринке, при езде по шоссе или в офисе с открытой планировкой.
CTNK впервые разработал собственный язык описания сети, Brainscript. Теперь, чтобы обслуживать более широкую группу пользователей, последняя версия Microsoft Cognitive Toolkit содержит API-интерфейсы Python и C ++. Он также поддерживает обучение с подкреплением, опять же в ответ на запросы исследовательского сообщества.
Открытый исходный код больше не является игрушкой Microsoft и, как и Google TensorFlow, расширяет горизонты для ИИ. Это шикарное промо-видео, которое, вероятно, является избыточным для требований, поскольку Microsoft Cognitive Toolkit явно захватывает: