Oxford AI API проект от Microsoft для REST


Объявление, которое в основном осталось незамеченным на Build этого года, — это Project Oxford — набор REST API, которые предоставляют вам продвинутый AI в действительно простой в использовании форме.

Oxford AI API проект от Microsoft для REST

Большая проблема включения ИИ в ваш собственный проект заключается в том, что это не только сложно, но и требует много времени. Даже если вы понимаете теорию создания собственного рабочего ИИ, вам потребуется много данных и много времени, потраченного на его обучение, чтобы добиться хорошей производительности. Конечно, если вам нужно что-то, что решает стандартную задачу, вы можете использовать то, что было обучено кем-то другим.

Это идея Microsoft Project Oxford. Он предлагает предварительно обученные услуги искусственного интеллекта в четырех категориях — лицо, речь, зрение и понимание языка. Каждая из служб доступна как REST API, есть SDK для .NET и Android, а также для iOS для речевого API. Однако, учитывая, что API основан на REST, на самом деле нет большой проблемы в использовании службы с любого языка или платформы, если у нее есть доступ в Интернет и библиотека HTTP.

Face API можно использовать для обнаружения лиц, т. Е. Возврата ограничивающих рамок для каждого лица на изображении; проверка лица; то есть это лицо такое же, как другое изображение лица; поиск по лицу, т.е. найти это лицо в этом наборе изображений; кластеризация лиц, т.е. объединение лиц в похожие группы; и, наконец, идентификация лица, то есть поиск данного лица в базе данных лиц.

Speech API преобразует речь в текст из потокового аудиоисточника в реальном времени. Он также предлагает распознавание речевого намерения, то есть распознает голосовую команду и преобразование текста в речь.

Vision API не совсем подходит для общего распознавания и отслеживания объектов, но все же очень полезен. Вы можете попросить его проанализировать изображение и вернуть общую категоризацию того, что это за изображение. Он также может обнаруживать «взрослые» и «пикантные» изображения. Две другие основные функции — это интеллектуальная обрезка для создания миниатюр и оптическое распознавание символов.

Language API — самый гибкий и технически сложный. Вы можете использовать его для создания моделей понимания языка, которые можно использовать с речевым API и его распознаванием намерений. Вы можете выбрать развертывание своих моделей либо на конечной точке HTTP, либо на устройстве.

Для некоторых функций API есть живые демонстрации, которые вы можете использовать, чтобы попробовать что-то без написания кода. В случае Face API вы можете использовать образец изображения или загрузить свой собственный jpeg, png, gif или bmp. Результаты возвращаются API в виде данных JSON, но демонстрации используют данные, чтобы представить их таким образом, чтобы их было легче усвоить, то есть на самом деле рисование ограничивающих рамок на изображении.

Все это звучит великолепно и предоставляет очень простой способ добавить ИИ в ваши приложения или веб-страницы.

Так в чем же обратная сторона?

Все API-интерфейсы предоставляются через облако Azure, и одно из преимуществ, которые Microsoft собирается получить от вас при их использовании, — это еще одна причина, почему Azure важен для вас, и, конечно же, вам понадобится учетная запись Azure.

На данный момент вам необходимо получить ключ, чтобы воспользоваться услугой, и пока она находится в стадии бета-тестирования, она бесплатна и имеет определенные ограничения. Например, Vision API ограничен 20 транзакциями в минуту и 5000 транзакциями в месяц. Неплохо для целей тестирования, но нет никаких указаний относительно того, сколько будет стоить окончательная услуга. Команда Оксфорда говорит, что работает над установлением цен, и очевидно, что было бы разумно не тратить слишком много времени на разработку чего-либо до того, как они будут окончательно определены. Конечно, для многих пользователей задача подключения к API настолько проста, что стоит попробовать, даже если цена окажется слишком высокой.


Добавить комментарий