Коробка компьютерного зрения от Google всего за 45 долларов


Google только что анонсировал новый набор AIY, который будет добавлен к существующему набору голосового / искусственного интеллекта. Это берет Raspberry Pi Zero W, да, Zero, и превращает его и его камеру в систему видения нейронной сети. В этом есть два примечательных момента: во-первых, цена в 45 долларов, а во-вторых, подключение к облаку не требуется, так как все вычисления выполняются автоматически!

Когда я впервые услышал о новом комплекте Google, мне показалось, что я сразу понял, о чем он. Raspberry Pi Zero W, который не входит в комплект, просто недостаточно мощный для работы нейронной сети, поэтому, очевидно, он просто действует как интерфейс для облачной службы ИИ, которая делает все тяжелые Это было бы весело, но вряд ли удивительно, и это заблокировало бы пользователя в другом сервисе Google.
Я был очень неправ.
Комплект AIY Vision Kit основан на процессоре машинного зрения Intel Movidius MA2450, который может реализовывать обученные нейронные сети. MA2450 был встроен в плату VisionBonnet, которая представляет собой специальную карту расширения Pi — кстати, шутка заключается в том, что платы расширения Pi называются HAT и, следовательно, Bonnet.

VisionBonnet может вычислить результат применения нейронной сети к изображению с камеры Raspberry Pi (также не входит в комплект) со скоростью 30 кадров в секунду. Поставляется с тремя предварительно обученными моделями:

Модель на основе MobileNets, способная распознавать тысячи обычных объектов.
Модель для распознавания лиц, способная не только распознавать лица на изображении, но и оценивать выражения лиц по «шкале радости» от «грустного» до «смеющегося».
Модель для важной задачи различать кошек, собак и людей.

Насколько полезны эти модели в каком-либо конкретном приложении, трудно сказать, но если ваш разум еще не придумывает, что вы могли бы сделать только с этими тремя, вы, вероятно, не нуждаетесь в рынке для такого рода комплектов.

Самым важным является то, что, хотя все вычисления выполняются на борту, Google предоставил код TensorFlow для обучения новых моделей. После обучения модель может быть загружена в VisionBonnet, и она распознает все, на чем вы ее обучали. Это интересно и впервые, насколько мне известно, предоставляет возможность, которая может изменить весь Интернет вещей и интеллектуальные гаджеты в целом. Вы можете обучить несколько моделей выполнять разные задания и оснастить робота набором глаз, каждый из которых чувствителен к определенному объекту или диапазону объектов.
Это может быть интересно, но не стоит недооценивать усилия, которые вам придется приложить для обучения новой модели. Вам нужны тысячи маркированных образцов и сотни часов графического / центрального процессора, что недешево. Поскольку это TensorFlow, вам не нужно использовать облако Google — вы даже можете использовать свою собственную ферму серверов для выполнения этой работы.
Единственная плохая новость заключается в том, что он пока недоступен, но обещан в США где-то в этом месяце (31 декабря — оценка).
Будем надеяться, что Google сделает VisionBonnet отдельным продуктом.
Это может быть революционная технология.

И последняя мысль — что там с гуглом и картоном?


Добавить комментарий