Обучаемая машина Google — что это на самом деле означает


Обучаемая машина — это попытка Google сделать машинное обучение и искусственный интеллект доступными для широкой публики без какой-либо специальной подготовки, знаний в области компьютерных наук или программирования.

Google

Сайт https://teachablemachine.withgoogle.com/ — это шаг, который отражает текущую тенденцию персонализации ИИ по переносу алгоритмов из облака в пространство пользователя, будь то его рабочий стол, телефон или другое интеллектуальное устройство.

Однако это не самая большая проблема; реальная проблема заключается в том, что модели, используемые для обучения алгоритмов в рамках общей модели контролируемого обучения, требуют массивных наборов данных и чрезмерной мощности процессора.

Таким образом, в нынешней ситуации массовая обработка выполняется в облаке платформой как сервисами, которые предлагают машинное обучение в виде API-интерфейсов plug and play, которые инкапсулируют необходимые предварительно обученные алгоритмы с предложениями, включая анализ тонов, визуальное распознавание или анализ разговоров. Распространенными примерами таких PaaS являются Haven OnDemand и IBM Watson/BlueMix.

Но, похоже, ситуация меняется. Еще в августе 2016 года в AI Linux мы выявили отклонение от этой тенденции:

Однако, похоже, все меняется, и эти сложные алгоритмы стремятся перейти к локальному запуску на мобильных устройствах. Это включает и их обучение; изображения, заметки, данные и метаданные, которые находятся в устройстве и над которыми будет работать, также будут служить для обучения сети и помощи в ее обучающих действиях, таких как распознавание, ранжирование и классификация объектов. Разница в том, что теперь все это будет происходить локально.

Процессоры Qualcomm Snapdragon 820 и сопровождающий их SDK Snapdragon Neural Processing Engine стоят за таким ходом, который позволит производителям запускать свои собственные модели нейронных сетей на устройствах под управлением Snapdragon, таких как смартфоны, камеры видеонаблюдения, автомобили и дроны, и все это без подключения к Интернету. облако. Общие возможности глубокого обучения для пользователей, которые могут быть реализованы с помощью SDK, включают обнаружение сцены, распознавание текста, отслеживание и предотвращение объектов, жесты, распознавание лиц и обработку естественного языка.

Таким образом, вместо того, чтобы разводить алгоритмы машинного обучения в облаке, удовлетворяя их голод данными, собранными пользователями, альтернативная идея состоит в том, чтобы перенести как алгоритмы, так и их обучение в автономный режим и в первую очередь на источник, генерирующий данные.

С тех пор такие попытки активизировались, теперь они сосредоточены на браузере, и это вполне разумно, поскольку это единственная наиболее распространенная и вездесущая часть программного обеспечения из когда-либо созданных. ваш браузер может выполнять большую работу с интенсивным использованием ЦП или графических процессоров, такую как локальная добыча Monero — см. CoinHive, чей девиз «Монетизируйте свой бизнес с помощью мощности ЦП ваших пользователей» говорит само за себя.

Так почему бы не использовать ту же мощь при обучении алгоритмов машинного обучения? По крайней мере, до тех пор, пока священный Грааль искусственного интеллекта — обучение без учителя — не станет действительно популярным … См. OpenAI Universe — New Way of Training AIs
Такой подход имеет несколько преимуществ:

Для облачной обработки требуется наличие Wi-Fi или мобильного подключения, что может быть медленным, а также создавать множество проблем с конфиденциальностью. Затем, если посмотреть на это с практической точки зрения, несколько одновременных запросов от тысяч клиентских устройств могут легко перегрузить облачную службу и сделать клиентский компьютер склонным к длительным задержкам в получении ответа или даже к полностью масштабированным отказам в обслуживании.

Проблемы конфиденциальности также очевидны. Мы полагаемся исключительно на Условия обслуживания и Политику конфиденциальности, например, связанные с распознаванием лиц, изложенные Квебекским музеем цивилизации в статье «Найди своего 2000-летнего двойника с распознаванием лиц», где музей обещает:

Не передавать какую-либо идентифицирующую информацию, предоставленную участниками (имя, фамилию, адрес электронной почты, номер телефона), с Betaface API.

Не использовать биометрические данные, отправленные в Betaface API (шаблоны распознавания лиц), для иных целей, кроме получения процента сходства.

Не передавать другим лицам или организациям информацию и данные, собранные или полученные с помощью Betaface API.

Bitesnap в разделе «Применение глубокого обучения для подсчета калорий»:

Ваш Контент в наших Сервисах Вы предоставляете Bite AI всемирную неисключительную, бесплатную, сублицензируемую, передаваемую лицензию на использование, хранение, воспроизведение, изменение, создание производных работ, публикацию, публичное исполнение, публичное отображение и распространение Контента исключительно для целей эксплуатации, продвижения, развития и улучшения наших Сервисов.

Позвольте мне подчеркнуть, что и Музей, и Bitesnap используются здесь как показательные образцы наиболее распространенных практик, используемых при обработке данных, представленных пользователями, а не как примеры нарушений. Напротив, мы уверены, что эти службы держат свое слово и верим в их стремление хранить личные данные в безопасности.

Но дело в том, зачем полагаться на обещания, если мы можем держать все данные о себе при себе?

Таким образом, обучаемая машина Google — яркая демонстрация этой идеи. Хотя это требует использования вашей камеры, чтобы делать снимки самого себя для обучения своих моделей, все ваши данные остаются в вашем браузере. Это происходит из-за Javascript и библиотеки deeplearn.js, рабочей лошади, стоящей за приложением, которое загружается внутри вашего браузера и использует свои возможности локального хранилища, чтобы все выполнялось и сохранялось исключительно на стороне клиента.

Помимо того, что это умный рекламный инструмент, обучаемая машина имеет существенное значение для создания необходимых предварительных условий для начала следующего уровня в эру ИИ, рассматривая ее как товар, потребляемый конечными пользователями. Выгрузить предварительно обученные алгоритмы на устройство потребителя — это одно, но научить публику, как обучать, настраивать и настраивать их в соответствии с потребностями, — это совсем другое дело. Само собой разумеется, что обучение пользователей написанию кода для обучения их алгоритмов невыполнимо и неудобно для конечного пользователя.

Что можно было сделать вместо этого? просто посмотрите следующий видеоролик «Objectifier-Spacial Programming», чтобы получить представление о будущем настройки алгоритмов.

Это включает обучение алгоритму:

  • включи свет, когда открываешь книгу
  • выключи свет, когда ты лежишь на кровати
  • остановить музыку или запустить музыку жестами
  • сделайте работу более безопасной — обратите внимание, как в 2:08 машина останавливается, когда рабочий снимает очки, и перезапускает их, когда снова их надевает.

Хотя обучение нейронной сети внутри браузера не является новшеством Google, поскольку библиотеки, подобные ConvNet.js, появились раньше, чем Google, разница заключается в приверженности. Принимая во внимание, что ConvNet.js является детищем одного человека, Андрея Карпати, который ранее был научным сотрудником OpenAI и аспирантом CS в Стэнфорде, а теперь является директором по искусственному интеллекту в Tesla, deeplearn.js пользуется полной поддержкой Google People + Инициатива AI Research (PAIR). Это должно гарантировать его непрерывное и систематическое развитие.

Чтобы обучить нейронную сеть с помощью обучаемой машины, вам просто нужно включить веб-камеру, нажать и удерживать кнопку и, пока кнопка остается нажатой, выполнить повторяющееся движение перед объективом камеры. Это все, что нужно сделать.

Есть три кнопки: зеленая, пурпурная и оранжевая, каждая из которых назначена на отдельный NN, так что вы можете привязать каждую из них к отдельному действию. После обучения NN в следующий раз, когда вы выполните свои движения, NN попытаются распознать и классифицировать их, чтобы выполнить действия, определенные пользователем. Предустановленные воспроизводят гифки с кошками (что еще?), Звуки или образцы речи, но конечный пользователь может легко их изменить.

Это то, что побуждает людей использовать машину довольно творчески и весело, как демонстрируют следующие видео.

Конечно, приложений бесчисленное множество, и они не просто забавные, например, обучение сверточной нейронной сети распознаванию фотографий и рукописных цифр в вашем браузере без написания ни единой строчки кода.

В целом, обучаемая машина — это не только публичное лицо библиотеки deeplearn.js, но и возможность заглянуть в грядущее будущее, основанное на автоматизации, в котором устройства будут загружаться не только интеллектуальными средствами, но и настраиваемыми интеллектуальными возможностями.


Добавить комментарий