iNaturalist запускает приложение для идентификации на основе глубокого обучения


iNaturalist.org запустил приложение для Android и iOS, которое автоматически определяет животных и растения на уровне видов. Обученный с помощью TensorFlow, он уже определяет более 10 000 различных видов, и новые виды добавляются в модель каждые 1,7 часа.

iNaturalist.org — авторитетный и популярный веб-сайт. Его миссия состоит в том, чтобы объединить экспертов и «гражданских ученых»-любителей, побуждая людей интересоваться миром природы и приобщаться к нему, используя собранные данные, чтобы потенциально помочь профессиональным ученым отслеживать изменения в биоразнообразии или даже открывать новые виды. Основанный в 2008 году студентами Калифорнийского университета в Беркли и недавно приобретенный Калифорнийской академией наук, он раньше полагался на краудсорсинг. Когда пользователи публикуют фотографию растения или животного, сообщество ученых и естествоиспытателей идентифицирует это.
По словам соруководителя iNaturalist Скотта Лоури, краудсорсинговая модель в целом работает хорошо. Половина тайных наблюдений пользователей идентифицируется в течение 2 дней, даже быстрее, если, как Лори, ваши сообщения исходят из Калифорнии, где идентификация может быть произведена в течение часа. Это потому, что большое количество экспертов, которые часто посещают iNaturalist, базируются на Западном побережье. Однако среднее время, необходимое для получения идентификации, составляет 18 дней, а это означает, что некоторым пользователям приходится ждать очень долго. Другая проблема заключается в том, что по мере того, как сайт становится все более популярным, количество наблюдателей (людей, публикующих фотографии) намного превышает количество идентификаторов (людей, рассказывающих вам, что они собой представляют), что угрожает сокрушить экспертов-добровольцев.
Чтобы облегчить бремя экспертов-добровольцев, команда iNaturalist в сотрудничестве с Корнельской лабораторией орнитологии, разработчиками приложения для идентификации птиц Мерлин и Visipedia использовала машинное обучение для более быстрой идентификации, поскольку число наблюдателей продолжает расти.
Visipedia, сокращенно от «Визуальная энциклопедия», — это совместный проект Caltech и Cornell Tech. Это сеть людей и машин, предназначенная для сбора и систематизации визуальной информации, а также для того, чтобы сделать ее доступной для всех, у кого есть визуальный запрос.
Используя фреймворк глубокого обучения TensorFlow на оборудовании NVIDIA, команда Visipedia обучила нейронные сети на базе данных изображений iNaturalist, которые были помечены сообществом экспертов сайта. В настоящее время iNaturalist имеет около 4 000 000 «проверяемых» наблюдений, то есть наблюдений, которые имеют все необходимые атрибуты качества данных (например, фотографии, местоположения, а не домашних животных), были проверены экспертами и могут считаться «исследовательским уровнем». Они представляют 100 000 видов.

iNaturalist определил, что для включения вида в свою модель необходимо наличие не менее 20 наблюдений исследовательского уровня. Хотя приведенная выше диаграмма показывает, что существует 13 730 видов, которые соответствуют критериям, это число, вероятно, ближе к 10 000 видов, поскольку были предприняты шаги для обеспечения того, чтобы у каждого вида было по крайней мере 20 отдельных наблюдателей для контроля за эффектами наблюдателя.

Новое приложение использует наблюдения исследовательского уровня, чтобы дать уверенный ответ о роде животного, а также более предварительное предположение о его разновидностях с 10 основными вариантами. Первоначально он был правильным в отношении рода в 86% случаев и давал правильный вид в 10 лучших результатов в 77% случаев. Эти числа должны улучшаться, поскольку модель продолжает обучаться, и, конечно же, само приложение вносит новые наблюдения и новые подтвержденные идентификации, что приводит к добавлению новых видов в модель со скоростью 1 каждые 1,7 часа.
На веб-сайте iNaturalist также есть демонстрация приложения, которую мы протестировали с помощью этой фотографии, и местоположение, которое вы можете установить в интерактивном режиме на карте, на юго-востоке Испании.

Через несколько секунд демонстрация определила семью как Bovids, и хотя ее список результатов начался с находящихся под угрозой исчезновения аудада и снежного барана, следующие предложения были следующими:

Справа в нижнем ряду — Capra pyrenaica ssp hispanica, юго-восточный испанский козерог, и, кажется, он идеально подходит. Как и приложение, демо-версия также является источником информации о животном, в данном случае о дикой козе, эндемичной для Испании.
Приложение iNaturalist кажется очень полезным дополнением к ассортименту программного обеспечения для идентификации штанов и животных. Он обеспечивает быстрый и простой способ записывать наблюдения с фотографиями и местоположениями GPS, а затем получать доступ к наблюдениям других людей со всего мира и становиться частью движения гражданской науки и растущего сообщества наблюдателей и экспертов iNaturalist.


Добавить комментарий