Мозг плодовой мушки улучшает наши алгоритмы поиска

Основная шумиха вокруг этой истории – «мозг плодовой мушки улучшит поисковые системы будущего». Это не совсем так, но реальное сообщение достаточно интересно. Исследование мозга плодовой мушки показало, что он выполняет поиск сходства с использованием модифицированного хеширования с учетом местоположения. При тестировании оказывается, что это лучший алгоритм.

Плодовые мушки

Возможно, нейронные алгоритмы станут «вещью» в будущем, и нам, возможно, придется добавить их целый новый класс в курсы традиционных алгоритмов.

Новая статья С. Дасгупты, К. Ф. Стивенса и С. Навлахи из Института Солка и Калифорнийского университета в США «Нейронный алгоритм для фундаментальной вычислительной задачи». Science, 358, описывает, как дрозофилы справляются с запахом. (Опубликованная рецензируемая статья постыдно защищена платным доступом, указана ссылка на препринт.)

Хеширование с учетом местоположения (LSH) – это форма хеширования, которая отображает входные данные, которые в некотором смысле похожи на аналогичные хэши. Обычно это не то, что должна делать хеш-функция, потому что идея состоит в том, чтобы как можно более равномерно распределить входные данные по возможным выходам. LSH, однако, больше озабочен поиском сходства, чем хранением и извлечением, для чего часто используется хеширование.

В случае плодовой мушки обонятельные нейроны реагируют на запахи, выдавая «метки», похожие на похожие запахи. У них есть 50 нейронов, чувствительных к запаху, которые срабатывают с разной скоростью в зависимости от входящего запаха. Затем эта активность передается второму набору из 50 «проекционных» нейронов, которые питаются 2000 нейронами, называемыми клетками Кеньона. Таким образом, каждый запах занимает свое место в 50-мерном пространстве, которое зависит от запаха и силы запаха. Затем проекционные нейроны преобразуют его в 50-мерное пространство, где местоположение зависит только от запаха, а не от его силы. Затем размерность расширяется до 2000 измерений ячейками Кеньона. Каждая из них связана с небольшой случайной выборкой примерно из 6 ячеек проекции. Ячейки Kenyon срабатывают пропорционально их входу, но только 5% с наибольшим срабатыванием принимаются во внимание; остальные заглушаются в схеме «Победитель получает все» (WTA).

5%, которые срабатывают, составляют метку, присвоенную запаху.

Похоже, это работает как хеш-функция, зависящая от местности, в том, что похожие запахи производят похожие теги. Однако это отличается от функций LSH, используемых в алгоритмах поиска по сходству. Он использует разреженные двоичные случайные проекции для увеличения размера ввода, который затем сжимается до верхних 5% измерений.

Внедрение алгоритма мухи и его тестирование на обычном LSH показывает, что он превосходит его, используя ту же вычислительную сложность.

Взгляните на видео:

Значит, в будущем мы будем использовать поиск сходства на основе алгоритма полета? Возможно, но не это главное.

В заключении к статье говорится:

Некоторые ингредиенты мухи раньше употреблялись в пищу по частям; например, MinHash и хэш «победитель получает все» используют компоненты, подобные WTA, хотя ни один из них не предлагает расширения размерности; аналогично, случайные проекции используются во многих семействах LSH, но, насколько нам известно, ни один из них не использует разреженные двоичные проекции. Таким образом, сочетание этих вычислительных компонентов кажется новым, и нам кажется замечательным, что эволюция открыла их для обоняния мух.

Наконец, несмотря на то, что обонятельная система мух подвергалась обширному экспериментальному картированию, есть некоторые свидетельства того, что три признака, используемые в мотиве цепи мухи, могут также проявляться в других областях мозга и у других видов. Таким образом, хеширование с учетом местоположения может быть общим принципом вычислений, используемых в мозгу.

Конечно, может оказаться, что более важно найти фотографии котят, похожих на те, что у нас уже есть.

Drosophila melanogaster. Предоставлено: Андре Карват.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *