NVIDA обновляет бесплатное программное обеспечение для глубокого обучения


Было время, когда о NVIDA думали как о производителе оборудования для высокопроизводительных игровых машин, но потребность в мощном вычислении чисел продвинула производителя графических процессоров в новые области, и теперь он является одним из лидеров в области искусственного интеллекта.

NVIDA может вам помочь, если вас беспокоят параллельные вычисления на графическом процессоре. Конечно, это должна быть карта NVIDA GPU, на которую вы нацеливаетесь, но вы же не ожидаете, что они будут продвигать чужое оборудование, не так ли?

Однако первая новость заключается в том, что количество людей, заинтересованных в использовании GPU для вычислений, очень быстро растет:

Это показатель того, насколько полезны подходы GPU к общим вычислениям. NVIDIA помогает заинтересованным сторонам своим бесплатным SDK и только что анонсировала новую версию со следующими улучшениями:

Новый CUDA 9 ускоряет работу приложений HPC и глубокого обучения за счет поддержки графических процессоров Volta, повышения производительности библиотек до 5 раз, новой модели программирования для управления потоками и обновлений инструментов отладки и профилирования.

Разработчики приложений для конечных пользователей, таких как веб-службы на базе искусственного интеллекта и встроенные периферийные устройства, получают в 3,5 раза более высокую скорость вывода данных при глубоком обучении с новым TensorRT 3. Благодаря встроенной поддержке оптимизации моделей Caffe и TensorFlow разработчики могут использовать обученные нейронные сети. к производству быстрее, чем когда-либо.

Инженеры и специалисты по данным могут извлечь выгоду из 2,5-кратного ускорения обучения глубокому обучению с использованием оптимизации Volta для таких фреймворков, как Caffe2, Microsoft Cognitive Toolkit, MXNet, PyTorch и TensorFlow.

Обратите внимание, что большинство этих ускорений связано с новейшей архитектурой Volta GPU от NVIDA. Volta разработана специально для обработки данных и, в частности, искусственного интеллекта. Заявлено, что с 640 тензорными ядрами он обеспечивает 100 терафлопс в секунду. Google недавно опубликовал несколько тестов, которые показывают, что Tensorflow почти линейно масштабируется с количеством фактически используемых графических процессоров Volta P100:

Вы не можете не думать, что “это было бы хорошо для графики!”

Глупая идея! Зачем тратить вычислительную мощность на графику?

Кто-нибудь может вспомнить, что означает G в GPU в наши дни?


Добавить комментарий