Виртуальная машина для обработки и анализа данных Linux


Microsoft выпустила образ виртуальной машины с инструментами для анализа данных.

Были выпущены две версии машины, одна под Windows, а другая под Linux. Виртуальные машины для обработки данных – это настраиваемые образы. Версия для Linux построена на базе Linux версии 7.2 на базе OpenLogic CentOS. Обе версии содержат инструменты анализа данных, используемые специалистами по обработке данных, разработчиками, преподавателями и исследователями. Идея состоит в том, что виртуальная машина экономит время и силы пользователей, которые приходится искать, устанавливать, настраивать и управлять инструментами индивидуально.

Помимо стандартных утилит операционной системы, в состав предустановленных инструментов входят:

Microsoft R Открыть с помощью библиотеки ядра Intel Math.

Распространение Anaconda Python с Python 2.7 и 3.5.

Блокноты Jupyter с ядром Python и R для исследования и разработки данных в браузере.

Вы также получаете локальный экземпляр базы данных Postgres и набор инструментов машинного обучения. К ним относится Azure ML, которая позволяет создавать модели R и Python локально на виртуальной машине, а затем публиковать их в облачной службе Azure ML от Microsoft с помощью предустановленных библиотек. Вы также получаете Computational Network Toolkit (CNTK), инструмент глубокого обучения от Microsoft Research; Vowpal Wabbit, система машинного обучения, поддерживающая такие методы, как онлайн, хеширование, allreduce, редукции, learning2search, активное и интерактивное обучение; и XGBoost, инструмент, обеспечивающий быструю и точную реализацию расширенного дерева.

Инструмент Rattle (аналитический инструмент R для легкого обучения) с графическим интерфейсом пользователя для обучения анализу данных с помощью R – еще одна программа, включенная в машину.

Коллекция средств разработки включает в себя Azure SDK на Java, Python, Node.js, Ruby, PHP; Eclipse IDE с подключаемым модулем Azure Toolkit; редакторы кода, такие как vim, gedit и Emacs (с надстройками ESS, auctex); Драйверы SQL Server и инструменты командной строки, такие как bcp (массовое копирование), sqlcmd (текстовая утилита запросов SQL Server); Графический клиент SQuirreL SQL для доступа к различным базам данных.

Идея состоит в том, что примерно через 15 минут вы сможете приступить к работе с собственной виртуальной машиной для анализа данных. У вас есть полный административный доступ к виртуальной машине и вы можете при необходимости установить дополнительное программное обеспечение. За использование образа ВМ отдельная плата не взимается. Вы платите только за фактическое использование аппаратных вычислительных ресурсов виртуальной машины в зависимости от размера виртуальной машины, которую вы предоставляете.


Добавить комментарий