SQL Server 2016 и озеро данных Azure


Microsoft анонсировала CTP 3 для SQL Server 2016 вместе с Azure Data Lake.

Последняя версия Community Technology Preview (CTP) SQL Server 2016 была анонсирована на саммите Microsoft PASS. Новая версия хранит данные в непрерывном шифровании, будь то в базе данных или во время передачи. Была добавлена поддержка статистического анализа R вместе с включением средства PolyBase в SQL Server. PolyBase позволяет использовать операторы T-SQL для доступа к данным, хранящимся в Hadoop или хранилище BLOB-объектов Azure, и запрашивать их в специальной манере.

Он также позволяет запрашивать полуструктурированные данные и объединять результаты с наборами реляционных данных, хранящимися в SQL Server. Другое главное дополнение — возможность архивировать холодные данные в Azure. Эта предварительная версия также включает новые возможности бизнес-аналитики (BI) для служб SQL Server Analysis Services и SQL Server Reporting Services. Поддержка мобильной бизнес-аналитики не вошла в текущую предварительную версию; предполагается, что это будет добавлено в ближайшие несколько месяцев.

Написав о функции шифрования в блоге SQL Server, Джозеф Сирош, корпоративный вице-президент группы данных Microsoft, охарактеризовал ее как первую в отрасли, сказав:

«Основан на технологии Microsoft Research и помогает защитить данные в состоянии покоя и в движении. Используя Always Encrypted, SQL Server может выполнять операции с зашифрованными данными, и, что самое главное, ключ шифрования находится вместе с приложением в доверенной среде клиента ».

Улучшения для служб SQL Server Analysis Services (SSAS) и SQL Server Reporting Services (SSRS) включают улучшенную версию DirectQuery, которая означает, что вы можете получить доступ к внешним источникам данных, таким как SQL Server Columnstore. Это улучшает использование SSAS в качестве семантической модели данных для обеспечения согласованности отчетов и анализа без сохранения данных в службах Analysis Services.

Службы SQL Server Reporting Services 2016 улучшили способ разбивки отчетов на страницы и обновили инструменты для создания отчетов. Теперь вы можете закреплять элементы отчетов с разбивкой на страницы на панели мониторинга Power BI, чтобы упростить их совместное использование. Новые возможности мобильной бизнес-аналитики также будут добавлены в службы Reporting Services в ближайшие месяцы.

Включение поддержки языка статистики R с открытым исходным кодом было достигнуто после приобретения Microsoft Revolution Analytics в начале этого года. У компании была коммерческая версия R, а также предоставлялись услуги для языка. CTP SQL Server интегрирован с пакетом Revolution Analytics R, что означает, что вы можете запускать аналитику R в SQL Server.

Последним улучшением является включение Stretch Database, функции, которая обеспечивает прозрачное и безопасное архивирование исторических данных в облаке Microsoft Azure. Когда база данных Stretch включена, она незаметно переносит ваши исторические данные в базу данных SQL Azure. Идея состоит в том, что вы получаете производительность локального сервера для горячих данных и облачное хранилище для старых данных без необходимости изменять свои приложения. Типичное использование этой функции — таблица, которая содержит сочетание небольшого количества горячих данных, которые часто используются или используются в запросах, и большого количества старых данных, которые используются реже, но все же иногда необходимы.

Еще одно важное объявление на PASS касалось Azure Data Lake. Как мы сообщали в то время, в этом году на конференции Build это обсуждалось как гипермасштабируемое хранилище данных для рабочих нагрузок аналитики больших данных. Теперь стало известно больше деталей. Azure Data Lake сочетает в себе возможности анализа с хранилищем больших данных эксабайтного масштаба в качестве полностью управляемой службы. Azure Data Lake является частью Cortana Analytics Suite и состоит из Data Lake Store, единого репозитория данных, который можно использовать для данных любого размера, причем данные доступны для обработки и анализа из приложений и инструментов HDFS.

Второй элемент Data Lake — это Azure Data Lake Analytics. Это новый сервис, основанный на Apache YARN, который динамически масштабируется. Он включает U-SQL, язык, который, согласно сообщению о Data Lake в блоге SQL Server:

«Объединяет преимущества SQL с выразительной силой пользовательского кода».

U-SQL можно использовать для создания масштабируемых распределенных запросов, поэтому вы можете анализировать данные в хранилище и на серверах SQL в Azure, Базе данных SQL Azure и Хранилище данных SQL Azure.

Третий элемент — это Azure HDInsight, полностью управляемая кластерная служба Apache Hadoop от Microsoft, которая поставляется с рядом аналитических механизмов с открытым исходным кодом, включая Hive, Spark, HBase и Storm. Microsoft объявила об общедоступности управляемых кластеров в Linux.

Для разработчиков доступ к Data Lake можно получить с помощью инструментов Azure Data Lake для Visual Studio, которые позволяют писать, отлаживать и настраивать запросы Azure Data Lake Analytics, включая сценарии U-SQL, из Visual Studio.

Последнее важное объявление группы — это общедоступная предварительная версия In-Memory OLTP и общедоступность Operational Analytics в базе данных SQL Azure. In-Memory OLTP улучшает производительность обработки транзакций и может использоваться в сочетании с аналитикой в памяти (columnstore) и традиционным реляционным хранилищем в той же базе данных.


Добавить комментарий