Google BigQuery обновлен


В Google BigQuery добавлен более широкий диапазон типов запросов и данных, большая гибкость структуры таблиц и улучшенные инструменты для совместного анализа.

Google BigQuery — это инструмент Google, который позволяет выполнять запросы, похожие на SQL, для очень больших наборов данных. Он разработан для наиболее эффективной работы при использовании для интерактивного анализа очень больших наборов данных, обычно с использованием небольшого количества очень больших таблиц, предназначенных только для добавления.

Новые улучшения начинаются с добавления Big Join и Big Group Aggregations. Функция Big Join позволяет объединить данные из двух больших таблиц с общим ключом для создания набора данных. Оператор Big Join обрезает промежуточный этап преобразования данных.

Агрегирование больших групп увеличивает количество различных значений, которые могут быть сгруппированы в результирующий набор, чтобы вы могли настраивать запросы для более крупных подмножеств данных. Как отмечает Майкл Манучехри, инженер программ для разработчиков Cloud Platform, в блоге разработчиков Google:

«Популярные веб-приложения создают журналы активности пользователей, которые каждую неделю могут увеличиваться на миллиарды строк. Разделение пользователей на более мелкие группы — ключевой шаг для анализа. Однако каждая группа пользователей может исчисляться миллионами. Чтобы справиться с этим для таких больших объемов, мы включили агрегирование больших групп ».

И Big Join, и Big Group используются путем добавления модификатора «Each» в предложение. Например:

Еще одно незначительное изменение, которое избавит разработчиков от лишнего труда, — это добавление встроенной поддержки типа данных TIMESTAMP. Это означает, что вы сможете импортировать значения даты и времени из баз данных, таких как MySQL, без потери информации о смещении часового пояса. Появились новые функции для преобразования полей TIMESTAMP в другие форматы, вычисления временных интервалов и извлечения таких компонентов, как час, день недели и квартал.

Третья область улучшения — это возможность добавлять столбцы в существующие таблицы BigQuery. Наконец, был улучшен веб-интерфейс BiqQuery. Теперь вы можете видеть прямые ссылки на отдельные наборы данных в веб-интерфейсе BigQuery. Это было добавлено, чтобы упростить создание закладок и общий доступ к набору данных, а также для быстрого доступа к набору данных. Кроме того, если вы поделитесь набором данных с другим пользователем с помощью панели управления общим доступом, BigQuery отправит электронное письмо с уведомлением человеку, с которым вы поделились им, с прямой ссылкой на набор данных.

После регистрации в BigQuery вы можете бесплатно протестировать новые функции, используя набор общедоступных наборов данных BigQuery.


Добавить комментарий