Функция табличного вида icebergCluster

Это расширение функции табличного вида iceberg.

Позволяет обрабатывать файлы из Apache Iceberg параллельно с множества узлов в указанном кластере. На инициаторе создается соединение со всеми узлами в кластере и динамически передаются файлы. На рабочем узле инициатор запрашивает следующую задачу для обработки и выполняет её. Это повторяется, пока все задачи не будут завершены.

Синтаксис

icebergS3Cluster(cluster_name, url [, NOSIGN | access_key_id, secret_access_key, [session_token]] [,format] [,compression_method])
icebergS3Cluster(cluster_name, named_collection[, option=value [,..]])

icebergAzureCluster(cluster_name, connection_string|storage_account_url, container_name, blobpath, [,account_name], [,account_key] [,format] [,compression_method])
icebergAzureCluster(cluster_name, named_collection[, option=value [,..]])

icebergHDFSCluster(cluster_name, path_to_table, [,format] [,compression_method])
icebergHDFSCluster(cluster_name, named_collection[, option=value [,..]])

Аргументы

cluster_name — Название кластера, которое используется для построения набора адресов и параметров соединения с удаленными и локальными серверами.
Описание всех остальных аргументов совпадает с описанием аргументов аналогичной функции табличного вида iceberg.

Возвращаемое значение

Таблица с заданной структурой для чтения данных из кластера в указанной таблице Iceberg.

Примеры

SELECT * FROM icebergS3Cluster('cluster_simple', 'http://test.s3.amazonaws.com/clickhouse-bucket/test_table', 'test', 'test')

См. также