Перейти к основному содержимому
Перейти к основному содержимому

clickhouse_backupview

Модуль Python для анализа резервных копий, созданных командой BACKUP. Основной мотивацией было получение информации из резервной копии без её восстановления.

Этот модуль предоставляет функции для:

  • перечисления файлов, содержащихся в резервной копии
  • чтения файлов из резервной копии
  • получения полезной информации в читаемом виде о базах данных, таблицах, частях, содержащихся в резервной копии
  • проверки целостности резервной копии

Пример:

from clickhouse_backupview import open_backup, S3, FileInfo


# Открыть резервную копию. Мы также могли бы использовать локальный путь:

# backup = open_backup("/backups/my_backup_1/")
backup = open_backup(S3("uri", "access_key_id", "secret_access_key"))


# Получить список баз данных внутри резервной копии.
print(backup.get_databases()))


# Получить список таблиц внутри резервной копии,

# и для каждой таблицы её запрос на создание и список частей и партиций.
for db in backup.get_databases():
    for tbl in backup.get_tables(database=db):
        print(backup.get_create_query(database=db, table=tbl))
        print(backup.get_partitions(database=db, table=tbl))
        print(backup.get_parts(database=db, table=tbl))


# Извлечь всё из резервной копии.
backup.extract_all(table="mydb.mytable", out='/tmp/my_backup_1/all/')


# Извлечь данные конкретной таблицы.
backup.extract_table_data(table="mydb.mytable", out='/tmp/my_backup_1/mytable/')


# Извлечь одну партицию.
backup.extract_table_data(table="mydb.mytable", partition="202201", out='/tmp/my_backup_1/202201/')


# Извлечь одну часть.
backup.extract_table_data(table="mydb.mytable", part="202201_100_200_3", out='/tmp/my_backup_1/202201_100_200_3/')

Для получения дополнительных примеров смотрите тест.