Временные таблицы PostgreSQL: руководство по манипулированию данными
При работе с базами данных возникают ситуации, когда необходимо хранить временные данные, необходимые только на время сеанса или конкретной транзакции. Postgres (PostgreSQL) предоставляет мощную функцию, называемую временными таблицами, для обработки таких сценариев. В этой статье мы рассмотрим временные таблицы в PostgreSQL, поймем их преимущества и предоставим несколько примеров кода, иллюстрирующих их использование.
Понимание временных таблиц
Временная таблица в Postgres — это таблица, определение и данные которой видны только в рамках текущего сеанса или транзакции. Эти таблицы создаются и управляются аналогично обычным таблицам, но они автоматически удаляются в конце сеанса или транзакции, в зависимости от их области действия.
Временные таблицы могут быть полезны в различных сценариях, в том числе:
- Хранение промежуточных результатов при сложных запросах или преобразованиях данных.
- Разбиение сложной задачи на более мелкие, выполнимые шаги.
- Кэширование данных для более быстрого доступа в рамках сеанса.
- Изоляция данных для разных одновременных сеансов или транзакций.
Стоит отметить, что временная таблица сильно отличается от представления. Представление — это виртуальная таблица, основанная на результате оператора SELECT. Представления не хранят данные сами по себе, а вместо этого извлекают данные из базовых таблиц каждый раз, когда к ним запрашивается. Представления можно использовать для упрощения сложных запросов, предоставления уровня абстракции над базовыми таблицами и ограничения доступа к определенным столбцам или строкам.
Основное различие между временными таблицами и представлениями заключается в том, что временные таблицы хранят данные, а представления — нет. Временные таблицы можно использовать для хранения промежуточных результатов сложных запросов, а представления обеспечивают уровень абстракции над базовыми таблицами и могут использоваться для упрощения сложных запросов или ограничения доступа к определенным данным.
Теперь давайте рассмотрим, как создавать и использовать временные таблицы в Postgres.
Создание временных таблиц
Временные таблицы создаются с помощью CREATE TEMPORARY TABLE
оператора. Синтаксис следующий:
CREATE TEMPORARY TABLE table_name ( column1 data_type, column2 data_type, ... ); -- TEMPORARY can be shorthanded to TEMP CREATE TEMP TABLE table_name ( column1 data_type, column2 data_type, ... );
Представьте, что вы выполняете (или должны были выполнить) анализ своих продаж.
Возможно, вы захотите сохранить временные данные для анализа в течение сеанса, и для этого вы решаете создать временную таблицу с именем со sales_analysis
столбцами product_name
и sales_amount
.
-- Create a temporary table raiden=# CREATE TEMPORARY TABLE sales_analysis( product_name VARCHAR(50), sales_amount NUMERIC(10, 2) );
Временные таблицы следуют тем же правилам, что и обычные таблицы, с точки зрения определений столбцов, ограничений и индексов. Вы можете указать первичные ключи, ограничения уникальности и даже создавать индексы для временных таблиц для оптимизации поиска данных.
Вставка данных во временные таблицы
После того как вы создали временную таблицу, вы можете вставить в нее данные с помощью этого INSERT INTO
оператора. Для этого примера мы просто будем использовать фиктивные данные.
-- Insert data into the temporary table raiden=# INSERT INTO sales_analysis (product_name, sales_amount) VALUES ('Product A', 100.50), ('Product B', 75.20), ('Product C', 150.00);
Убедитесь, что данные добавлены
INSERT 0 3
Запрос временных таблиц
Временные таблицы можно запрашивать так же, как и обычные таблицы. Вы можете использовать этот SELECT
оператор для получения данных из временной таблицы.
-- Retrieve data from the temporary table raiden=# SELECT * FROM sales_analysis;
raiden=# SELECT * FROM sales_analysis; product_name | sales_amount --------------+-------------- Product A | 100.50 Product B | 75.20 Product C | 150.00 (3 rows)
К временным таблицам можно применять различные операции фильтрации, сортировки и агрегирования, как и к обычным таблицам. Давайте использовать SUM
в этом случае.
raiden=# SELECT SUM(sales_amount) as total_sales FROM sales_analysis;
total_sales ------------- 325.70 (1 row)
Временные таблицы предоставляют гибкий и эффективный способ манипулирования и анализа данных в рамках сеанса.
Удаление временных таблиц
Временные таблицы автоматически удаляются в конце сеанса или транзакции, в зависимости от их области действия. Однако вы можете явно удалить временную таблицу до окончания сеанса, используя DROP TABLE
оператор.
-- Drop the temporary table raiden=# DROP TABLE sales_analysis;
raiden=# SELECT * FROM sales_analysis; ERROR: relation "sales_analysis" does not exist LINE 1: SELECT * FROM sales_analysis;
Как видите, удаление временной таблицы приведет к удалению всех ее данных, и впоследствии вы не сможете получить к ней доступ. Поэтому обязательно удаляйте временные таблицы только тогда, когда их данные вам больше не нужны.
Область действия временных таблиц
Временные таблицы в Postgres могут иметь разные области действия в зависимости от того, где они созданы. Существует три типа областей временных таблиц:
- Временные таблицы сеанса : эти таблицы видны только в рамках текущего сеанса и автоматически удаляются в конце сеанса или при его завершении.
- Временные таблицы транзакций : эти таблицы видны только в рамках текущей транзакции и автоматически удаляются в конце транзакции или при ее откате.
- Непосредственные временные таблицы : эти таблицы видны в текущем сеансе и во всех последующих сеансах до тех пор, пока таблица не будет явно удалена или сеанс не завершится.
Область действия временной таблицы зависит от контекста, в котором она создана. Чтобы явно создать временную таблицу сеанса, вы можете использовать CREATE TEMPORARY TABLE
оператор.
Временные таблицы транзакций создаются с использованием одного и того же оператора в блоке транзакций. Непосредственные временные таблицы создаются с использованием CREATE TEMPORARY TABLE
оператора вне блока транзакции.
Пример. Использование временных таблиц для преобразования данных
Предположим, у нас есть ресторан быстрого питания и orders
таблица со столбцами order_id
, product_id
и quantity
. Мы хотим рассчитать общий объем продаж для каждого продукта, суммируя проданные количества. Мы можем использовать временную таблицу для хранения промежуточных результатов и упрощения запроса.
-- Create a temporary table to store intermediate results raiden=# CREATE TEMPORARY TABLE temp_product_sales ( product_id INT, total_sales INT ); -- Insert data into the temporary table raiden=# INSERT INTO temp_product_sales (product_id, total_sales) SELECT product_id, SUM(quantity) AS total_sales FROM orders GROUP BY product_id; -- Retrieve the total sales for each product raiden=# SELECT p.product_name, t.total_sales FROM temp_product_sales t JOIN products p ON p.product_id = t.product_id;
В приведенном выше примере мы создаем временную таблицу temp_product_sales
для хранения промежуточных результатов расчета общего объема продаж. Мы вставляем агрегированные данные с помощью SELECT
оператора с предложением GROUP BY
.
Мы соединяем временную таблицу с products
таблицей, чтобы получить названия продуктов и общий объем продаж.
Временные таблицы улучшают читаемость и удобство обслуживания наших запросов.
Заключение
Временные таблицы в PostgreSQL могут помочь вам более эффективно управлять данными и манипулировать ими, сохраняя промежуточные результаты для сложных запросов, выполняя операции с подмножеством данных, не затрагивая исходные данные, и работая с данными изолированно от других сеансов.
Временные таблицы автоматически удаляются в конце сеанса или транзакции без необходимости очистки вручную, что упрощает рабочий процесс.