UNION vs UNION ALL: Quando usar e qual é mais rápido?

Q: Qual é a principal diferença visual entre UNION e UNION ALL?

O UNION remove automaticamente registros duplicados do resultado final, enquanto o UNION ALL combina todos os registros de ambas as consultas, mantendo as duplicatas se elas existirem.

Q: Por que o UNION ALL é considerado mais rápido?

O UNION ALL é mais rápido porque não exige que o banco de dados execute operações extras de ordenação e comparação para identificar e remover duplicatas, economizando CPU e memória.

Q: Posso usar UNION com colunas de nomes diferentes?

Sim, contanto que o número de colunas e os tipos de dados sejam os mesmos em ambas as queries. Os nomes das colunas no resultado final serão os definidos na primeira instrução SELECT.

Você sabe quando usar UNION ou UNION ALL? Descubra as diferenças fundamentais de performance e como cada operador trata registros duplicados em suas consultas SQL.

Para compreender de forma básica tem a ver com linhas duplicadas. UNION combinará linhas das demais tabelas combinadas que já existam no resultado das consultas aplicadas nas tabelas anteriores; Já o UNION ALL não se importará com isso.

Uma outra alternativa de como ver UNION e UNION ALL vem diretamente da matemática:

Dica de Leitura: Se você está interessado em aprofundar seu conhecimento em SQL e entender melhor como as funções e procedures podem ser utilizadas em conjunto com operadores como UNION e UNION ALL, então vale a pena conferir o artigo sobre Diferenças Entre Funções e Procedures em SQL, que explora detalhadamente esses conceitos e como eles podem ser aplicados em seus projetos.

UNION é uma operação de coleções de elementos que resulta em um terceiro conjunto;
UNION ALL é uma operação de coleções de elementos resultando em uma bag.

Aqui, tanto conjunto como bag são coleções de elementos. A diferença entre eles é dada pela “operação de soma” de elementos a uma coleção pré-existente. Vou definir como “soma”:

el + C = R

Onde el é um elemento qualquer, C é a coleção pré-existente e R é a coleção resultante da operação, que contém em sua totalidade C e também tem como elemento el.

Se el não existir previamente em C, então as operações com conjunto e bag são idênticas. Agora, se el já existir previamente em C, a soma com um conjunto resultará em R == C, não afetando o resultante. Porém a bag é alterada com a adição de el, portanto R != C.

De certo modo, podemos dizer que a bag é uma coleção de elementos que admite repetição, já conjunto não admite repetição.

Com isso, temos resultados interessantes ao se usar UNION e UNION ALL. Como conjunto não admite repetição, o UNION comparará todas as tuplas e retornará apenas as únicas. Por uma questão de performance, a primeira operação a ser realizada será uma ordenação total das tuplas (tempo o(n log n)) para então eliminar as repetições (tempo o(n)). Se ele não fizesse essa ordenação antes da verificação dos únicos, teria um tempo de execução quadrático.

Normalmente se trabalha com números, strings e datas em um banco de dados, então nesse conjunto universo é possível obter uma ordenação. Pôde-se também usar uma heurística para ordenação de blobs, tratando-os como uma palavra de bytes e ordená-los lexicograficamente, mantendo portanto uma ordenação mais “natural”. Para o caso de enumerações, como elas possuem rótulos em strings, poderíamos usar esses rótulos e continuar com uma ordenação no conjunto (embora essa ordenação agora não seja mais uma ordenação natural).

Então, por questão de performance, ao requisitar um UNION, normalmente o SGBD guardará todo o resultado da consulta, executará uma única ordenação no final de tudo e então obterá o resultado de tuplas únicas. Ele não faz ordenamentos parciais do conjunto de dados pois é extremamente ruim para a performance; executar uma ordenação a cada m dados novos significa rodar o(n/m) vezes uma ordenação de o(n log n), o que pode acabar ficando pior até mesmo que uma ordenação quadrática se m for mal escolhido.

Isso tudo implica que UNION não tem alta disponibilidade, pois só começará a retornar após obter todos os dados.

Já UNION ALL, como tem como resultado uma bag, não precisa obter previamente todo o resultado para então devolver. No momento que um resultado é obtido, ele já pode responder imediatamente a quem fez a consulta, esquecer desse valor é pegar o próximo. Isso torna sua disponibilidade muito maior. Sem falar que potencialmente, dependendo de como foi implementado o motor de SQL usado, o resultado desse operador não precisa ser armazenado em memória, podendo ser retornado imediatamente para quem o chamou utilizar o dado obtido.

                
english-interview-debugger.sh

                $ grep -r "senior_dev_communication" ./career
            
                [CRITICAL_ERROR] Código sênior detectado, mas fluência falhou no runtime. 
                
Motivo: Travou na hora de explicar a arquitetura (System Design) em inglês para o gringo.
            
                O mercado internacional não quer um robô de gramática. Quer um dev que saiba defender uma tomada de decisão técnica sob pressão. Destrave sua conversão na Preply com aulas particulares focadas em TI.
            
                  $ ./fix-english.sh --target=remote-job
                
                    Achar Professor Particular ➔

Por ventura, pode-se necessitar de se trabalhar com conjuntos propriamente ditos, não com bags, mas nem por isso você precisará usar UNION. Claro, isso vai depender extremamente da semântica de cada caso, não recomendo portanto generalizar. Vou dar um exemplo em que é possível obter um conjunto a partir do uso de UNION ALL.

Com base na modelagem a seguir:

*[relacionamento via multiplexação, onde uma tabela aponta hipoteticamente para 3 outras a partir de uma chave estrangeira multiplexada pelo valor de outra coluna]*

Eu preciso resgatar o nome e código de todos os correntistas, assim como se ele é “supervisor”, “vendedor” ou “cliente”. A chave estrangeira em “conta_corrente” é cd_usuario, que por sua vez se liga com cd_cliente, ou cd_vendedor, ou cd_supervisor, dependendo da muliplexação. No meu caso, cada correntista só pode ter no máximo uma conta corrente. A consulta ficaria assim:

SELECT cd_usuario, "cliente" AS tp_correntista, nm_cliente AS nm_correntista
FROM conta_corrente cc INNER JOIN
    cliente c ON (c.cd_cliente = cc.cd_usuario)
WHERE cc.tp_conta = 'c'
UNION
SELECT cd_usuario, "vendedor" AS tp_correntista, nm_vendedor AS nm_correntista
FROM conta_corrente cc INNER JOIN
    vendedor v ON (v.cd_vendedor = cc.cd_usuario)
WHERE cc.tp_conta = 'v'
UNION
SELECT cd_usuario, "supervisor" AS tp_correntista, nm_supervisor AS nm_correntista
FROM conta_corrente cc INNER JOIN
    supervisor s ON (s.cd_supervisor = cc.cd_usuario)
WHERE cc.tp_conta = 's'

Pronto, a consulta retorna um conjunto como esperado. Agora, notou como não é possível que, por acaso, haja uma igualdade de tuplas entre, digamos, a primeira consulta e a segunda consulta? Isso porque todos os elementos da primeira consulta terão como segundo elemento de suas tuplas o valor “cliente”, já os da segunda consulta o valor na mesma posição seria “vendedor”. Além disso, como cd_cliente é chave primária da tabela cliente e cada cliente nesse modelo só está atrelado a no máximo um elemento da tabela conta_corrente, então não tem choque de tuplas dentro de cada consulta individual, portanto cada uma das 3 consultas acima resulta num conjunto.

Como já temos 3 conjuntos, e temos garantia que nenhum desses conjuntos tem elemento em comum com outro conjunto, a operação de “soma” terá o mesmo resultado final que a “soma” de bags. Portanto, em casos assim, o uso do UNION ALL garante o resultado desejado e também garante uma melhor performance (teoricamente pelo menos).

A consulta então pode ser reescrita assim:

SELECT cd_usuario, "cliente" AS tp_correntista, nm_cliente AS nm_correntista
FROM conta_corrente cc INNER JOIN
    cliente c ON (c.cd_cliente = cc.cd_usuario)
WHERE cc.tp_conta = 'c'
UNION ALL
SELECT cd_usuario, "vendedor" AS tp_correntista, nm_vendedor AS nm_correntista
FROM conta_corrente cc INNER JOIN
    vendedor v ON (v.cd_vendedor = cc.cd_usuario)
WHERE cc.tp_conta = 'v'
UNION ALL
SELECT cd_usuario, "supervisor" AS tp_correntista, nm_supervisor AS nm_correntista
FROM conta_corrente cc INNER JOIN
    supervisor s ON (s.cd_supervisor = cc.cd_usuario)
WHERE cc.tp_conta = 's'
 LEIA TAMBÉM:

Continue aprendendo:

Agora que você já sabe sobre as diferenças entre UNION e UNION ALL, que tal avançar seus conhecimentos em SQL com o artigo sobre Melhores Práticas para Triggers em SQL?

Perguntas Frequentes (FAQ): UNION vs UNION ALL

Qual é a principal diferença visual entre UNION e UNION ALL?

A diferença está no tratamento das duplicatas. Se você tiver o mesmo registro em duas tabelas diferentes, o UNION mostrará esse registro apenas uma vez no resultado final. Já o UNION ALL mostrará o registro duas vezes, preservando a integridade original de cada consulta.

Por que o UNION ALL é considerado mais rápido?

Para remover duplicatas, o banco de dados precisa realizar uma operação interna de Sort (ordenação) ou Distinct Scan para comparar todos os registros entre si. Isso consome CPU e memória. O UNION ALL ignora essa etapa e apenas anexa os resultados, o que o torna significativamente mais veloz em grandes volumes de dados.

Posso usar UNION com colunas de nomes diferentes?

Sim, desde que a quantidade de colunas e os tipos de dados sejam compatíveis. O nome das colunas no resultado final será herdado da primeira consulta SELECT. É uma boa prática usar aliases (AS) na primeira query para garantir que os cabeçalhos façam sentido para o usuário final.

Artigo anterior

SQL DISTINCT e GROUP BY: Guia Real de Soluções

Próximo artigo

Implementar Banco de Dados SQLite: O Guia Prático

UNION vs UNION ALL: Quando usar e qual é mais rápido?

Continue aprendendo:

Perguntas Frequentes (FAQ): UNION vs UNION ALL

Gostou do conteúdo? Que tal programar ganhando em Dólar?

Pesquisa: Como você está usando IA na sua rotina Dev?

DEIXE UMA RESPOSTA Cancelar resposta

Mais recentes

Sincronizando PostgreSQL e Turbopuffer com Puffgres

3 Técnicas para Reduzir Consumo de Tokens no Claude Code e Codex

Entenda Componentes de Cache no Next.js

Grok 4.5: mais rápido e integrado ao Cursor

Evolua para Sênior

Cloudflare Monetization Gateway Está Redefinindo a Economia da IA

Configuração do GLM-5.2 no Cursor via OpenRouter

Mais Lidos

SQL: Como Pegar o Registro com o Maior Valor de Cada Grupo

Como Fazer o Code Review com IA Funcionar de Verdade

No-Code para Startups: Valide sua Ideia e Crie um MVP Rápido

Filmes e Séries para Empreendedores de TI e Startups

Evolua para Sênior

Recursos da Comunidade

Automação Sem Limites

Automate (Sujeito Programador)

AppSec: Segurança na Prática

Android Express

Robótica & Arduino VIP

Ecossistema Danki Code

JOB NA GRINGA

Você vai gostarrelacionados
Continue aprendendo

Quer dominar arquitetura e IA?

UNION vs UNION ALL: Quando usar e qual é mais rápido?

Eleve seu desenvolvimento com o Cursor

Continue aprendendo:

Aprofunde seus Conhecimentos em SQL

Perguntas Frequentes (FAQ): UNION vs UNION ALL

Gostou do conteúdo? Que tal programar ganhando em Dólar?

Pesquisa: Como você está usando IA na sua rotina Dev?

DEIXE UMA RESPOSTA Cancelar resposta

Mais recentes

Evolua para Sênior

Mais Lidos

Evolua para Sênior

Recursos da Comunidade

JOB NA GRINGA

Você vai gostarrelacionadosContinue aprendendo

Quer dominar arquitetura e IA?

Você vai gostarrelacionados
Continue aprendendo