GROUP BY, Aggregazioni e HAVING

19 febbraio 2026

10 min di lettura

Introduzione

Finora le query hanno restituito righe individuali dal database. Spesso serve invece condensare molte righe in un risultato più piccolo: contare elementi, calcolare medie, trovare valori massimi o minimi.

Questo capitolo introduce due tecniche complementari: GROUP BY per raggruppare righe, e le funzioni di aggregazione per calcolare valori da gruppi di righe. Si copre anche HAVING per filtrare i gruppi dopo il raggruppamento.

GROUP BY: Concetto Base

Definizione

GROUP BY è una clausola SQL che raggruppa righe con lo stesso valore in una o più colonne, riducendo il numero di righe nel risultato.

Obiettivo:

Prendere molte righe e condensarle in un numero minore di righe
Il risultato di GROUP BY sono ancora righe, ma raggruppate per valori comuni

Sintassi base:

1
SELECT column
2
FROM table
3
GROUP BY column;

Come Funziona GROUP BY

Per capire GROUP BY, è utile visualizzare cosa succede:

Identificazione dei valori unici: PostgreSQL trova tutti i valori unici nella colonna specificata in GROUP BY
Creazione di gruppi: per ogni valore unico, crea un “gruppo” o “bucket”
Assegnazione delle righe: ogni riga della tabella originale viene assegnata al gruppo corrispondente al suo valore nella colonna GROUP BY

Esempio concettuale:

Se si ha una tabella comments con molte righe e si esegue:

1
SELECT user_id
2
FROM comments
3
GROUP BY user_id;

Processo:

PostgreSQL trova i valori unici in user_id (es. 1, 2, 3, 5)
Crea un gruppo per ogni valore unico
Assegna ogni riga al gruppo corrispondente al suo user_id
Restituisce solo i valori unici (uno per gruppo)

Risultato: invece di 100 righe, si ottengono solo 5 righe (una per ogni user_id unico).

Limitazioni nel SELECT con GROUP BY

Quando si usa GROUP BY, ci sono restrizioni su cosa si può selezionare:

Si può selezionare:

Le colonne specificate in GROUP BY
Il risultato di funzioni di aggregazione

Non si può selezionare direttamente:

Colonne che non sono nel GROUP BY e non sono parte di un’aggregazione

Esempio di errore:

1
SELECT user_id, contents
2
FROM comments
3
GROUP BY user_id;
4
-- Errore: "column 'contents' must appear in GROUP BY clause
5
--          or be used in an aggregate function"

Spiegazione: dopo il GROUP BY, ogni gruppo contiene molte righe. Selezionare contents senza aggregazione non è possibile perché PostgreSQL non sa quale valore di contents restituire per ogni gruppo.

Funzioni di Aggregazione

Definizione

Le funzioni di aggregazione prendono molti valori da una colonna e li riducono a un singolo valore.

Funzioni disponibili:

COUNT: conta il numero di valori
SUM: somma i valori numerici
AVG: calcola la media dei valori numerici
MIN: trova il valore minimo
MAX: trova il valore massimo

Sintassi Base

Le funzioni di aggregazione vengono usate nel SELECT:

1
SELECT AGGREGATE_FUNCTION(column)
2
FROM table;

Esempi:

1
-- Trovare il valore massimo
2
SELECT MAX(id) FROM comments;
3

4
-- Trovare il valore minimo
5
SELECT MIN(id) FROM comments;
6

7
-- Calcolare la media
8
SELECT AVG(id) FROM comments;
9

10
-- Contare il numero di righe
11
SELECT COUNT(id) FROM comments;
12

13
-- Sommare tutti i valori
14
SELECT SUM(id) FROM comments;

Limitazioni con SELECT

Quando si usa una funzione di aggregazione, non si può selezionare altre colonne non aggregate nella stessa query:

1
-- Errore
2
SELECT id, MAX(id) FROM comments;
3
-- Errore: "column 'id' must appear in GROUP BY clause
4
--          or be used in an aggregate function"

Spiegazione: MAX(id) restituisce un singolo valore, mentre id restituirebbe molte righe. PostgreSQL non sa come combinare questi risultati.

COUNT(*) vs COUNT(column)

COUNT(column):

Conta solo i valori non NULL nella colonna specificata
Se una riga ha NULL nella colonna, non viene contata

COUNT(*):

Conta tutte le righe, indipendentemente dai valori NULL
Più affidabile quando si vuole contare il numero totale di righe

Esempio:

1
-- Se ci sono 21 foto ma una ha user_id = NULL
2
SELECT COUNT(user_id) FROM photos;
3
-- Restituisce 20 (esclude la riga con NULL)
4

5
SELECT COUNT(*) FROM photos;
6
-- Restituisce 21 (conta tutte le righe)

Best practice: usare COUNT(*) quando si vuole contare tutte le righe, indipendentemente dai valori NULL.

Combinare GROUP BY con Aggregazioni

Concetto

Quando si combina GROUP BY con funzioni di aggregazione, l’aggregazione viene applicata a ciascun gruppo separatamente, non a tutte le righe insieme.

Processo:

GROUP BY crea i gruppi
Per ogni gruppo, la funzione di aggregazione viene applicata solo alle righe di quel gruppo
Il risultato contiene una riga per gruppo con il valore aggregato

Esempio: Contare Commenti per Utente

1
SELECT user_id, COUNT(*) AS num_comments
2
FROM comments
3
GROUP BY user_id;

Spiegazione:

GROUP BY user_id: crea gruppi per ogni user_id unico
COUNT(*): conta le righe in ciascun gruppo
Risultato: una riga per utente con il numero di commenti creati

Risultato esempio:

1
user_id | num_comments
2
--------|--------------
3
1       | 23
4
2       | 18
5
3       | 15
6
4       | 22
7
5       | 22

Esempio: Contare Commenti per Foto

1
SELECT photo_id, COUNT(*) AS num_comments
2
FROM comments
3
GROUP BY photo_id;

Spiegazione:

GROUP BY photo_id: crea gruppi per ogni photo_id unico
COUNT(*): conta i commenti per ogni foto
Risultato: una riga per foto con il numero di commenti associati

Visualizzazione Concettuale

Dopo GROUP BY, si può immaginare una tabella temporanea con:

Una riga per ogni gruppo (valore unico nella colonna GROUP BY)
Colonne aggregate che contengono i risultati delle funzioni di aggregazione per quel gruppo

Esempio con MAX:

1
SELECT user_id, MAX(id) AS max_comment_id
2
FROM comments
3
GROUP BY user_id;

Per ogni gruppo di user_id, trova il valore massimo di id tra tutte le righe di quel gruppo.

GROUP BY con JOIN

Combinare Raggruppamento e Unione di Tabelle

È possibile combinare GROUP BY con JOIN per raggruppare dati da più tabelle.

Esempio: Nome Autore e Numero di Libri

1
SELECT authors.name, COUNT(*) AS num_books
2
FROM books
3
JOIN authors ON authors.id = books.author_id
4
GROUP BY authors.name;

Spiegazione:

FROM books JOIN authors: unisce le tabelle books e authors
GROUP BY authors.name: raggruppa per nome dell’autore
COUNT(*): conta i libri per ogni autore
Risultato: nome dell’autore e numero di libri scritti

Regola importante: quando si usa GROUP BY con JOIN, tutte le colonne non aggregate nel SELECT devono essere nel GROUP BY.

Esempio corretto:

1
SELECT authors.name, COUNT(*)
2
FROM books
3
JOIN authors ON authors.id = books.author_id
4
GROUP BY authors.name;  -- authors.name è nel GROUP BY

Esempio errato:

1
SELECT authors.name, COUNT(*)
2
FROM books
3
JOIN authors ON authors.id = books.author_id
4
GROUP BY books.author_id;  -- Errore: authors.name non è nel GROUP BY

HAVING: Filtrare i Gruppi

Definizione

HAVING è una clausola SQL che filtra i gruppi dopo che GROUP BY è stato applicato, simile a WHERE ma per gruppi invece che per righe individuali.

Differenza chiave:

WHERE: filtra righe individuali prima del GROUP BY
HAVING: filtra gruppi dopo il GROUP BY

Sintassi:

1
SELECT columns
2
FROM table
3
WHERE condition_on_rows
4
GROUP BY column
5
HAVING condition_on_groups;

Quando Usare HAVING

Usare HAVING quando:

Si vuole filtrare basandosi sul risultato di una funzione di aggregazione
Si vuole filtrare i gruppi dopo il raggruppamento
La condizione di filtro coinvolge valori aggregati (COUNT, SUM, AVG, ecc.)

Indicatori linguistici:

“Trova gruppi dove il conteggio è maggiore di X”
“Mostra solo i gruppi con somma superiore a Y”
“Filtra gruppi basandosi su un valore aggregato”

Esempio Base: Foto con Più di Due Commenti

1
SELECT photo_id, COUNT(*) AS num_comments
2
FROM comments
3
WHERE photo_id < 3
4
GROUP BY photo_id
5
HAVING COUNT(*) > 2;

Spiegazione:

FROM comments: parte da tutti i commenti
WHERE photo_id < 3: filtra solo i commenti per le prime due foto (filtro sulle righe)
GROUP BY photo_id: raggruppa per foto
HAVING COUNT(*) > 2: filtra solo i gruppi con più di 2 commenti (filtro sui gruppi)
Risultato: solo le foto con ID < 3 che hanno più di 2 commenti

Ordine di Esecuzione

L’ordine logico di esecuzione è:

FROM: seleziona la tabella sorgente
WHERE: filtra le righe individuali
GROUP BY: raggruppa le righe rimanenti
HAVING: filtra i gruppi
SELECT: seleziona le colonne finali

Nota: HAVING viene sempre dopo GROUP BY. Non si può usare HAVING senza GROUP BY.

Esempio Complesso: Utenti Attivi

Trovare gli utenti che hanno commentato più di 20 volte sulle prime 50 foto:

1
SELECT user_id, COUNT(*) AS num_comments
2
FROM comments
3
WHERE photo_id <= 50
4
GROUP BY user_id
5
HAVING COUNT(*) > 20;

Spiegazione:

FROM comments: tutti i commenti
WHERE photo_id <= 50: solo commenti per le prime 50 foto
GROUP BY user_id: raggruppa per utente
HAVING COUNT(*) > 20: solo utenti con più di 20 commenti
Risultato: ID utente e numero di commenti per utenti attivi

HAVING con Aggregazioni Complesse

HAVING può usare qualsiasi funzione di aggregazione:

1
SELECT manufacturer, SUM(price * units_sold) AS total_revenue
2
FROM phones
3
GROUP BY manufacturer
4
HAVING SUM(price * units_sold) > 2000000;

Spiegazione:

Raggruppa telefoni per produttore
Calcola il ricavo totale (prezzo × unità vendute) per ogni produttore
Filtra solo i produttori con ricavo totale maggiore di 2 milioni

Nota: la stessa espressione aggregata (SUM(price * units_sold)) appare sia nel SELECT che nell’HAVING. Questo è normale e necessario.

Esercizi di Riepilogo

GROUP BY Base: Contare Libri per Autore

Scrivere una query che restituisca l’ID dell’autore e il numero di libri che ha scritto.

Soluzione

1
SELECT author_id, COUNT(*) AS num_books
2
FROM books
3
GROUP BY author_id;

Spiegazione:

GROUP BY author_id: raggruppa i libri per autore
COUNT(*): conta i libri in ciascun gruppo
Risultato: una riga per autore con il conteggio dei libri

GROUP BY con JOIN: Nome Autore e Numero di Libri

Scrivere una query che restituisca il nome dell’autore e il numero di libri scritti, usando JOIN tra books e authors.

Soluzione

1
SELECT authors.name, COUNT(*) AS num_books
2
FROM books
3
JOIN authors ON authors.id = books.author_id
4
GROUP BY authors.name;

Spiegazione:

FROM books JOIN authors: unisce le tabelle
GROUP BY authors.name: raggruppa per nome dell’autore
COUNT(*): conta i libri per ogni autore
Risultato: nome dell’autore e numero di libri

HAVING: Produttori con Ricavo Elevato

Scrivere una query che restituisca il nome del produttore e il ricavo totale (prezzo × unità vendute) per tutti i telefoni, ma solo per i produttori con ricavo totale maggiore di 2.000.000.

Tabella phones: name, manufacturer, price, units_sold

Soluzione

1
SELECT manufacturer, SUM(price * units_sold) AS total_revenue
2
FROM phones
3
GROUP BY manufacturer
4
HAVING SUM(price * units_sold) > 2000000;

Spiegazione:

GROUP BY manufacturer: raggruppa i telefoni per produttore
SUM(price * units_sold): calcola il ricavo totale per ogni produttore
HAVING SUM(price * units_sold) > 2000000: filtra solo i produttori con ricavo > 2 milioni
Risultato: nome del produttore e ricavo totale per i produttori più redditizi

Nota: l’espressione SUM(price * units_sold) appare sia nel SELECT che nell’HAVING. Questo è necessario perché HAVING deve filtrare basandosi sul valore aggregato.

WHERE e HAVING Insieme: Commenti Attivi su Foto Specifiche

Scrivere una query che trovi gli utenti che hanno commentato più di 20 volte sulle prime 50 foto.

Soluzione

1
SELECT user_id, COUNT(*) AS num_comments
2
FROM comments
3
WHERE photo_id <= 50
4
GROUP BY user_id
5
HAVING COUNT(*) > 20;

Spiegazione:

FROM comments: tutti i commenti
WHERE photo_id <= 50: filtra solo i commenti per le prime 50 foto (filtro sulle righe)
GROUP BY user_id: raggruppa per utente
HAVING COUNT(*) > 20: filtra solo gli utenti con più di 20 commenti (filtro sui gruppi)
Risultato: ID utente e numero di commenti per utenti attivi

Riepilogo

GROUP BY: raggruppa righe con lo stesso valore in una colonna, riducendo il numero di righe nel risultato. Si può selezionare solo colonne nel GROUP BY o risultati di aggregazioni.
Funzioni di aggregazione: COUNT, SUM, AVG, MIN, MAX riducono molti valori a un singolo valore. Quando usate con GROUP BY, vengono applicate a ciascun gruppo separatamente.
COUNT(*) vs COUNT(column): COUNT() conta tutte le righe, COUNT(column) conta solo valori non NULL. Preferire COUNT() quando si vuole contare tutte le righe.
GROUP BY con JOIN: è possibile combinare GROUP BY con JOIN. Tutte le colonne non aggregate nel SELECT devono essere nel GROUP BY.
HAVING: filtra i gruppi dopo GROUP BY, simile a WHERE ma per gruppi invece che per righe. Si usa quando il filtro coinvolge funzioni di aggregazione.
Differenza WHERE vs HAVING: WHERE filtra righe individuali prima del GROUP BY, HAVING filtra gruppi dopo il GROUP BY. WHERE non può usare aggregazioni, HAVING può.
Ordine di esecuzione: FROM → WHERE → GROUP BY → HAVING → SELECT. HAVING viene sempre dopo GROUP BY.
Espressioni aggregate in HAVING: quando si filtra basandosi su un valore aggregato, la stessa espressione aggregata può apparire sia nel SELECT che nell’HAVING.

Continua la lettura

Leggi il prossimo capitolo: "Dataset E-Commerce: ORDER BY, LIMIT e OFFSET"

Continua a leggere