Metodologia

Come funziona Aggregatore Politico: fonti, analisi AI, metriche e classificazioni.

Fonti e raccolta dati

Come raccogliamo le notizie

Aggregatore Politico monitora in tempo reale oltre decine di fonti giornalistiche italiane tramite feed RSS. Ogni articolo viene scaricato, analizzato e arricchito automaticamente dall'intelligenza artificiale.

Le fonti includono quotidiani nazionali (Repubblica, Corriere, La Stampa), testate politiche specializzate (Formiche, Linkiesta, Il Post), agenzie di stampa (ANSA, AGI, Adnkronos) e media indipendenti.

Frequenza di aggiornamento

Ogni 15 minuti

I feed vengono controllati ogni 15 minuti. Gli articoli vengono analizzati dall'AI entro pochi minuti dalla pubblicazione. Le storie vengono raggruppate ogni ora.

Pipeline di analisi

5 fasi automatiche

Raccolta → Classificazione rilevanza → Estrazione metadati (categoria, tono, sentiment, entità, temi) → Raggruppamento in storie → Generazione bollettino.

Sentiment

Cos'è il sentiment

Il sentiment misura il tono emotivo di un articolo su una scala da -1 (molto negativo) a +1 (molto positivo). Non indica se la notizia è “buona” o “cattiva”, ma come viene presentata dalla testata giornalistica.

Scala e soglie

≥ 0.6
Molto positivo
0.2 — 0.6
Positivo
-0.2 — 0.2
Neutro
-0.6 — -0.2
Negativo
≤ -0.6
Molto negativo

Sentiment delle entità

Ogni entità politica ha un sentiment medio a 30 giorni, calcolato come media del sentiment degli articoli in cui viene menzionata. Nella sezione “Trends” il sentiment positivo e negativo viene mostrato come percentuale (es. +12.5% o -8.3%).

Toni giornalistici

Cos'è il tono

Il tono descrive lo stile comunicativo dell'articolo. A differenza del sentiment (che misura positività/negatività), il tono classifica il modo in cui l'informazione è presentata.

Informativo

Neutrale e fattuale, riporta i fatti senza giudizio.

Istituzionale

Formale, tipico di comunicati ufficiali e dichiarazioni.

Critico

Evidenzia problematiche, contraddizioni o inadeguatezze.

Polemico

Acceso, provocatorio, alimenta il dibattito.

Celebrativo

Enfatizza risultati positivi, successi e traguardi.

Allarmista

Sottolinea rischi, pericoli e scenari negativi.

Sarcastico

Ironia e sarcasmo per commentare fatti politici.

Analitico

Approfondimento ragionato con dati e contesto.

Categorie

Come vengono assegnate

Ogni articolo viene classificato in una categoria tematica dall'AI. Un articolo può trattare più temi, ma viene assegnato alla categoria predominante.

Politica Interna

Governo, partiti, coalizioni, dinamiche parlamentari.

Politica Estera

Relazioni internazionali, diplomazia, geopolitica.

Economia

Finanza pubblica, mercati, politica economica.

Giustizia

Riforme giudiziarie, processi, legalità.

Cronaca Politica

Fatti di attualità con rilevanza politica diretta.

Diritti e Società

Diritti civili, welfare, immigrazione.

Difesa e Sicurezza

Forze armate, sicurezza nazionale.

Ambiente

Politiche ambientali, energia, transizione ecologica.

Europa e UE

Istituzioni europee, direttive comunitarie.

Storie

Cos'è una storia

Una storia è un gruppo di articoli correlati che trattano lo stesso evento da fonti diverse. Il sistema raggruppa automaticamente gli articoli usando similarità semantica (embedding vettoriali).

Come vengono create

1

Embedding

Ogni articolo viene convertito in un vettore numerico

2

Clustering

Articoli simili vengono raggruppati per distanza coseno

3

Conferma

≥ 3 articoli da ≥ 2 fonti → storia confermata

4

Sintesi

L'AI genera titolo e sommario della storia

Entità politiche

Cosa sono le entità

Le entità sono attori politici (persone, partiti, istituzioni) estratti automaticamente dagli articoli. L'AI identifica nomi propri e li collega al database di entità politiche italiane.

Arricchimento Wikidata

Le entità vengono arricchite con dati da Wikidata: foto, data di nascita, Wikipedia, profili social. I dati parlamentari provengono dai portali ufficiali.

Trend di visibilità

Il trend confronta le menzioni delle ultime 24 ore con la media dei 7 giorni precedenti. “In crescita” = visibilità sopra la media, “In calo” = sotto la media.

Temi

Cos'è un tema

I temi sono argomenti specifici estratti dagli articoli (es. “referendum”, “riforma della giustizia”). A differenza delle categorie (ampie), i temi sono granulari e cambiano con l'attualità.

Temi in evidenza

La sezione nell'Analisi mostra i temi con maggior volume negli ultimi 7 giorni. Gli indicatori (in crescita, stabile, in calo) confrontano il volume attuale con il periodo precedente. Ogni tema ha una pagina dedicata con articoli, entità collegate e fonti.

Dati parlamentari

Fonti dei dati

I dati parlamentari provengono dai portali ufficiali della Camera dei Deputati e del Senato: votazioni, DDL, composizione dei gruppi parlamentari.

Tasso di ribellione

Misura quanto spesso un parlamentare vota in disaccordo con il proprio gruppo. Alto = indipendenza o dissidenza. Basso = allineamento con il partito.

Partecipazione al voto

Percentuale di votazioni a cui il parlamentare ha partecipato, escludendo le assenze per missione ufficiale.

Framing

Cos'è il framing

Il framing è la cornice interpretativa scelta dalla testata. Due articoli sullo stesso fatto possono usare framing diversi: “opportunità economica” vs “rischio per i lavoratori”.

Nell'Analisi puoi vedere i framing più usati e confrontare come testate diverse inquadrano le stesse notizie.

Rilevanza

Come funziona il filtro

Non tutti gli articoli riguardano la politica. L'AI classifica ogni articolo come rilevante (politica, governo, economia pubblica) o non rilevante (sport, gossip, cronaca nera, intrattenimento).

Solo gli articoli rilevanti appaiono nei grafici, nelle storie e nelle statistiche.

Analisi avanzate

Panoramica

La sezione Analisi avanzate offre strumenti approfonditi per esplorare le dinamiche del discorso politico italiano, andando oltre le metriche base.

Indice di Potere

Classifica composita

Classifica le entità politiche con un indice composito che combina tre fattori: menzioni (volume), copertura fonti (quante testate ne parlano) e momentum sentiment (direzione del sentiment). Include il rilevamento di rivalità tra entità che competono per la stessa attenzione.

DNA delle Fonti

Impronta editoriale

Ogni testata ha un “DNA” unico: la distribuzione dei toni (informativo, critico, celebrativo...) e degli argomenti che copre. Rivela la sovrapposizione editoriale: fonti con copertura >80% identica nei temi trattati.

Correlazione Sentiment

Alleati e avversari

Calcola la correlazione di Pearson tra il sentiment giornaliero di coppie di entità. Correlazione positiva = quando uno sale nell'opinione pubblica, anche l'altro sale (“alleati”). Correlazione negativa = movimenti opposti (“avversari”).

Mappa Temi (Topic Velocity)

Dinamica dei temi

Visualizzazione a bolle dove ogni tema è posizionato per volume (asse X) e accelerazione (asse Y). Dimensione = importanza, colore = sentiment. Rivela quali temi stanno emergendo, quali sono stabili e quali in declino.

Note tecniche

Aggregatore Politico usa GPT-4o-mini per l'analisi del testo e nomic-embed-text per il raggruppamento semantico. I dati vengono aggiornati in tempo reale e conservati per analisi storiche.

Questo strumento fornisce trasparenza sulla copertura mediatica della politica italiana, senza esprimere giudizi di valore sulle notizie o sugli attori politici.