ALL'INTERNO DEL

Menabò n. 194/2023

31 Maggio 2023

ietro Cruciata, Chiara Perfetto, Giuliano Resce,

La rappresentazione visiva del Reddito di Cittadinanza: un’analisi delle immagini associate agli articoli sui principali quotidiani italiani 

Pietro Cruciata, Chiara Perfetto e Giuliano Resce si chiedono in che misura i quotidiani pubblichino, per illustrare articoli su un medesimo argomento, immagini diverse. L’argomento prescelto dagli autori è il Reddito di Cittadinanza e l’analisi utilizza algoritmi di Image Captioning e Natural Language Processing su immagini pubblicate a corredo degli articoli su quell’argomento dai quotidiani con diffusione nazionale. I risultati mostrano come la posizione delle diverse testate si rifletta sulle rappresentazioni visive pubblicate.

È stato ampiamente dimostrato che i media hanno una posizione ideologica che influisce sulla presentazione dell’informazione, vale a dire sulla copertura dei temi e su come questi vengono presentati e discussi (Gentzkow, Shapiro, “What drives media slant? Evidence from US daily newspapers”, Econometrica, 2010). L’eterogeneità della posizione ideologica dei media ha un ruolo cruciale per la qualità della democrazia. Tuttavia, è stato anche provato che, poiché i profitti sono determinati dal numero di lettori, l’offerta e la discussione di alcune notizie potrebbero essere guidate dalle preferenze degli utenti piuttosto che dalle pure posizioni ideologiche (Ho, Liu “Herd journalism: Investment in novelty and popularity in markets for news”, Information Economics and Policy, 2015).

È comunque importante documentare la verità di rappresentazioni dello stesso fenomeno. In questo articolo cercheremo di farlo riferendoci a un medium di comunicazione molto rilevante, le immagini, e a un tema che è stato al centro di accessi dibattiti: il Reddito di Cittadinanza (RdC). Costruiamo un database originale contenente tutte le immagini associate agli articoli sul Reddito di cittadinanza pubblicati dai maggiori quotidiani nazionali italiani. C’è una ragione specifica per cui ci aspettiamo eterogeneità nelle immagini associate agli articoli: il dibattito sul RdC è stato caratterizzato da un acceso confronto politico, alimentato anche da diverse ideologie. Nella campagna elettorale italiana del 2022, il RdC è stato al centro dei programmi elettorali dei vari partiti. Il Movimento 5 Stelle (M5S) voleva rafforzare il sistema attuale, il Partito Democratico (PD) e il Terzo Polo proponevano riforme significative, mentre il programma unitario del centrodestra proponeva di sostituire il RdC con misure alternative di inclusione sociale – effettivamente introdotte ai primi di maggio con l’Assegno di Inclusione e il Supporto alla Formazione e al Lavoro.

I risultati mostrano che la posizione ideologica associata ai diversi media è riflessa anche nelle immagini che accompagnano gli articoli e, inoltre, che l’integrazione degli algoritmi di Image Captioning e di Natural Language Processes è molto promettente in queste analisi. Diversi giornali hanno immagini che contengono soggetti diversi e il sentimento associato al testo estratto dalle immagini mostra un’ampia eterogeneità.

dati. Per creare il corpus per l’analisi, abbiamo sviluppato uno scraper web. Il nostro obiettivo era di cercare e scaricare da Google tutte le immagini relative alla query “reddito di cittadinanza” sui principali quotidiani nazionali con diffusione cartacea superiore alle 20 000 copie. La raccolta di immagini da Google è stata limitata a un massimo di 300 immagini per giornale, poiché abbiamo osservato che al di là di questa soglia, le immagini iniziavano a essere non pertinenti all’argomento RdC (principalmente perché oltre la soglia si supera il numero di articoli pubblicati sull’argomento). Da Google, abbiamo recuperato sia le immagini sia il sito web che le ha caricate, e ci siamo assicurati che un’immagine sia associata a un link univoco all’articolo corrispondente. Successivamente, abbiamo filtrato tutte le immagini che non provenivano dai siti web dei giornali selezionati. Alla fine di questo lavoro, il nostro campione include 474 immagini provenienti da 10 diversi giornali e distribuite come indicato nella Tabella 1:

Tabella 1: Distribuzione delle immagini per giornale

MetodologiaImage Captioning è una branca dell’Intelligenza Artificiale che mira a descrivere un’immagine assegnando ad essa una didascalia. Nel nostro caso studio usiamo un algoritmo sviluppato in questo campo dell’IA estendendo le didascalie generate per avere una descrizione più completa delle immagini studiate. Gli algoritmi di Image Captioning sono creati tramite la combinazione di algoritmi all’avanguardia in due principali campi dell’IA: Computer Vision e Natural Language Processing (NLP). L’algoritmo che proponiamo è il Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation (BLIP) (Li, Li, Xiong, Hoi, “Blip: Bootstrapping language-image pre-training for unified vision-language understanding and generation”, ArXiv Preprint ArXiv:2201.12086. 2022). Sfruttando i vari parametri del modello abbiamo generato 20 didascalie per ogni immagine, 1utilizzando la sequenza di token più probabile secondo il modello e 19 utilizzando un approccio che genera un sottoinsieme di parole tali che la somma delle loro probabilità è maggiore di una probabilità prestabilita dall’utente. 

Per l’analisi delle didascalie delle immagini abbiamo impiegato tecniche di text mining non supervisionato e text analytics per l’estrazione di informazioni, nonché l’analisi del sentiment per rilevare l’orientamento semantico del contenuto. Le didascalie sono state aggregate in un grande testo e rappresentate con una matrice chiamata Term Document Matrix (TDM). Questa rappresentazione consente di analizzare i dati con l’algebra vettoriale e matriciale, passando efficacemente dal testo ai numeri. Le righe della TDM corrispondono ai termini delle didascalie, le colonne ai nomi dei giornali e le celle mostrano la frequenza dei termini in ogni giornale. 

Per migliorare l’analisi, sono stati rimossi i termini comuni e assegnati pesi ai termini attraverso la funzione Term Frequency–Inverse Document Frequency (TF-IDF). TF-IDF pesa ogni parola sulla base di due criteri: 1. la frequenza che la parola ha nel testo di un quotidiano e 2. l’esclusività con cui una parola è associata a un quotidiano. Intuitivamente è simile al modo in cui viene stimata la complessità dei sistemi economici con il Method of Reflections (Hidalgo, Hausmann “The building blocks of economic complexity”, Proceedings of the national academy of sciences, 2009). Successivamente, abbiamo utilizzato il pacchetto “syuzhet” (Jockers. syuzhet: Extracts Sentiment and Sentiment-Derived Plot Arcs from Text. R package version 1.0.6. 2017) in R, che analizza il sentiment del testo e calcola i punteggi di polarità. Il risultato è un dataframe in cui ogni riga rappresenta una didascalia e le colonne indicano le varie emozioni, nonché la valenza del sentimento positivo o negativo. Il punteggio ottenuto in ogni cella è poi rapportato al numero totale di parole in ogni didascalia. 

Principali risultati. La Figura 1 mostra il TF-IDF per testata: i termini specifici che caratterizzano le immagini in un giornale. Un quotidiano di destra come Libero contiene immagini che mostrano “portafoglio”, “euro” e “banconote”; La Repubblica e Il Mattino sono i più simili ed entrambi si concentrano su “carta” e “credito”. La Stampa e Il corriere della sera riportano frequentemente immagini in cui compare la polizia, simile anche il Messaggero. Invece, Il fatto quotidiano rappresenta le “persone”. Le immagini de Il Sole 24 ore sembrano essere poco affini al tema della nostra analisi e anche i giornali Tuttosport e Il corriere dello sport, che sono giornali ad indirizzo sportivo, sono caratterizzati da tematiche sportive. Questi ultimi tre quotidiani non sono inclusi nella successiva sentiment analysis in quanto estranei alla questione politica del RDC come dimostrato da TF-IDF.

I risultati ottenuti dall’analisi del sentiment sono presentati nelle Figure 2 e 3. La Figura 2 mostra la percentuale di parole associate a otto diverse emozioni (rabbia, anticipazione, disgusto, paura, gioia, tristezza, sorpresa, fiducia) più sentimenti generali, negativi e positivi. Le emozioni sono distribuite sull’asse x dalla più negativa (rabbia) alla più positiva (fiducia). È evidente dalla Figura 2 che l’emozione fiducia ha la barra più lunga e significa che le parole associate a questa emozione costituiscono circa il 20% di tutte le parole significative in questo testo. D’altra parte, l’emozione del disgusto mostra che le parole associate a questa emozione negativa rappresentano circa il 2% di tutte le parole significative in questo testo. In generale, il sentimento è più positivo che negativo. Il sentiment specifico relativo a ciascuna testata è mostrato nella Figura 3.

La Figura 4 mostra come il sentiment di ciascun giornale differisca dal sentiment medio. Il sentiment relativo a il Fatto quotidiano si discosta maggiormente e positivamente dalla media del sentiment generale. I sentimenti più bassi sono associati alle immagini de Il Mattino e Libero.

In sintesi, i nostri risultati confermano che la posizione ideologica dei vari media si ripercuote anche sulle immagini associate ai rispettivi articoli. In particolare, abbiamo osservato che i giornali di destra, quando parlano di RdC, mostrano immagini a cui si associa un sentimento più negativo rispetto a quelli di sinistra. Le immagini sono un potente strumento di comunicazione che può trasmettere messaggi in modo immediato ed emotivo. I media possono scegliere quali immagini mostrare e quali tralasciare e le immagini possono essere utilizzate per avvicinare un argomento in modo specifico, enfatizzando certi aspetti e minimizzandone altri. Questo studio mostra che i quotidiani con diffusione nazionale ricorrono effettivamente a immagini diverse quando trattano lo stesso argomento. In queste differenze possono giocare un ruolo importante sia le posizioni ideologiche, sia il perseguimento di profitti (determinati dal numero di lettori); non c’è un conflitto tra i due criteri, poiché ogni quotidiano è incentivato a adottare l’ideologia che è coerente con il proprio pubblico (e quello al quale si mira). È pertanto auspicabile che si investa in politiche che aiutino le persone a sviluppare consapevolezza critica e capacità di valutare in modo indipendente le informazioni visive per comprendere appieno il contesto in cui si inseriscono e le loro implicazioni.

Schede e storico autori