Skip to content Skip to footer

L’AI entra nei libri digitali accessibili: un prototipo per descrivere le immagini a persone cieche e ipovedenti

Contenuto sviluppato con intelligenza artificiale, ideato e revisionato da redattori umani.
···

Le immagini sono una delle parti più difficili da trasferire in modo pienamente accessibile nel libro digitale. Un testo può essere letto da uno screen reader, ingrandito, trasformato in audio o adattato su dispositivi diversi; una fotografia, un grafico o una tavola illustrata richiedono invece una descrizione che spieghi che cosa contiene e perché è rilevante per la lettura. Il Mulino e Fastweb + Vodafone hanno presentato un’iniziativa che sperimenta l’uso dell’intelligenza artificiale per rendere più accessibili le immagini nei libri destinati anche a persone cieche o ipovedenti, con un prototipo mostrato al Salone del Libro.

Il punto interessante non è soltanto tecnologico. L’editoria accessibile è spesso raccontata attraverso formati specifici, audiolibri, testi digitali compatibili con lettori vocali o versioni adattate. Le immagini, però, restano un nodo più complesso: non basta convertirle in suono, perché occorre decidere quali dettagli descrivere, in quale ordine, con quale livello di sintesi e con quale rapporto rispetto al testo principale. Una figura scientifica, una mappa o un’illustrazione narrativa hanno funzioni diverse. L’intelligenza artificiale può diventare utile proprio come strumento di prima interpretazione e organizzazione del contenuto visivo, da integrare poi in un processo editoriale controllato.

Da quanto riportato dalla fonte, siamo davanti a un prototipo, non a un prodotto editoriale già descritto in tutti i suoi dettagli operativi. È una distinzione importante: un prototipo serve a mostrare una possibilità, a verificare un flusso di lavoro e a capire se la soluzione possa essere estesa a cataloghi, collane o formati diversi. Tuttavia, il segnale è rilevante perché arriva da un incontro tra un soggetto editoriale e un operatore tecnologico. La trasformazione dell’accessibilità in editoria richiede strumenti, standard e un’integrazione credibile nei processi di produzione.

In termini pratici, un sistema di questo tipo può lavorare su più livelli. Il primo è il riconoscimento dell’immagine: identificare oggetti, persone ed elementi grafici presenti nella figura. Il secondo è la generazione di una descrizione comprensibile, adatta alla pagina e al pubblico di riferimento. Il terzo è la resa accessibile, che può avvenire come testo alternativo, come contenuto leggibile da screen reader o come sintesi vocale. In un libro digitale ben strutturato, questi elementi dovrebbero trovare posto in modo ordinato, collegati alla sequenza del testo, ai titoli, alle didascalie e alla logica del capitolo.

La differenza tra una descrizione generica e una descrizione editoriale è decisiva. Dire che in una pagina c’è una fotografia di una città può essere utile, ma spesso non basta. Se l’immagine serve a mostrare la crescita urbana, il contesto storico o un dettaglio citato dall’autore, la descrizione deve orientare il lettore verso quella funzione. Nei libri scolastici, universitari e di saggistica questo aspetto è ancora più evidente: grafici, tabelle e mappe partecipano direttamente alla costruzione del ragionamento. L’AI può accelerare il lavoro preliminare, ma la qualità finale dipende dalla revisione, dal contesto e dalle scelte redazionali.

Per questo l’iniziativa è interessante anche oltre il caso specifico. L’intelligenza artificiale viene spesso associata alla generazione di testi o immagini nuove; qui, invece, l’uso è più concreto e meno appariscente: rendere più leggibile ciò che già esiste. È un’applicazione tipica della maturazione degli strumenti generativi. L’obiettivo è ridurre una barriera operativa che ha reso per anni più costosa e lenta la produzione di contenuti accessibili, mantenendo l’intervento umano al centro del controllo editoriale. Se la tecnologia permette di produrre una bozza di descrizione, classificare le immagini e suggerire versioni vocali, l’editore può concentrare il controllo umano sulla precisione, sul tono e sulla coerenza.

Il vantaggio potenziale riguarda anche i lettori ipovedenti, non solo le persone cieche. L’accessibilità non è un’unica soluzione uguale per tutti: può significare ascoltare una descrizione, ingrandire una figura o ricevere un riassunto della sua funzione. In questa prospettiva, l’AI può contribuire a creare esperienze di lettura più flessibili, nelle quali il libro viene progettato fin dall’inizio per essere consultato in modi differenti, andando oltre la semplice trasposizione in un altro formato.

Il contesto editoriale è favorevole a sperimentazioni di questo tipo. I cataloghi sono sempre più digitalizzati, gli ebook devono dialogare con dispositivi diversi e le piattaforme di lettura sono chiamate a offrire funzioni più ricche. Allo stesso tempo, cresce l’attenzione verso l’accessibilità dei prodotti digitali, anche per effetto delle buone pratiche e del quadro normativo europeo. Per gli editori, questo significa portare l’accessibilità dentro il ciclo di produzione, dalla progettazione del libro alla gestione dei file, fino alla distribuzione.

Per le case editrici più piccole, il tema è particolarmente delicato. La descrizione manuale di immagini, tavole e apparati grafici può richiedere tempo e competenze specifiche. Uno strumento assistito dall’intelligenza artificiale potrebbe abbassare la soglia d’ingresso, soprattutto se inserito in servizi editoriali semplici da usare. Potrebbe trasformare un’attività onerosa in una fase ordinaria della lavorazione, pur lasciando il controllo editoriale al lavoro umano. In prospettiva, autori, redattori e grafici potrebbero lavorare con indicazioni accessibili già durante la preparazione del libro, anziché intervenire dopo la pubblicazione.

Il coinvolgimento di un operatore come Fastweb + Vodafone suggerisce inoltre che l’accessibilità digitale non dipende solo dal file libro. Servono infrastrutture, interfacce vocali e integrazione con dispositivi mobili. La lettura accessibile può avvenire su uno smartphone, un tablet, un lettore dedicato o una piattaforma online. Più l’esperienza si sposta verso ambienti connessi, più diventa importante che la descrizione generata, il testo alternativo e l’eventuale voce sintetica siano disponibili in modo fluido, senza trasformare ogni libro in un caso tecnico isolato.

Naturalmente, il passaggio dal prototipo all’uso su larga scala richiede criteri di qualità. Una descrizione accessibile deve essere accurata, ma anche proporzionata: non deve appesantire la lettura con dettagli inutili, né ridurre un’immagine complessa a poche parole generiche. Deve rispettare il lessico del libro, il livello del lettore e l’intenzione dell’autore. Questo è il punto in cui l’intelligenza artificiale mostra il suo valore migliore quando viene trattata come assistente di lavoro: produce una base, organizza informazioni, propone formulazioni, ma lascia all’editore il compito di validare il risultato.

La presentazione al Salone del Libro ha anche un valore simbolico. Porta il tema dell’accessibilità in uno spazio in cui l’editoria discute di autori, cataloghi, pubblico e innovazione. L’AI, in questo caso, appare come uno strumento interno al lavoro sul libro, capace di incidere su una domanda molto concreta: chi può leggere davvero un contenuto e con quali strumenti. È una prospettiva coerente con un’idea di digitale orientata ad ampliare le possibilità di accesso, studio e partecipazione, andando oltre la semplice distribuzione online.

La notizia va quindi letta come un tassello di una trasformazione più ampia. L’intelligenza artificiale multimodale, capace di trattare testi, immagini e suoni, può entrare nel lavoro editoriale per accelerare la produzione e migliorare la qualità dell’esperienza di lettura. Se iniziative di questo tipo riusciranno a diventare strumenti stabili, l’accessibilità delle immagini potrà uscire dalla dimensione dell’eccezione e diventare una pratica ordinaria nella pubblicazione dei libri digitali. Per il lettore, questo significherebbe una cosa semplice e decisiva: poter accedere alle parole e a una parte del significato che finora restava spesso fuori portata.

Fonte principale: ANSA Tecnologia