Statistiche web
Predire il passato con Ithaca – La ricerca di Thea Sommerschield sulla copertina di Nature

L’archeologia è abitualmente associata alla ricostruzione di ciò che è stato; gli algoritmi alla previsione di ciò che sarà. Combinando i due aspetti, i risultati possono essere sorprendenti: tanto che la copertina del numero di Nature di questa settimana alla ricerca che la nostra Alunna Thea Sommerschield sta conducendo con un team composto da membri del Dipartimento di Studi Umanistici dell’Università “Ca’ Foscari” di Venezia, la Faculty of Classics dell’Università di Oxford, il Dipartimento di Informatica dell’Università AUEB di Atene e DeepMind, centro studi londinese sull’intelligenza artificiale che rientra nella galassia Alphabet di Google e che ha prodotto Ithaca, uno strumento in grado di migliorare oltremodo la conoscenza delle iscrizioni antiche.

“Le iscrizioni garantiscono una notevole conoscenza del mondo antico”, scrive Nature introducendo l’articolo. “Nel corso dei secoli, tuttavia, molte iscrizioni sono state danneggiate ed esistono in forme frammentarie o semi-leggibili, rendendo estremamente difficoltosa l’opera di lettura e interpretazione. Questa settimana Yannis Assael, Thea Sommerschield e il loro team presentano Ithaca, una rete neurale profonda progettata per aiutare gli storici a restaurare e a comprendere le antiche iscrizioni greche. Lavorando per proprio conto, Ithaca è in grado di restaurare i testi danneggiati con un’accuratezza del 62%, laddove uno storico si assesta sul 25%; se però le forze vengono utilizzate in maniera combinata, l’accuratezza sale al 72%. Ithaca può inoltre determinare con una precisione del 71% la collocazione geografica originaria delle iscrizioni, e può datarle entro un margine di errore di trent’anni rispetto al lasso di tempo proposto dagli storici”.

Un esempio, spiegano i responsabili della ricerca, degli importanti decreti ateniesi dalla datazione controversa – che erano stati ritenuti antecedenti al 445 a.C. ma sono stati ridatati attorno al 420 a.C. da studi più recenti – vengono “previsti” da Ithaca con una data media che si assesta sul 421 a.C. Significa che il livello di sofisticazione di Ithaca è tale da consentirle di essere allineata ai più recenti progressi nella disciplina: l’introduzione di un modello di deep learning così accurato può dunque contribuire in maniera decisiva a migliorare, se non a trasformare, gli studi sul mondo antico.

“Nonostante possa sembrare una differenza di solo qualche anno”, spiega Thea Sommerschield, Marie Curie Fellow a Ca’ Foscari e ricercatrice presso il CHS dell’Università di Harvard, “ridatare questi testi ha implicazioni importanti per la nostra comprensione della storia politica di Atene nell’età classica. Speriamo che modelli come Ithaca possano inaugurare una nuova stagione di ricerca collaborativa fra intelligenza artificiale e discipline umanistiche, rivoluzionando il modo in cui studiamo e scriviamo la storia di alcuni dei periodi più significativi dell’umanità”.

Per facilitare la comprensione del funzionamento di Ithaca, Nature ha prodotto un breve video divulgativo in cui la dott. Sommerschield spiega: “Le iscrizioni sono molto interessanti in quanto sono state scritte direttamente dagli antichi, ma studiarle è davvero complesso. Ithaca è la prima rete neurale profonda che restaura i testi antichi collocandoli nel tempo e nello spazio. Durante il mio dottorato in storia antica a Oxford, dove Yannis Assael stava facendo il proprio sul machine learning, abbiamo visto il potenziale del fondere le due discipline”.

Nel corso del video, viene mostrato il funzionamento di Ithaca su un’iscrizione proveniente da Paros, databile attorno al 264-263 a.C., e attualmente custodita all’Ashmolean Museum di Oxford, con parti mancanti. Il testo dell’iscrizione va ricopiato su Ithaca, indicando con punti interrogativi le parole incerte; Ithaca provvede allora a ricostruirle utilizzando la propria conoscenza di innumerevoli iscrizioni assimilabili. “Gli stessi testi contengono infatti prove cruciali o indizi per collocarlo e datarlo”, continua la dott. Sommerschield. “Penso ad esempio alla grammatica, o a un determinato tipo di linguaggio, che può essere connotato dal luogo e dal periodo. Oppure il testo può citare un personaggio famoso”. Tutti questi aspetti vengono combinati con la conoscenza di oltre ottantamila iscrizioni greche antiche, che consentono a Ithaca di individuarne i pattern sottostanti: “Una mente umana non può gestire tutta la messe di informazioni esistente”.

Ithaca fornisce le proprie risposte in maniera dinamica, presentando le maggiori e minori probabilità delle ipotesi di completamento, collocazione e datazione. “Anziché dare una risposta statica e imperscrutabile”, conclude la dott. Sommerschield, “vogliamo fornire agli storici molteplici ipotesi da valutare”. In questa maniera è la competenza umana – l’occhio clinico dello storico antico, potremmo dire – ad avere l’ultima parola: “Sappiamo che, come in tutte le innovazioni, può volerci un po’ di tempo perché Ithaca venga adottata nella routine lavorativa degli storici. I pareri che abbiamo ricevuto finora, in fase di progettazione, sono tuttavia già molto positivi”.

Il team di DeepMind ha inoltre operato una scelta radicale: non solo creare una versione interattiva e libera di Ithaca, così che possa essere utilizzato in forma autonoma da qualsiasi ricercatore nel settore; ma anche rendere open source il modello e il codice di programmazione.

La notizia diventa, se possibile, ancora più straordinaria tenendo conto che l’architettura dell’intelligenza artificiale di Ithaca è tale da poter essere applicata su altri sistemi di scrittura: l’accadico, il demotico, l’ebraico, le lingue maya, e così via. DeepMind sta pertanto lavorando a nuove versioni di Ithaca, addestrate su altre lingue, così da garantirci una conoscenza sempre più vasta e precisa del mondo antico.

L’articolo Restoring and attributing ancient texts using deep neural networks è disponibile su Nature. La ricerca del team condotto da Thea Sommerschield e Yannis Assael ha avuto grande risonanza sui media. Oltre al Corriere della Sera, ne hanno scritto il Guardian, il Times e New Scientist.

Thea Sommerschield, ghisleriana dal 2012, è Marie Curie Fellow in presso l’Università “Ca’ Foscari” di Venezia, dove è leader del progetto “PythiaPlus – Machine Learning for the Study of Ancient Epigraphic Cultures”. È inoltre fellow del Center for Hellenic Studies dell’Università di Harvard ed è co-leader del progetto “Ithaca – Restoring and attributing ancient Greek inscriptions with Machine Learning”. Dopo la laurea a Pavia, ha conseguito MSt e DPhil in Storia antica presso l’Università di Oxford (Wolfson College), dove è associate researcher presso la Faculty of Classics. È beneficiaria di una MSCA Standard European Individual Fellowship.