Dalle voci al testo, il futuro restituisce il pensiero degli intellettuali di ieri

Sentire e rileggere la voce di Vittorio Cini, di intellettuali come Andrea Zanzotto, Gian Francesco Malipiero, Eugenio Montale o di figure della politica italiana del Novecento quali Aldo Moro, Giovanni Spadolini, Bruno Visentini: sarà ora possibile grazie a Fonti 4. 0, un progetto innovativo per la digitalizzazione, l’analisi automatica e l’accessibilità delle fonti orali attraverso le nuove tecnologie.
Il progetto, finanziato dal Fondo Sociale Europeo, è a cura del Centro di Sonologia Computazionale – Csc dell’Università di Padova in partnership con il centro Archive della Fondazione Giorgio Cini, il Digital Humanities Laboratory dell’École Polytechnique Fédérale de Lausanne (Epfl) e Mind@ware srl.
I materiali utilizzati provengono dagli straordinari archivi sonori della Fondazione Cini, che conservano mille nastri magnetici su eventi, convegni, conferenze e inaugurazioni tenutesi a San Giorgio Maggiore.
Fonti 4.0 è l’acronimo di Fruizione innovativa di fonti Orali digitalizzate mediante le Nuove Tecnologie dell’Industria creativa 4.0 e prevede il perfezionamento di nuovi strumenti per l’analisi, la fruizione e la valorizzazione dei documenti sonori storici che testimoniano la storia, la cultura e la lingua italiana dai primi decenni del Novecento a oggi.
«La Fondazione Cini conserva nei suoi archivi gli audio originali delle voci dei più importanti intellettuali italiani e stranieri» dice Renata Codello, segretario generale della Fondazione Giorgio Cini «giunti nell’isola di San Giorgio invitati a convegni, seminari o conferenze, che venivano puntualmente registrati. Con questo progetto innovativo potremmo restituire alla comunità dei ricercatori le fondamentali riflessioni di personalità quali Vittorio Cini, Vittore Branca, Eugenio Montale, Aldo Moro, Roberto Rossellini e molti altri».
«Fonti 4.0 mira a velocizzare il processo di digitalizzazione delle fonti orali» – spiega Sergio Canazza, direttore del Csc e responsabile del progetto «rendendo accessibile il contenuto dei documenti. Il progetto prevede l’utilizzo di software speech-to-text per trascrivere automaticamente il contenuto di questi documenti, mentre algoritmi di named entity recognition permetteranno di estrarre automaticamente dai testi trascritti informazioni su persone, luoghi, date, e cioè contenuti che saranno poi ricercabili con una interfaccia ad hoc».
Il progetto, che è iniziato nel 2020 e si concluderà il prossimo dicembre, si propone di raggiungere quattro obiettivi: la correzione automatica degli errori di digitalizzazione, l’analisi semantica della trascrizione dei contenuti, lo sviluppo di strumenti innovativi per la fruizione e la valorizzazione dei documenti sonori digitalizzati, la divulgazione dei risultati del progetto di ricerca, con lo scopo di trasferire tecnologie e competenze nel territorio.
A settembre si terranno online otto Living Labs, laboratori teorici e pratici sui temi sviluppati dal progetto. Saranno gratuiti, aperti a persone interessate al progetto – previa registrazione – e disponibili anche dopo la loro conclusione. —
© RIPRODUZIONE RISERVATA
Riproduzione riservata © La Nuova Venezia