Il progetto

Il progetto “Caratteri e strutture fonetiche, fonologiche e prosodiche della lingua sarda” è una ricerca di base propedeutica alla creazione di un sistema di sintesi vocale, ossia di un prototipo informatico capace di riprodurre il parlato partendo da testi scritti (text-to-speech systems, TTS).

La tecnologia della sintesi vocale si applica in vari campi: telecomunicazioni (menu e portali vocali, lettura di fax e e-mail, caselle vocali, messaggistica unificata, comando vocale di telefonini e console giochi); trasporti (sistemi di comando vocali interattivi negli autoveicoli, sistemi per annunci automatici nei mezzi pubblici, negli aeroporti e nelle stazioni); uffici (dettatura automatica, sistemi di lettura vocale dei documenti); assistenza tecnologica a persone affette da problemi alla vista, dislessia e a persone con gravi problemi vocali o di fonazione.

La sintesi vocale si realizza tramite la concatenazione di registrazioni di parti vocali (fonemi singoli o in sequenza, parole o frasi) memorizzate in un database che riunisce informazioni su fonetica, fonologia ed elementi di prosodia. Pertanto, il progetto è interdisciplinare e si caratterizza per l’interazione tra linguistica e informatica: la prima lavora alla costituzione di un corpus di dati fonologici, mentre la seconda cura la parte di registrazione ed elaborazione dei suoni, la catalogazione sistematica attraverso un database dedicato e l’applicazione delle informazioni al sistema di trasformazione dal testo scritto alla voce artificiale.

Lo scopo del progetto era quello di creare un sistema costituito dai foni e dai fonemi del sardo e dalle regole che governano la concatenazione di tali foni e fonemi durante una simulazione del linguaggio parlato. Tale scopo si è tradotto in due obiettivi generali: da una parte lo sviluppo delle conoscenze di base sulla fonetica della lingua sarda; dall’altra la messa a punto di una metodologia scientifica per la realizzazione di un archivio linguistico. Gli obiettivi specifici erano tre: acquisizione delle informazioni e dei dati linguistici necessari; realizzazione di un database dei fonemi della lingua sarda; definizione delle regole che governano la concatenazione dei suoni.

Il progetto si è strutturato nelle seguenti attività: costituzione di un corpus linguistico; indagine fonetica e fonologica di un sistema linguistico; individuazione e campionamento dei singoli fenomeni linguistici; disegno e messa a punto dell’impianto tecnologico; popolamento dell’archivio e realizzazione delle procedure di concatenazione; prototipo dimostrativo; diffusione dei risultati.

La ricerca si è svolta in diciotto mesi (dal mese di ottobre 2013 al mese di aprile 2015), presso il Dipartimento di Filologia, Letteratura e Linguistica dell’Università degli Studi di Cagliari, mentre la diffusione dei risultati ha comportato altri sei mesi di lavoro. L’attività si è articolata in otto trimestri e quattro moduli principali (work-package) che a loro volta contemplavano una serie di attività di ricerca e di supporto: WP1 – Ricerca preliminare, dal I al III trimestre; WP2 – Raccolta ed elaborazione, dal II al VII trimestre; WP3 – Diffusione risultati, VII e VIII trimestri; WP4 – Attività di supporto trasversale a tutto il progetto, dal I all’VIII trimestre.

Il risultato è un corpus di dati linguistici e un corpus di dati di tipo informatico che costituiscono un’innovazione nei rispettivi ambiti (per il sardo come per le altre lingue di minoranza italiane non esiste un archivio linguistico fonetico simile a quello ottenuto con la nostra ricerca) e che possono essere sfruttati in un’ampia varietà di modi e di campi.

Innanzitutto, si è sviluppata una base metodologica per una ricerca futura per le altre varietà presenti in Sardegna (gallurese e sassarese), per le lingue alloglotte (tabarchino, algherese) e per le altre minoranze linguistiche presenti in Italia.

Per gli studi di Filologia e Linguistica i risultati della ricerca costituiscono nuovi dati sulla fonologia del sardo. Nella didattica, costituiscono uno strumento di riferimento per insegnanti e allievi che hanno bisogno di un esempio attendibile di fonetica del sardo. Si prestano ad applicazioni a fruizione della lingua sarda da parte di scuole, biblioteche, università, strutture ricettive e di informazione in genere oltre che a soggetti con difficoltà visive. Aprono inoltre prospettive nel campo della divulgazione e tutela della lingua sarda con conseguente aumento dei prodotti ad essa connessi (libri, prodotti multimediali, etc.). I risultati della ricerca potranno inoltre contribuire alla soluzione dei problemi connessi con la normalizzazione della lingua, in particolare nella sua forma scritta.

I benefici non sono limitati alla sola lingua locale, ma vanno a vantaggio anche delle applicazioni già sviluppate per la lingua italiana: permettono infatti di affinare i sistemi esistenti, adattandoli all’utilizzo secondo le specificità regionali (come per esempio l’italiano regionale di Sardegna).

La nostra ricerca costituisce inoltre una base scientifica e tecnologica di partenza per l’avvio di una ricerca successiva sul riconoscimento vocale.