Ny talesyntese skal hjelpe
mennesker med lese- og skrivevansker
Nær 20 prosent av Norges befolkning sliter med lesing
og skriving. Forskning tyder på at mange av dem
kan ha stort utbytte av talesyntese som hjelp og støtte i lese- og skriveprosessen.
Men dagens tekst-til-talesyntese (TTS) har ikke har vært godt nok egnet for
grupper med spesielle behov. IT Funk har derfor støttet et prosjekt som har utviklet
en ny versjon av Talsmann talesyntese tilpasset mennesker med lese- og
skrivevansker.
"Forbedret talesyntese basert på Telenors Talsmann ®" er tittelen på forprosjektet. Det er gjennomført som et samarbeid mellom Telenor FoU, NTNU (Institutt for Teleteknikk og Lingvistisk Institutt) og firmaet LingIT AS.
Tilpasset stave- og leseverktøy
Den nye talesyntesen er utstyrt med to lesefunksjoner, spesielt innrettet mot bruk i stave- og leseverktøy. Dette gjør det mulig å få lest opp setninger ord for ord, og enkeltord stavelse for stavelse. For at ord som brukeren aldri har sett før, ikke skal forveksles, er det lagt vekt på å framheve relevante forskjeller mellom ord som skrives ulikt, men uttales på nesten samme måte. Et eksempel på dette er ordpar med tonemkontraster (bade – badet).
Som ledd i prosjektet er talesyntesen integrert i to verktøyprodukter for dyslektikere og andre med lese- og skrivevansker. Det ene er utviklet gjennom prosjektet LingDys og det andre utvikles gjennom prosjektet MULTIFUNK. Begge er støttet med midler fra IT Funk.
Det norskproduserte stavekontrollprogrammet LingDys ble lansert i markedet 20. juni 2002. Den nye talesyntesen inngår i dette produktet, som distribueres gjennom firmaet LingIT AS. Firmaet planlegger en tjeneste på en nettserver som demonstrerer bruken av den nye versjonen av Talsmann. Ved hjelp av denne tjenesten kan brukeren sende inn en tekst og få en lydfil i retur, der Talsmann leser opp det man har skrevet. Lydfilen kan spilles av på brukerens lokale maskin. Det arbeides med en versjon der teksten blir lest opp direkte i nettleseren. Da kan for eksempel svaksynte sende tekster til Talsmann-tjeneren og få dem lest opp uten å gå via et avspillingsprogram. Denne funksjonen vil etter hvert bli tilgjengelig på LingITs hjemmesider. Det er også planer om å lage en nettversjon av LingDys med talesyntese.
Internasjonal forskning viser at opplesning av tekst ved hjelp av talesyntese gir en vesentlig støtte i leseopplæringen for barn og unge som sliter med lese- og skrivevansker og/eller synsvansker. En pilotutprøving i MULTIFUNK-prosjektet våren 2002 bekreftet den positive effekten av talesyntesen. I MULTIFUNK arbeides det med å utvikle et elektronisk verktøyprogram som skal være et hjelpemiddel for elever som har vansker med lese- og skriveinnlæringen. Skoleåret 2002/2003 testes prototypen ut i feltprøver ved 6 skoler i Sarpsborg kommune. Her deltar det 52 lese- og skrivesvake elever, mens 120 normaltlesende elever danner en kontrollgruppe. Feltprøven har til hensikt å avklare den pedagogiske nytteverdien av programmet. Utprøvingen inngår i et doktorgradsarbeid som er del av MULTIFUNK-prosjektet.
Utvidet ordliste
I talesyntese bestemmes uttalen av ord ved først å konsultere innebygde uttaleordlister. Hvis ordet ikke finnes der, bestemmes uttalen ved hjelp av et sett uttaleregler. Dette resulterer ofte i unaturlig uttale. Prosjektet har derfor tilrettelagt uttaleleksikonet NorKompLeks/Bokmål for bruk i Talsmann. Det nye uttaleleksikonet inneholder drøyt 370 000 ord og ordformer, mens det gamle inneholdt 59 000.
Bedre lydkvalitet og intonasjon
Prosjektet har også utredet tekniske muligheter for å bedre stemmekvaliteten og setningsmelodien (prosodien) i Talsmann talesyntese. Som en oppfølging av utredningen har NTNU og Telenor sammen sendt inn en søknad til KUNSTI-programmet i Forskningsrådet. Her foreslås det et prosjekt som skal bidra med forskningsresultater og kunnskap som underlag for å utvikle norsk tekst-til-talesyntese basert på ”state-of-the-art” datadrevet bølgeformsyntese. Det er demonstrert at slike systemer kan gi tale som er svært lik naturlig tale.
I Talsmann-prosjektet er det dessuten testet ut en demoversjon av en intonasjonsmodell, basert på en ny metode utviklet av Telenor FoU. Uttestingen viser at den gir en klart bedre og mer variert intonasjon enn den tradisjonelle regelbaserte metoden som er standard i Talsmann®. Her må imidlertid teknikken utvikles videre før den kan brukes i et kommersielt produkt.
Prosjektet "Forbedret talesyntese basert på Telenors Talsmann ®" er nærmere beskrevet på IT Funks prosjektliste. Der kan du også lese mer om LingDys-prosjektet og MULTIFUNK-prosjektet.