Datorer med språkkunskaper

Detta var titeln på en föreläsning som hölls av Barbara Gawronska den 7 november 2002 vid Högskolan i Skövde. Jag citerar ur affischen: ”Robotar som samtalar med sin ägare och med varandra, som ger användaren goda råd och som översätter olika språk är ett vanligt inslag i många science fiction-filmer. Men varför finns dessa robotar inte i verkligheten? Varför är det så extremt svårt att få en dator att klara av det som en fyraåring inte har några större problem med – att förstå och använda det mänskliga språket? Datalingvister och språkteknologer arbetar med att ge datorer kunskap om naturliga språk. Det finns idag dataprogram som bland annat styrs med rösten, förvandlar tal till skriven text, och som utför grammatikkontroll. Förblir den intelligenta samtalspartnern en science fiction-figur, eller…?

Barbara Gawronska är universitetslektor i datalingvistik och programansvarig för det datalingvistiska programmet vid Högskolan.” (Citatet är alltså från november 2002. Nedan återger jag mitt eget referat av föreläsningen; detta är helt baserat på mina då förda anteckningar. Min anm.)

Den fantastiska språkmaskinen

Barbara Gawronska inledde med att visa en sekvens ur den välkända sf-filmen Star Wars, där handlingen tilldrar sig i en annan galax och där det uppträder en maskin med utmärkta kunskaper. Andra aktörer – djur! - talar ett obegripligt språk, men den språkkunniga roboten har förstås inga problem med att använda ett avancerat system av språkliga tecken – varför han förmodligen betraktas som en sorts gud av de djurliknande varelserna.

Att det rörde sig om en fullfjädrad lingvistisk maskin (i människoliknande form) förstod vi när Barbara kom in på dess prestanda - en otrolig mångspråkighet: sex miljoner språk, alla med avancerat lexikon och grammatikregler, ja allt! Plus taligenkänning: den talar och förstår talspråk. Den fantastiska språkroboten kännetecknas alltså av talsyntes, taligenkänning och språkigenkänning; den vet mellan vilka språk den skall arbeta med översättning/ tolkning, vilket innebär att en rad språkliga modeller är förbundna med varandra.

Ett litet exempel (på engelska) visade hur lexikaliska ord kan vara kopplade till varandra: body (s.k. huvudord) förbinds med : head, trunk (bål), leg, arm. Grammatiken utgörs ej av vanliga regler utan av dataprogram. En programkod anger t.ex. hur ordföljden skall vara. Olika mönster är inprogrammerade för igenkänning. I talsyntesen ges regler för enskilda språkljud och ljudvågor för varje ljud. Exempel: Barbara visade en grafisk bild som analyserade tonande resp. tonlösa språkljud.

Det är en avancerad process att känna igen språk; maskinen kopplar sig själv till rätt system, allt sker automatiskt (jämför knappsystem på våra datorer). Kommunikation pågår hela tiden i maskinen mellan skilda språk (engelska är naturligtvis basspråket här). Vad beträffar vokabulären: lexikon för engelska <-> lexikon för språk X. Grammatiken för engelskan <-> grammatiken för språk X. (X = valfritt språk – något av sex miljoner!)

Igenkänningen gäller även icke-standardiserade språkformer, t.ex. dialekter. Vidare är maskinen interaktiv: den kan föra en dialog med andra maskiner. Den kan ta initiativ till dialog, dvs. den behöver inte tilltalas först. Dessutom förmår maskinen samordna kroppsspråk, ty inprogrammerade är även emotioner som uttrycks genom ett varierande röstläge. Likaså anges vissa begränsningar, t.ex. ”Ej programmerad tillvaro: Gud(!)” Vidare urskiljer den kulturella skillnader, bl.a. olika beteenden. Maskinen äger självfallet ett minne: Den kommer ihåg alla erfarenheter den gjort. Märk slutligen att den måste vara programmerad; med andra ord beror alla dess färdigheter på att en levande varelse skrivit koden. (Barbara räknade upp ytterligare ett par prestandafakta, som jag tyvärr ej hann uppfatta klart. Min anm.)

Mänsklig förmåga

Genomsnittsmänniskan har jämförelsevis små möjligheter att använda språket mycket varierat. Hon kan dock vara flerspråkig, en förmåga som rymmer många kopplingar. Alla människor begagnar sig naturligtvis av minst ett språk. Att klara av två till fyra språk är relativt vanligt, men sällan behärskar en person mer än fem. Att kunna tio språk är fantastiskt bra; Barbara nämnde ett geni som kunde(?) tjugoåtta! Hon fortsatte jämföra mänsklig språkförmåga med fantasirobotens i Star Wars. Hur är det med människans förmåga till talsyntes och igenkänning jämfört med filmens språkgeni? Vi har en viss sådan kapacitet, utom vid handikapp. Flerspråkighet, jämte tolkning och översättningsfärdighet förekommer ju, men observera att det krävs speciell träning för att kunna tolka och översätta. Vidare kan man känna igen icke-standardiserade språkformer, dialekter och avvikelser. Det gäller just att känna igen dem som ej tillhörande det gängse språket som vederbörande använder, en annan sak är att förstå och till och med kunna använda dem aktivt. Människor interagerar språkligt, det handlar helt enkelt om kommunikation, varvid förmågan att uttrycka sig måste finnas. Hon kan också känna egna begränsningar och informera andra om dem. Har vi en god uppfattning om kulturskillnader? Nej, i allmänhet inte, menade Barbara. Däremot äger vi oftast ett acceptabelt aktivt arbetsminne.

Vad beträffar modersmålet, barnets första språk, är det genetiskt ”programmerat” för inlärning. Märk att detta genetiska ”program” inte är skapat för något visst konkret språk; däremot är vi som bekant i stånd att ta upp och lagra vilket språk som helst. De vetenskaper och vetenskapsgrenar som arbetar med språk ur olika aspekter är datalingvistik, språkteknologi, forskning kring talet som sådant, kognitionsvetenskap, filosofi och psykologi, datavetenskap m. m. Frågan är vad man lyckats programmera in i våra datoriserade språksystem hittills.

Översättningssystem

Vilka egenskaper finns i en här kortfattat karaktäriserad översättningsmaskin? 1. Den är flerspråkig, hanterar 4-15 språk, som dock vanligen översätts med låg kvalitet. 2. Talsyntes och taligenkänning inkluderas vanligen ej. Dock finns verbala mobiler. Normalt finns alltså ingen taligenkänning, men försök pågår på detta område. 3. Maskinen är i någon mån kapabel att översätta och tolka, men den framställer endast en råöversättning, som i regel måste hyfsas och putsas för hand för att få en fullgod översättning. Systemet kan visserligen prestera en någorlunda korrekt översättning eller tolkning, men bara inom ett mycket begränsat område, t.ex. bokning av resor, hotell och evenemang etc.

Den största fördelen med maskinell språkhantering är enligt Barbara att den sker snabbt. Om det ej rör sig om ett strikt begränsat fält blir som sagt maskinöversättningen bristfällig och rättelser måste göras. Fel uppstår speciellt vid flertydiga ord och idiomatiska uttryck; då behövs mänsklig korrektur och möda för att prestera ett fullt acceptabelt språk.

Kvalitén blir generellt högre om översättningen är inställd på faktatext; dataterminologin i en datamanual passar utmärkt; jämför ovan om bokning m.m. Det är alltså klart att ju snävare området är, ju högre blir kvalitén. Det går således knappast att låta maskinen översätta vilken text som helst; det är inte lönt att låta den översätta litterär text, ty bearbetnings- och rättningsarbetet med råöversättningen skulle ta för lång tid. Jag besökte en öppethus-dag på Högskolan för ett par år sedan och fick tillfälle att ta en titt på ett översättnings- program. Uppgiften att översätta ”How do you do” till svenska resulterade i ”Hur gör du gör”! (Min anm.)

Översättningsprogrammet möjliggör normalt ej någon igenkänning av främmande input, och då finns ju ingen talsyntes eller språkförståelse. Den brukar heller inte vara interaktiv, så att föra en ”naturlig” dialog med den är inte att tänka på. Vidare kan den ej ta egna initiativ och är oförmögen att samarbeta. Slutligen uttrycker den inga emotioner. Däremot känner den igen egna begrepp och kan informera om dem. Har maskinen en uppfattning om kulturella skillnader? Nja, tveksamt. Har den ett aktivt arbetsminne? Nej, maskinen upprepar samma fel, men det finns försök med uppgift att få den att lära av felen; det handlar om att nya mönster lärs in.

Vid KTH i Stockholm har man ett projekt kallat Waxholm System. Ett delsystem heter AUGUST och refererar mycket riktigt till August Strindberg. I detta finns ett dialogsystem som nöjer sig med ett språk. Talsyntes och taligenkänning förekommer ofta, men vanligtvis finns ingen språkigenkänning i detta projekt. Systemet är inte heller kapabelt att översätta och tolka. Det känner ej igen icke-standardiserade språkformer. Däremot förekommer interaktion. Kan maskinen då ta initiativ till dialog? Ja, men den använder bara ett begränsat antal mycket stela former. Kan kroppsspråk samordnas med rent språkliga budskap, t.ex. gester? Nej, men försök pågår.

En bild visade hur ansikten inprogrammeras. KTH:s Waxholm-system har skapat ett ”talande huvud”. Systemet tillåter inga emotioner, men man experimenterar med bl.a. röstvariationer. Känner systemet sin egen begränsning, och kan det informera om detta? Nja, därom råder osäkerhet. Kan det uppfatta kulturella skillnader? Svar: Nej. Finns ett aktivt arbetsminne? Ja, delvis. Hur är det med igenkänning av språkmönster? Ja, maskinen känner igen mönster som liknar varandra. Det gäller artificiella neurala nätverk och här i Skövde pågå sådan forskning.

Dagens läge

Vi människor är dåliga på extrem flerspråkighet, men i datorn kan naturligtvis många språk programmeras. Översättning och tolkning sker också via dataprogram, men med vissa begränsningar (se ovan). Sökning i stora databaser går självfallet bra att göra med datorkraft. Vi är ändå bäst på en hel del saker som det är svårt att programmera in i datasystem, nämligen 1) prata spontant; 2) att få fram en undermening, t.ex. genom skämt; 3) ta initiativ till samtal. Varför är vi bäst på sådant? Därför att vi inte behöver eller kan få maskinstöd i dylika fall. Datasystem och människor är dock ungefär lika bra eller dåliga på att känna igen egna begrepp och informera om dem.

Framtiden

Åt viket håll går utvecklingen? Vart vill vi gå, vad är önskvärt? Går det att formalisera språklig kommunikation? Vill vi ha datorer som resonerar med oss? Vi fick här ännu en kort demonstration i form av en videosekvens som visade något av det hittills mest avancerade systemet, det kvalitetsmässigt bästa, kallat Mobile Form – Speech Translation Server, avsett främst för flygresenärer. Tolkning (tal) mellan japanska, engelska och tyska; vi fick höra på engelska <-> tyska. Området var smalt: flyg- eller tågbokning. Programmet höll god kvalitet, eftersom domänbegreppen i stort sett begränsades till restider, reservering av hotellrum, bokning av restaurangbesök, biobiljetter m.m.

Publikfråga: Hur kan datorn hantera prepositioner? Svar: Det är ett svårt problem. Man kan göra statistiska undersökningar om vissa prepositioners frekvens och omgivning (kontext). Sedan kan slutsatser dras om sannolikheten för en särskild preposition i ett speciellt sammanhang. Vidare görs semantiska analyser av preposition + substantiv. I samband med detta nämndes en nyligen utgiven bok om prepositioner. Man kan vidare få fram ett basalt konkret mönster som kan överföras till abstrakta förhållanden. (Hur detta gick till uppfattade jag ej. Min anm.)

En annan åhörarfråga gällde huruvida man kan ha hjälp av översättningsprogram vid tolkning i domstol, då språkproblem ofta kan uppstå. Svar: Det finns inga maskiner som är anpassade till avancerad tolkning. Det krävs människor som är tränade i muntlig översättning; att vara tvåspråkig är ingen garanti för tolkfärdighet. Utan träning uppstår fel och missförstånd. Att använda barn för tolkuppdrag, bara för att de är tvåspråkiga, är ännu mindre acceptabelt – inte minst med tanke på tystnadsplikten.

Min kommentar

Ett mycket intressant föredrag, särskilt som jag själv sysslat mycket med språk, om än inte med översättning med hjälp av dator. För många år sedan hörde jag talas om försök med maskinell översättning, men man tycktes inte göra några större framsteg under ganska lång tid, vilket förvånat mig något. Efter detta föredrag förstår jag bättre var svårigheterna ligger. Rent allmänt har jag begripit att det är ganska svåra problem att övervinna, för studerar man olika språks beskaffenhet, kan man inte undgå att inse hur komplicerat ett språksystem i själva verket är. Att jämföra och korrekt överflytta ord, för att inte tala om meningar och hela stycken, från ett språk till ett annat kräver verkligen sin man – eller kanske rättare sagt kvinna, då ju kvinnors språkförmåga är väl så god som mäns. Beträffande ordflöde tror jag att kvinnor i gemen överträffar män.

Själv har jag alltid beundrat simultantolkar som förutom mycket goda språkkunskaper måste ha en oerhört snabb uppfattningsförmåga; det gäller ju att under det intensiva tolkningspasset hela tiden blixtsnabbt ställa om från det ena språket till det andra: lyssna/uppfatta <-> tala/översätta. Jag minns från min ungdom en ung svensk slavist (sedermera docent i slaviska språk), som i museer i Leningrad (nu åter S:t Petersburg) snabbt och korrekt tolkade en snabbtalande kvinnlig konstguide från ryska till svenska. Mycket imponerande, men så hade han också i Sverige genomgått den hårda militära tolkutbildningen i ryska. Själv klarar jag ”bara” skriftlig översättning till några främmande språk, däribland ryska. Jag har f.ö. skrivit dikter direkt på främmande språk och sedan själv återgivit dem på svenska (se min bok ”Miniporträtt och poesiflöden”). Märk att det naturligtvis är mycket lättare att översätta till modersmålet än vice versa. Slutligen bör sägas att jag själv inte begagnar mig av Internets översättningsprogram. Deras kvalité har dock säkert förbättrats en hel del sedan 2002.

Sture Alfredson 2014 (Jämfört med det ursprungliga referatet 2002: bara några få ändringar och något tillägg)

Sture Alfredsons hemsida