Illustrasjonen er laga av Johanne Hjorthol.

Maskinomsetjing – utfordringar og moglegheiter

01.04.2020

Bjørnar Magnussen (f. 1980) er statsautorisert translatør i engelsk og polsk til norsk. Han skriv masteroppgåve om evaluering av MT-motorar og held kurs i dataassistert omsetjing.

Den raske utviklinga av omsetjing ved hjelp av kunstig intelligens er i ferd med å endre vilkåra for profesjonelle omsetjarar.

Når ein skal gje ei innføring i maskinomsetjing, eller MT, som det òg ofte blir kalla, er det vanleg å byrje etter den andre verdskrigen, då teknologien blei teken i bruk til å setje om russiske dokument i det amerikanske militæret. For min del kom derimot det første møtet med teknologien då eg byrja i tredje klasse på vidaregåande i 1998 og det gjekk rykte om at det fanst eit dataprogram – Babel Fish – som ein kunne setje til å gjere tyskleksa (omsetjingsøvingar). På den tida var teknologien ganske primitiv, men akkurat god nok til å få bestått (ein svak toar) i karakter. Rett nok var det mykje smartare å skrive av leksa frå ein flink medelev, så Babel Fish måtte sjåast på som ei siste naudløysing.

Maskinell trussel

Viss vi går framover til 2020, er ikkje lenger MT-teknologien eit siste halmstrå, men derimot ein reell trussel mot tradisjonelle undervisnings- og prøvemetodar. Viss elevane har tilgang til PC og Internett, har det no lite for seg å gje dei omsetjingsoppgåver i språkundervisninga. På vidaregåande i Danmark, der ein lenge har eksperimentert med eksamenar med tilgang til alle hjelpemiddel (slik at dei liknar meir på det ein møter i arbeidslivet), har ein tatt konsekvensen av det og slutta å gi omsetjingsoppgåver. Det blir stadig vanskelegare å lage eksamensoppgåver som faktisk testar språkkompetansen og ikkje berre kor gode elevane er til å ta i bruk nyaste språkteknologi. Her heime har vi til no løyst dette ved å forby både Internett og nedlasta omsetjingsprogram på språkeksamen på vidaregåande.

Ser vi på språkeksamenar på høgare nivå enn vidaregåande, til dømes dei viktigaste prøvane i omsetjar- og språkvaskarbransjen, finn vi òg at praksisen er ulik. Under det som tidlegare heitte translatøreksamen (no autorisasjonsprøve i omsetjing), har kandidatane tilgang til både Internett og omsetjingsprogram. Men her er truleg nivået så høgt og tekstane så vanskelege at MT framleis ikkje har noko særleg for seg. Ein annan viktig prøve i språkbransjen, nemleg Språkrådets kompetanseprøve, er derimot ein tradisjonell eksamen med penn og papir som krev at kandidaten har pugga mellom anna tillatne former av dei vanlegaste orda utanboks.

Fagspesifikk MT

Om lag midt mellom desse to ovannemnde årstala – 1998 og 2020 – blei MT-teknologien god nok til at han kunne takast i bruk i omsetjarbransjen. Google Translate (GT) blei introdusert i 2006 og konkurrerte snart ut Babel Fish som den beste generelle MT-motoren. Det har etter kvart òg dukka opp MT-motorar som er trente opp berre med tekster frå eit spesielt fagfelt. Desse har rett nok dårlegare grammatikk enn GT, men tilbyr til gjengjeld meir presis terminologi. Her er eit døme på korleis det kan sjå ut i praksis:

Subject to the terms and conditions of this Agreement, Supplier hereby appoints the Distributor as its non-exclusive distributor of the Products within the Territory (kjeldetekst).

I henhold til vilkårene i denne avtalen utpeker leverandøren herved distributøren som sin ikke-eksklusive distributør av produktene innenfor territoriet (GT, 2018).

Underlagt vilkårene og betingelsene i denne avtalen, leverandøren utnevner herved distributøren som sin ikke-eksklusiv distributør av produktene på dens territorium (spesialmotor for jusomsetjing, 2018).

I dømet ovanfor ser vi at spesialmotoren har ei meir presis omsetjing av appoints («utnevne» i staden for «utpeke»), men til gjengjeld har problem med norsk leddsetningsordstilling (leverandøren utnevner …) og adjektivbøying («sin ikke-eksklusiv distributør»). Det må nemnast at dette dømet er to år gamalt, og at skilnadene truleg er mindre og kvaliteten jamt over høgare i dag. Generelt blir kvaliteten på MT-omsetjingane stadig betre, slik at det å skrive ein artikkel om dette emnet er som å skyte på eit mål i rørsle.

Den store framgangen kjem i hovudsak takka vere tre faktorar: auka datakraft, betre algoritmar og større teksttilfang (korpus). Når det gjeld datakrafta, så har ikkje berre prosessorane på dei einskilde maskinane blitt mykje kraftigare; det er òg blitt enklare å kople saman datamaskinar i nett, slik at dei kan dele ressursar. Når vi limer ein tekst inn i GT, blir ikkje omsetjinga gjord lokalt på datamaskinen vår (slik tilfellet var med Babel Fish i 1998), men av store datasenter som til saman handsamar titusenvis av slike omsetjingar kvart sekund.

Maskinelle stereotypiar

Auken i datakraft og generelle framsteg på området kunstig intelligens har gjort det mogleg å utvikle meir avanserte algoritmar som nyttar seg av store teksttilfang (heretter kalla korpus). Babel Fish av 1998 var basert på det eldre regelbaserte systemet til Systran, der MT-motoren fekk tildelt ei ordbok og eit sett med grammatiske reglar. Viss ikkje programmet fann ordet i ordboka, pla det berre behalde ordet frå kjeldespråket. Det var kanskje ikkje så rart at resultatet berre så vidt heldt til ståkarakter?

I 2007 la GT om til eit statistikkbasert system der motoren hadde tilgang til store korpus (både to- og einspråklege) som han kunne bruke til å rekne på kor sannsynleg det var at ei bestemt omsetjing var korrekt.

Det siste store paradigmeskiftet innanfor kunstig intelligens kom i 2016–2017, med nevrale nettverk. I desember 2017 kunne vi lese om at AlphaZero blei trent opp ved å spele mot seg sjølv i ni timar og deretter knuste dei beste datamotorane i sjakk. Seinare slo han – som fyrste MT-motor – dei beste menneska i spelet go, og om lag på same tid blei GT-omsetjingane merkbart betre.

Når det gjeld dei tospråklege korpusa som GT og andre bruker, så blir desse stadig større, mellom anna takka vere alle nettsidene som blir laga på fleire språk. Dessutan finst det fritt tilgjengelege fleirspråklege korpus av høg kvalitet som MT-motorane kan forsyne seg av. Det viktigaste av desse er nok det enorme EU-korpuset med omsetjingar av rettsakter til 24 språk. Dessutan har fleire andre land, til dømes Canada, sett om lover og andre viktige tekster til fleire språk. I tillegg til å nytte seg av tospråklege korpus under overføringa av teksta frå eitt språk til eit anna tek MT-motoren i bruk eit einspråkleg korpus – det vil seie tekster på målspråket. I det store og heile bidrar målspråksdata til at omsetjinga blir meir flytande og idiomatisk, men dei kan av og til føre til merkelege omsetjingar der meininga blir snudd på hovudet, som når GT for nokre år sidan sette om slik:

A
Men are men, and men should clean the kitchen (kjeldetekst).
Menn er menn, og kvinner bør vaske kjøkkenet (GT 2012).

Her var det kanskje algoritmane som tykte at den korrekte omsetjinga (at menn bør vaske kjøkkenet) var for usannsynleg, basert på treffa i målspråkkorpuset, som jo inneheld historiske tekster som speglar av tradisjonelle kjønnsroller. I slike tilfelle bør ein kanskje spørje seg om det er kulturen eller GT-algoritmane det er noko gale med; er det til dømes Google sin feil at eit biletsøk på «CEO» stort sett gjev bilete av kvite menn? Men Google har moglegheit til å modifisere algoritmane sine slik at dei ikkje så lett let seg påverke av stereotype kjønnsroller, og etter at feilen i A blei kjend på internettforum, blei han snart retta opp.

Ikkje verdsvande

Døme B og C her illustrerer eit anna GT-problem som framleis finst i dag:

B
I could not find the solution. But it was right in front of me (kjeldetekst).
Jeg kunne ikke finne løsningen. Men det var rett foran meg (GT, 29.2.2020).

C
I could not find the solution, but it was right in front of me (kjeldetekst).
Jeg kunne ikke finne løsningen, men den var rett foran meg (GT, 29.2.2020).

I døme B har GT vanskar med pronomenet it, som her refererer til the solution i den førre setninga, altså det norske hankjønnssubstantivet «løsningen». Sidan GT førebels ikkje er i stand til å prosessere meir enn éi setning om gongen, får motoren ikkje med seg kva kjønn referenten til pronomenet har, og må i staden gisse. Basert på korpuset gissar GT at it viser til ein referent som er eit inkjekjønnsord på norsk; vi kan til dømes tenkje oss at det kjem av mange korpustreff på the answer […] it was right in front of me. Men viss vi slår saman dei to setningane i B til ei lengre setning, som i C, blir dei prosesserte saman, og GT skjønar at it refererer til the solution.

Her ser vi eit anna døme på at GT kan ha vanskar med å tolke kva eit pronomen refererer til:

D
The bird ate the apple because it was hungry (kjeldetekst).
Fuglen spiste eplet fordi det var sulten (GT, 29.2.2020).

I dette tilfellet gamblar GT på at referenten for it i it was hungry er det næraste substantivet, nemleg apple. Feilen illustrerer eit generelt problem med MT-teknologien, nemleg at motorane manglar kunnskap om korleis den verkelege verda fungerer. I dette tilfellet veit altså motoren ikkje at eit eple ikkje kan vere svolte.

Feila i A, B og D ovanfor er av ein type som så godt som aldri finst i tekster som er sette om av menneske. Til gjengjeld gjer dagens MT-motorar bortimot aldri reine stavefeil, og veldig sjeldan grammatikkfeil og utelatingsfeil. Dette illustrerer at såkalla etterredigering (post-editing) av maskinomsette tekster ikkje er det same som språkvask av tekster skrivne av menneske, men krev at ein leitar etter heilt andre ting.

Er etterredigering framtida?

Den første førespurnaden om etterredigering fekk eg i 2008. I byrjinga var det stort sett korte programvarestrenger som fekk denne handsaminga, i tillegg til råomsetjingar til intern bruk – til dømes når eit advokatfirma fekk inn mange dokument i ei sak og skulle sortere ut dei som var relevante. Lakmustesten på om MT-teknologien er god nok til bruk, er sjølvsagt om han aukar kvaliteten på omsetjinga og/eller reduserer tidsbruken samanlikna med vanleg omsetjing. Etter kvart som teknologien blei betre, spreidde bruken seg til andre sektorar som reiseliv, tipping, dataspel og undertekster.

I byrjinga av 2010-åra kunne omsetjarane sjølve dra fordel av den teknologiske utviklinga ved å bruke MT på høvande tekster og så ta betalt som for ein vanleg omsetjingsjobb. Men i dag er mange av fordelane etne opp av byråa og sluttkundane. Mange omsetjarar opplever at dei får stadig færre tilbod om tradisjonelle oppdrag og fleire tilbod om etterredigering, som er dårlegare betalt per ord.

Kvaliteten på rå MT er veldig varierande, difor er det alltid risikabelt å takke ja til ein etterredigeringsjobb som blir honorert per ord – og timebetaling kan det vere vanskeleg å få gjennomslag for i ein bransje der prisen tradisjonelt har blitt avtala på førehand. Slik sett skapar MT-teknologien utfordringar for ein bransje som er fragmentert, og der mange omsetjarar driv som enkeltpersonføretak eller små aksjeselskap og dermed er omfatta av konkurranselova og forbodet mot samarbeid om prisar og vilkår.

Det er til no hovudsakeleg næringslivet som har teke i bruk MT, men er teknologien moden nok til å bli teken i bruk til bokomsetjingar? Mykje av forskinga dei siste åra tyder på at svaret er ja.

I PiPeNovel-studien frå 2018 fekk seks profesjonelle omsetjarar i oppgåve å setje om den same romanen frå engelsk til katalansk. Delar av omsetjinga skulle skje på tradisjonell måte og delar skulle skje ved hjelp av etterredigering av omsetjinga til ein spesialtrent MT-motor. Resultatet var at farten i gjennomsnitt auka med 36 prosent og talet på tastetrykk gjekk ned med 23 prosent når ein tok i bruk MT.

Interessant nok gjekk òg talet på korte pausar (som forskarane brukte som eit mål på kognitivt strev) ned med 42 prosent, samstundes som lengda på pausane auka med 25 prosent.¹ Når ein les om denne studien, er det viktig å hugse på at dei resultata ein oppnår med ein spesialtrent motor frå engelsk til katalansk, ikkje nødvendigvis let seg skape att med til dømes GT frå engelsk til norsk.

Studiar av kvalitet

Men kva med kvaliteten på etterredigert MT? I PiPeNovel-studien brukte ein profesjonelle omsetjarar og bad dei bruke så lang tid dei trong for å lage ei tekst av publiserbar kvalitet, altså ei form for eigenvurdering. Ein fekk ikkje objektive tredjepartar til å vurdere kvaliteten på den etterredigerte MT-teksta, og det er eit minus med studien. Men som ein del av det same prosjektet sette ein tredjepartar, som ikkje var profesjonelle omsetjarar, til å samanlikne kvaliteten på rå MT med menneskeproduserte publiserte omsetjingar og fann ut at for to tredjedelar av bøkene blei 30 prosent av setningane vurderte til å vere av minst like høg kvalitet.² PiPeNovel-prosjektet tok for seg skjønnlitteratur, og det finst ikkje nokon tilsvarande studie for fagbøker, men konklusjonen om at MT-bruk truleg gjev ei effektivitetsbetring, stemmer med mi eiga erfaring med omsetjing av sakprosa.

Sjølv om alle omsetjarar i PiPeNovel-studien sette om raskare ved hjelp av MT, var òg alle negative til etterredigering, og dei sa at dei ikkje ville brukt MT-teknologi med mindre dei var nøydde til det, til dømes på grunn av tidspress.³ Dei følte at MT-bruken fekk dei til å produsere ei bokstaveleg omsetjing og ei setningsinndeling som var identisk med den i kjeldeteksta, sjølv om dei altså meinte at sluttresultatet var av publiserbar kvalitet.

Her må det seiast at berre éin av omsetjarane som tok del i PiPeNovel, hadde røynsle med etterredigering av MT på førehand. Dei andre fem måtte lærast opp i ein ny arbeidsmåte, og det gjorde kanskje sitt til at dei var negative.

Personleg er eg ikkje samd i at MT-bruk fører til ei mindre kreativ omsetjing. Takka vere MT-teknologien går det første utkastet mykje raskare, slik at eg får ekstra tid som eg kan nytte til endå ein gjennomgang av heile omsetjinga. I denne siste gjennomgangen finn eg ofte fram til kreative løysingar og meir målspråksnær setningsinndeling, slik at det endelege produktet blir betre.

Det er likevel liten tvil om at MT-bruk fører til ei endra arbeidsoppleving. Når alt stemmer og teksta er passe vanskeleg, kan tradisjonell omsetjing gi røynde omsetjarar opplevinga av å vere i ei slags flytsone der dei gløymer tid og stad. Under etterredigering av maskinomsette tekster er det vanskeleg å oppnå ei tilsvarande meistringskjensle fordi oppgåva meir består av rutineprega kontroll, avløyst av ganske frustrerande problem. Det kan òg vere krevjande å stadig ta stilling til om ditt eige framlegg objektivt sett er betre enn framlegget til MT-motoren. Difor er det kanskje ikkje til å undrast over at erfarne omsetjarar ofte er negative til etterredigering, sjølv om forskinga syner at MT-bruk gjev ein effektivitetsgevinst.

Prøv sjølv!

Viss nokon av lesarane får lyst til å teste ut MT i praksis, er det enklast å gå til https://translate.google.com/ og laste opp dokumentet som skal setjast om. Google Translate er gratis og den beste generelle motoren av dei som støttar norsk. Det finst som sagt òg spesialmotorar, men desse kostar pengar og må ofte trenast opp. Difor er dei hovudsakleg tilgjengelege for større omsetjingsbyrå. Men ver merksam på at du ved å bruke nettenesta gjev Google tilgang til teksta di og fullmakt til å bruke henne til å «drifte, promotere og forbedre tjenestene, og utvikle nye».⁴ Ein bør difor berre bruke GT på denne måten til tekster som ikkje er konfidensielle, til dømes fordi dei allereie ligg fritt tilgjengeleg på Internett.

For oppdrag som har høgare krav til konfidensialitet, kan ein nytte Google Cloud Translation API, som ikkje gir Google nokon bruksrettar til kjeldeteksta. API-tenesta er i dag gratis i bruk for opptil 500 000 teikn i månaden (altså ei bok på om lag 250 sider), og deretter kostar ho 20 USD per million teikn. I motsetnad til vanleg GT kan omsetjaren ikkje bruke API-tenesta direkte via nettet, men må nytte eit tredjepartsprogram, til dømes G4T4 ⁵ eller eit databasert omsetjarverktøy av typen SDL Trados. Men merk at uansett kva for teneste du nyttar, vil kjeldeteksta bli send over nettet. Så sørg for å finlese konfidensialitetsavtaler du måtte ha inngått med kunden, før du set i gang!

Notar
1. Toral, Antonio, Martijn Wieling og Andy Way. 2018. Post-editing Effort of a Novel with
Statistical and Neural Machine Translation. Frontiers in Digital Humanities.
Tilgjengeleg her: https://www.frontiersin.org/articles/10.3389/fdigh.2018.00009/full

2. Toral, Antonio og Andy Way. 2018. What Level of Quality can Neural Machine Translation
Attain on Literary Text? In Translation Quality Assessment.
Tilgjengeleg her: https://arxiv.org/pdf/1801.04962.pdf

3. Moorkens, Joss, Antonio Toral, Sheila Castilho og Andy Way. 2018. Perceptions of Literary
Post-editing using Statistical and Neural Machine Translation.
Tilgjengeleg her: http://doras.dcu.ie/23898/1/Edit%20trans.pdf

4. Google Personvern og vilkår, gjeld frå 22. januar 2019.
Tilgjengeleg her: https://policies.google.com/terms https://policies.google.com/terms

5. Google Translate for Translators (GT4T)
Tilgjengeleg her: https://gt4t.net/

Maskinomsetjing – utfordringar og moglegheiter

Maskinell trussel

Fagspesifikk MT

Maskinelle stereotypiar

Ikkje verdsvande

Er etterredigering framtida?

Studiar av kvalitet

Prøv sjølv!

Ute nå

Egotripp

Maskinomsetjing – utfordringar og moglegheiter

Maskinell trussel

Fagspesifikk MT

Maskinelle stereotypiar

Ikkje verdsvande

Er etterredigering framtida?

Studiar av kvalitet

Prøv sjølv!

Relaterte saker

Familiehistorier i skyggen av katastrofer

Subjektivitet og sannhet

Kom inn i det norske hus

Å skrive seg til målet

Ordet og dyret

Om mus og mennesker

Ute nå

Egotripp