Regler og vilkår
Maskinoversetting, et spørsmål om lidenskap

Maskinoversetting, et spørsmål om lidenskap

Den 20. årlige konferansen til European Association of Machine Translation (EAMT) ble arrangert i Praha i slutten av mai. EAMT dekker hele spekteret av MT-interessenter, fra forskere til leverandører, og fra utviklere til etterredigererne. Rundt 100 personer deltok på konferansen, de fleste av dem var forskere og utviklere. Alle hadde en ting til felles - en lidenskapelig tilnærming til maskinoversetting.

Publisert 10.08.2017

En modig ny verden

Jeg deltok på denne konferansen for første gang, og den representerte en mulighet til å trå inn i en ny verden: Den akademiske siden av maskinoversetting. Når det gjelder maskinoversetting er bekymringen for språkleverandørene, med andre ord oversetterbyråer, i hovedsak kommersiell. Når det gjelder mitt eget arbeid er det jeg fokuserer på veldig konkret (hvordan skal man introdusere maskinoversetting i en produksjonsarbeidsflyt?), praktisk (hvordan kompenserer man etterredigerere og fakturerer kunder?) og noen ganger psykologisk (hvordan skal man lære opp brukere av etterredigeringsoppgaver og hvordan skal vi overbevise oversettere om at maskinoversetting ikke er en trussel?).

Det er verdt å bruke litt tid på det siste punktet fordi det er den store forskjellen mellom den akademiske verden og den kommersielle verden: I min verden er det fortsatt mange mennesker som er redd for eller åpent imot maskinoversetting. På konferansen møtte jeg folk som er lidenskapelig opptatt av maskinoversetting, som jobber for maskinoversetting og jeg er sikker på at mange av dem drømmer om maskinoversetting! Jeg spurte faktisk en av utviklerne om han ville ta en øl før middag (vi var tross alt i Praha!), og han svarte følgende: “Ok, men bare en for jeg må tilbake til hotellet og starte opplæringen av et nytt neuralsystem”. Jeg var imponert!

Kanskje, kanskje ikke

NMT (Neural Machine Translation) var utvilsomt et hett tema under konferansen. Jeg husker at to forskere kranglet om NMT i lunsjen. En forsker hevdet at NMT er bedre enn SMT (Statistical Machine Translation), mens den andre som var ekspert i NMT, hevdet at SMT er bedre enn NMT. Hvem har rett? Uansett er det som er “best” for en forsker ikke nødvendigvis det samme når det gjelder å bestemme hva som er den “beste” motoren for kunden min. Likevel viser denne anekdoten tydelig hvor lidenskapelig folk er når det gjelder maskinoversetting. Jeg skulle ønske vi så flere lidenskapelige mennesker i min verden også ...

Et annet interessant tema var Quality Estimation (QE), dvs. hvordan man forutser kvaliteten på maskinoversettingsresultatet for å unngå å sende ut søppel til etterredigererne. QE er et flott konsept! Det vil hjelpe oversettere å hanskes med etterredigeringen. Men igjen, noen sier QE er nødvendig, men andre har bevist at QE kan ignoreres helt. Det samme gjelder for BLEU-score (automatisk kvalitetsmålestokk for kvaliteten til et maskinoversettingsresultat): Noen regner BLEU-score som meningsløst hvis den brukes på NMT. Det gir mening. Likevel var BLEU den kvalitetsmålestokken som ble oftest nevnt under konferansen. Noe jeg la merke til i løpet av disse tre dagene var at ingen svar er endelige. Veldig ofte begynte svar på spørsmål med “Det kommer an på ...”.

Det handler om lidenskap og algoritmer

Det var mange interessante tema, men det jeg først og fremst fikk ut av konferansen var at det er folk der ute som har tid til å leve ut lidenskapen sin. Forskere og utviklere har vanligvis ikke krav til omsetning. Derfor har de tid. De har muligheten til å gjøre alle slags eksperimenter for å verifisere en teori eller bekrefte et fenomen. De kan tilbringe dager, uker og måneder med å teste ut en ny språkmodell, optimalisere algoritmer og sammenligne justeringsmetoder. Det handler om morfologi, n-grammer, oppmerksomhet, tokenisering osv. Alt dette er svært avansert og dyptgående og ikke minst veldig teoretisk. En deltaker fortalte meg følgende: “Jeg er ekspert innen mitt spesialistfelt, men det triste er at det sannsynligvis bare finnes fem personer i verden som forstår min spesialisering”!). Når det er sagt, skal man ikke kritisere eller le av den akademiske verden (som noen i min verden er fristet til å gjøre). I stedet bør vi vie mye oppmerksomhet og fremfor ha stor respekt til forskere og utviklere. Uten deres lidenskap og algoritmer ville ikke maskinoversettingen være der den er i dag.

Siste blogginnlegg

Informasjonskapsler, Kakor, Kekse, μπισκότα, galletas, keksit, keksi, печенье, 曲奇饼, cookies

Kjært barn har mange navn. Informasjonskapsler er små tekstfiler som lagres på din datamaskin/telefon. Ved hjelp av disse kan vi gjøre besøket ditt på nettsiden vår enda bedre. Hvis du fortsetter å bruke siden godkjenner du dette. Her kan du lese mer om informasjonskapsler og hvordan du fjerner dem