[l10n-no] Fri programvare for automatoversetting til/fra norsk?

Karl Ove Hufthammer karl at huftis.org
Man 12. Jul 2021 11:02:53 PDT


Kevin Brubeck Unhammer skreiv 25.06.2021 11:38:
> https://translatelocally.com/  er ei ferdig pakke med GUI og ferdigtrente
> modellar (nevral maskinomsetjing). Kode og data er fritt. Og
> i motsetning til det meste av NMT så kan det køyrast utan enorme
> datasenter. Ikkje så mange språkpar enno, men det ser ut som eit aktivt
> miljø, og norsk-modellane er overraskande bra i forhold til ressurskrav.

Korleis er kvaliteten samanlikna med for eksempel Google Translate. 
Altså, kva tyder «overraskande bra»?

Eg las om automatisk omsetting basert på parallellkorpus på 
https://www.nm.no/app/uploads/2020/03/nt-02-19.pdf. Det var då snakk om 
den såkalla nynorskroboten, som omset frå bokmål til nynorsk, noko som 
burde vore mykje enklare enn omsetting til/frå engelsk. I artikkelen 
står det:

    I NPK og NTB har vi eit korpus på kring 40 000 tekstar som finst
    både på bokmål og nynorsk. Etter eit par månader såg vi at det
    likevel var for lite, sjølv om vi har forstått at dette er eit av
    dei største parallellkorpusa i Noreg. Det krev enormt mykje data i
    eit slikt prosjekt. Ikkje ein gong Språkbanken, som er ei nasjonal
    korpussamling administrert av Nasjonalbiblioteket, har eit stort nok
    parallellkorpus.

Nynorskroboten vart i staden basert på Apertium, og har no blitt veldig bra.

Men eg har lagt merke til at (den kommersielle, ikkje-frie tenesta) 
https://www.deepl.com/ – som etter mi erfaring ofte gjev betre og meir 
naturlege omsettingar enn Google Translate (for dei språka som er 
støtta) – faktisk støttar omsetjing til/frå svensk. Det indikerer jo at 
tilsvarande støtte for norsk også *burde* vera mogleg.


-- 
Karl Ove Hufthammer



Mer informasjon om epostlisten l10n-no.