[l10n-no] Fri programvare for automatoversetting til/fra norsk?
Karl Ove Hufthammer
karl at huftis.org
Man 12. Jul 2021 11:02:53 PDT
Kevin Brubeck Unhammer skreiv 25.06.2021 11:38:
> https://translatelocally.com/ er ei ferdig pakke med GUI og ferdigtrente
> modellar (nevral maskinomsetjing). Kode og data er fritt. Og
> i motsetning til det meste av NMT så kan det køyrast utan enorme
> datasenter. Ikkje så mange språkpar enno, men det ser ut som eit aktivt
> miljø, og norsk-modellane er overraskande bra i forhold til ressurskrav.
Korleis er kvaliteten samanlikna med for eksempel Google Translate.
Altså, kva tyder «overraskande bra»?
Eg las om automatisk omsetting basert på parallellkorpus på
https://www.nm.no/app/uploads/2020/03/nt-02-19.pdf. Det var då snakk om
den såkalla nynorskroboten, som omset frå bokmål til nynorsk, noko som
burde vore mykje enklare enn omsetting til/frå engelsk. I artikkelen
står det:
I NPK og NTB har vi eit korpus på kring 40 000 tekstar som finst
både på bokmål og nynorsk. Etter eit par månader såg vi at det
likevel var for lite, sjølv om vi har forstått at dette er eit av
dei største parallellkorpusa i Noreg. Det krev enormt mykje data i
eit slikt prosjekt. Ikkje ein gong Språkbanken, som er ei nasjonal
korpussamling administrert av Nasjonalbiblioteket, har eit stort nok
parallellkorpus.
Nynorskroboten vart i staden basert på Apertium, og har no blitt veldig bra.
Men eg har lagt merke til at (den kommersielle, ikkje-frie tenesta)
https://www.deepl.com/ – som etter mi erfaring ofte gjev betre og meir
naturlege omsettingar enn Google Translate (for dei språka som er
støtta) – faktisk støttar omsetjing til/frå svensk. Det indikerer jo at
tilsvarande støtte for norsk også *burde* vera mogleg.
--
Karl Ove Hufthammer
Mer informasjon om epostlisten l10n-no.