[l10n-no] Tale til tekst trent med norske stemmedata
Arno Teigseth
arnotixe at gmail.com
Tor 15. Feb 2024 06:43:46 PST
Vi satt den på "whisper-1" og siden har den bare stått på det. Litt
forvirrende dokumentasjon der kanskje, det står "The Whisper v2-large
model is currently available through our API with the |whisper-1| model
name."
Så whisper-1 betyr whisper v2 xD
Tror ikke det finnes andre modeller å velge mellom heller (?) - Vi
bruker Whisper gjennom openai's betalte API, ikke opensource. Men det
skal teoretisk være lik funksjonalitet.
mvh
Arno Teigseth
Den 15.02.2024 09:25, skrev Petter Reinholdtsen:
> [Arno Teigseth]
>> Resultat av kjapp test:
> Takk for nyttige målepunkter. Brukte du 'large'-modellen?
>
> Jeg kom forresten nettopp over< https://arxiv.org/pdf/2402.01917.pdf >,
> "Whispering in Norwegian: Navigating Orthographic and Dialectic
> Challenges" av Per E Kummervold, Javier de la Rosa, Freddy Wetjen,
> Rolv-Arild Braaten og Per Erik Solberg som forteller mer om modellen.
>
Mer informasjon om epostlisten l10n-no.