[l10n-no] Tale til tekst trent med norske stemmedata

Arno Teigseth arnotixe at gmail.com
Tor 15. Feb 2024 06:43:46 PST


Vi satt den på "whisper-1" og siden har den bare stått på det. Litt 
forvirrende dokumentasjon der kanskje, det står "The Whisper v2-large 
model is currently available through our API with the |whisper-1| model 
name."

Så whisper-1 betyr whisper v2 xD

Tror ikke det finnes andre modeller å velge mellom heller (?) - Vi 
bruker Whisper gjennom openai's betalte API, ikke opensource. Men det 
skal teoretisk være lik funksjonalitet.


mvh

Arno Teigseth

Den 15.02.2024 09:25, skrev Petter Reinholdtsen:
> [Arno Teigseth]
>> Resultat av kjapp test:
> Takk for nyttige målepunkter.  Brukte du 'large'-modellen?
>
> Jeg kom forresten nettopp over< https://arxiv.org/pdf/2402.01917.pdf >,
> "Whispering in Norwegian: Navigating Orthographic and Dialectic
> Challenges" av Per E Kummervold, Javier de la Rosa, Freddy Wetjen,
> Rolv-Arild Braaten og Per Erik Solberg som forteller mer om modellen.
>


Mer informasjon om epostlisten l10n-no.