[l10n-no] Diktafonprogrammvare til linux?

Fre 13. Jan 2023 05:55:42 PST

Kjekt! Takk for introen, eg testa ut whisper òg.

On Thu, 12 Jan 2023 at 23:38, Håkon Løvdal <hlovdal at gmail.com> wrote:
> Dette gikk derimot ganske bra, om ikke akkurat lynkjapt:

Fyrste gong du køyrer han so lastar han jo ned modellen i frå
internett. So det vil jo bli teke med i rekneskapen her. Køyr
kommandoen ein gong til so går det kjappare. For min del tok det 2m41s
fyrste gong (med nedlasting), andre køyring tok 18s. Som likevel var
overraskande treigt sjølv for medium modellen. Eg skal jo ha eit bra
skjermkort (RTX 4050, det billigaste, men heilt nytt).

Eg prøvde òg svensk, men då med modellen "small", som er kjappare og
mindre, men òg mindre korrekt. Den er absolutt mindre korrekt som du
kan sjå:

(whisper) odin at enn:~/tmp/whisper$ time whisper --model small
--language sv swedish.wav
/home/odin/tmp/whisper/lib/python3.10/site-packages/whisper/transcribe.py:78:
UserWarning: FP16 is not supported on CPU; using FP32 instead
  warnings.warn("FP16 is not supported on CPU; using FP32 instead")
[00:00.000 --> 00:03.520]  Hej det här Linnus Turvalls och jag uttalar Linnux.

real 0m6,094s
user 0m46,361s
sys 0m4,083s

Men 6 sekund i staden for 18 sekund.

Whisper var forresten kjapt å setja opp når eg allereie hadde CUDA og
slik installert:

mkdir whisper
cd whisper/
python3 -mvenv .
. bin/activate
pip install git+https://github.com/openai/whisper.git
wget https://mirrors.edge.kernel.org/pub/linux/kernel/SillySounds/english.wav
wget https://mirrors.edge.kernel.org/pub/linux/kernel/SillySounds/swedish.wav
time whisper --model tiny --language sv swedish.wav

Den siste der, "tiny" var enno kjappare på 1.7s. Og får med seg at
Linux vert sagt to gongar, men med andre feil:
[00:00.000 --> 00:03.500]  Hej, det här är Linne Sturwald och jag
uttalar Linneux Linneux.

-- 
Beste helsing,
Odin Urdland