English version of this page

Whisper i TSD

Her er oppskrift til hvordan du kan transkribere med Whisper i TSD.

1. TSD-prosjektet m? ha tilgang til tungregning p? Colossus. Om dette ikke allerede er p? plass m? PI sende e-post til tsd-drift@usit.uio.no med relevant prosjektnummer og ettersp?rre tilgang. 

2. G? inn i ditt TSD-prosjekt og koble til serveren "pxxxx-submit" (bytt ut xxxx med prosjektnummeret ditt) p? en av to f?lgende m?ter:

  1. Windows: ?pne programmet "PuTTY" og skriv "pxxxx-submit" inn i feltet "Host Name (or IP address)" og velg deretter "Open".

    OBS! F?rste gang du gj?r dette kan PuTTy fortelle deg at den ikke kan "g? god" (i sikkerhets-?yemed) for maskinen du kobler til -- trykk p? "Accept" for ? fortsette tilkoblingen.

    N?r du ser "login as:" skal du skrive TSD-brukernavnet ditt og trykke p? "Enter"-tasten. Deretter m? du angi TSD-passordet ditt (OBS! Passordet skrives inn selv om du ikke ser noen reaksjon p? skjermen) og bekrefte med "Enter" igjen.

  2. Linux: ?pne programmet "Terminal", skriv "ssh pxxxx-submit" og trykk "Enter"-tasten. Angi deretter TSD-passordet ditt (OBS! Passordet skrives inn selv om du ikke ser noen reaksjon p? skjermen) og bekreft ved ? igjen trykke "Enter".

Du er n? innlogget i prosjektets "submit-node", hvor vi kan benytte Whisper.

3. OBS! KUN F?RSTEGANGOPPSETT! G? ellers til trinn 4.
Kopier Whisper til ? ligge innunder "durable/" med f?lgende kommandoer (hver kommando m? etterf?lges av trykk p? "Enter"-tasten):

cd /tsd/pxxxx/data/durable

(Husk ? bytte ut xxxx med ditt prosjektnr ovenfor)

cp -rp /shared/software/whisper/ .

S?rg for ? dele mappen med de andre i prosjektet ved ? skrive f?lgende kommando

chmod -R 774 whisper 

 

4. P?se at lydfilene du ?nsker transkribert befinner seg i mappen "pxxxx/data/durable/whisper/data/". Dette gj?res enklest i programmene "File Explorer" (Windows) eller "Files" (Linux).
NB! Filnavn kan kun ha lovlige tegn og ikke mellomrom.

5. Sett igang jobben som utf?rer transkriberingen fra riktig mappe ved ? utf?re f?lgende kommandoer i PuTTY/Terminal (hver kommando m? etterf?lges av trykk p? "Enter"-tasten):

cd /tsd/pxxxx/data/durable/whisper

(Husk ? bytte ut xxxx med ditt prosjektnr ovenfor)

./transcribe_data

Du b?r n? f? en melding om at en jobb er sendt inn, med tilh?rende ID.

6. De transkriberte filene vil dukke opp i samme mappe som opptaket/opptakene (pxxxx/data/durable/whisper/data/) straks jobben er ferdig utf?rt.
Husk ? flytte disse f?r du transkriberer andre filer!

Se instruksjonsvideo

Denne videoen er tekstet med Whisper b?de med NOR og EN som parameter, og da kom f?lgende filer ut (som jeg har eksportert fra TSD)

 

Du kan endre teksting selv eller skru den av. Denne filmen er tekstet uten ? bli redigert i etterkant. Jeg brukte Whisper til ? oversette ved ? endre i whisper.sm.

Avanserte innstillinger

Du kan gj?re endringer selv i fila Whisper.sm

Her er 2 ting du kan endre:

  1. LANGUAGE=en
    - Om du endrer denne til fra "no" til "en" f?r du automatisk oversatt transcriberingen(!)
  2. #SBATCH --time=00:20:00
    - om du har store filer, m? du ?ke denne opp fra 20 min, ellers f?r du time-out.

Husk ? lagre fila f?r du gj?r kj?rer scriptet p? nytt.

?pne gjerne med Notepad++
?pne gjerne med Notepad++

 

 

Av Dagfinn Bergsager
Publisert 21. nov. 2022 12:12 - Sist endret 3. mai 2024 14:56