Forelesning 3 (MUS2860 / 4860 - vår 2004)


Lydteknologiprosjekt

Det høres kanskje banalt ut, men den beste måten å forstå hva man gjør eller ønsker å gjøre, er å ta tak i de tradisjonelle spørreordene:

Hva
Hva skal jeg gjøre? Det er ofte dette som er det vanskeligste å finne ut av. Siden vi har så mange muligheter til å gjøre forskjellige ting .
Hvordan
Hvordan skal jeg gjøre dette? Hvilke metoder skal jeg bruke? Hva jeg må utvikle for å få det til?
Hvorfor
Hvorfor er dette interessant?
Hvem
Hvem er det interessant for?
Hvis
Hvis det ikke er interessant, hvordan kan jeg gjøre det interessant?
Hvilken
Hvilken relevans har dette prosjektet? Hva betyr det for verden?

 

Lydformater

Når vi jobber med musikk er det ofte viktig å forholde seg til hva slags type lydformater vi ønsker å bruke. Det er en mengde forskjellige, og stort sett er hovedspørsmålet om man skal bruke komprimering eller ikke.

MP3
Heter egentlig MPEG-1 Layer 3. Det mest populære lydkomprimeringsformatet. Dekodere kan implementeres fritt, men Fraunhofer har patent på enkoderen. På grunn av den store utbredningen kommer det nok til å dominere enda en stund, men vil på sikt bli erstattet av nyere og bedre standarder.
RealAudio
De første som utviklet effektive streamingformater. Lukket standard. Brukes endel fremdeles, ettersom de har enkle serverløsninger. Nå som alle de andre formatene også kan streames, virker det som de kommer til å dø ut (les artikkel om hvordan RealAudio kjemper for å overleve).
WMA
Microsofts Windows Media Audio. Øker voldsomt om dagen ettersom det nå er standard i Windows Media Player. Gir noe bedre komprimering enn MP3. Lukket standard, dermed lite fleksibelt. Sikkerhetssystem som gjør at man må ha sertifikater for å kunne spille av musikk.
OGG Vorbis
Åpen standard. Noe bedre enn MP3. Lite støtte foreløpig.
AAC
Advanced Audio Coding er del av MPEG2-standarden. Støttes nå av QuickTime. Er beregnet å være etterfølgeren til MP3.

RealAudio er egentlig ganske uinteressant til noe særlig annet enn streaming, og nå om dagen går det fint å streame alle de andre formatene også. MP3 er fremdeles "standard" innen komprimering, men kommer gradvis til å miste fotfeste i tiden fremover. WMA, OGG og AAC tilbyr alle sammen bedre komprimering enn MP3. WMA vokser voldsomt nå om dagen på grunn av at det er standard i Windows Media Player. Det er mange grunner til at man bør være forsiktig med dette formatet, men det viktigste er for å unngå en monopolsituasjon hvor Microsoft sitter på standarden som alle bruker.

AIFF
Audio Interchange File Format. Apples ukomprimert lydformat.
WAV
Windows ukomprimerte lydformat.
FLAC
Lydpakking. Komprimerer lydfiler, men helt transparent.
SDIF
Sound Description Interchange Format. Utviklet av IRCAM og CNMAT for å være et generelt lydformat. Kodet i XML og det er ekstremt fleksibelt. Man kan blant annet lagre multiple versjoner i samme fil. Kan også lagre f.eks. spektralanalyser i et eget spor.

Det finnes endel andre mer eller mindre obskure formater også, men disse er gjerne spesialberegnet på et program. De fleste av disse formatene inneholder nesten akkurat den samme informasjonen. Det er ofte bare headeren som er forskjellig. Man kan faktisk manuelt åpne en aiff-fil og gjøre den om til en wav-fil. AIFF har blitt brukt både på Mac og i Unix-verden, og kan regnes som en standard innen profesjonell musikk, selv om mange også har brukt wav.

 

Kontrollere

Det finnes mange måter å få inn data på en maskin: mus, tastatur, MIDI-instrumenter, joystick, etc. Disse er gjerne ferdiglagete systemer som man kjøper ferdig til bruk. De er dermed ofte lite fleksible. Ofte er det nødvendig å lage egne interfaces for ting.

Kontaktmikrofoner reagerer på fysisk vibrasjon. De kan brukes til å ta opp lyd, eller de kan brukes som switch. I MAX kan man for eksempel bruke bonk~ for å analysere og trekke ut anslag.

Kontrollere finnes det mange av. For eksempel NoTAM-boksen, Atomic Pro fra IRCAM. Felles for disse er at man kan koble på hva som helst som sender en spenningsforandring og de sender MIDI-signaler ut. Dermed er de veldig fleksible.

 

Lekse

Les og forsøk å forstå:

Momeni, Ali, and David Wessel. 2003. Characterizing and Controlling Musical Material Intuitively with Graphical Models. International Conference on New Interfaces for Musical Expression, McGill, Canada.