Blogikirjoituksia

Ditheroinnin ymmärtäminen
Joulukuu 2017

Ditherointi tuntuu olevan hankala käsite ja myös laajasti väärinymmärretty prosessi. Tässä artikkelissa kerron mitä ditheroinnissa tapahtuu, miksi sitä käytetään ja miten sekä koska sitä tulisi käyttää.

Kun digitaalisessa ympäristössä tekee konvertointeja (esim. 24 bittisestä 16 bittiseen), prosessi on matemaattinen, eli käytännössä tietokone tekee laskentaprosessia. Tällaisessa prosessissa musiikkikappale usein kvantisoidaan matemaattisesti alempaan bittimäärään, jotta sen tiedostokoko pienenisi ja kun se muunnetaan tietyille alustoille sopivammaksi (CD:lle tai vaikka digitaaliseen julkaisuun) Mutta tällainen pienempään bittimäärään kvantisoiminen aikaansaa sivutuotteen joka kuuluu uudessa konvertoidussa tiedostossa särönä! Juuri tämän perus ongelman ditherointi pyrkii ratkaisemaan.

Esitän pari perustavaa laatua olevaa kysymystä ja vastaan niihin. Näin saadaan yksinkertainen käsitys tästä hyvin tärkeästä prosessista.

Mitä ditherointi oikeastaan on?

Ditherointi, on prosessi, jota käytetään digitaalisessa konversiossa, kun konvertoidaan musiikkia alemmalle/pienemmälle bittimäärälle ja se estää koversiossa syntyneet ikävät sivuäänet.

Mitä ditherointi tekee musiikkikappaleelle?

Ditherointi lisää kohinaa musiikkitiedostoon. Kohina mikä lisätään, on ns. valkoista kohinaa (White Noise).

Miksi kohinaa lisätään?

Kohina lisätään, koska digitaalisessa konversiossa kappaleeseen tulee ikävää epämusikaalista säröä. Tämä särö peitetään kohinasignaalilla, jolloin säröä ei enää erota ja kappale kuulostaa pehmeämmältä ja paremmalta.

Tuossa oli pähkinänkuoressa ditheroinnin selitys ja syy miksi sitä käytetään!

Periaatteessa tuo riittää, jos ei halua sukeltaa syvemmälle asiaan, mutta ditheroinnissa on puolia, joita on kuitenkin syytä tutkia vähän tarkemmin.

Mutta ensin sanon ylläolevan hieman toisin sanoin:

Jos tekee musiikille digitaalisessa ympäristössä tiedostomuodon konvertointia (24 bittisestä 16 bittiseksi tai 24 tai 16 bittisestä aac tai mp3 tiedostoksi), siitä syntyy yllämainittua ei toivottua säröä. Tässä syntyneessä särössä on ikävä soundi ja se vaikuttaa koko kappaleen yleissointiin. Tästä syystä prosessi pitää hoitaa niin, että konversiossa syntynyt särö peitetään kokonaisella kohinasignaalilla, joka ikään kuin hukutetaan äänen sisälle. Tämän siis ditherointi tekee.

Konvertoinnin ongelmat ovat olleet kauan musiikkiteknikoiden tiedossa, mutta ditherointi yleistyi vasta digitaalisen CD:n tultua suosioon 1980-luvun puolivälin tienoissa.

On olemassa erilaisia ditherointi plugareita, limittereitä sekä prosessoreita. Paremmissa malleissa voi valita erilaisen ditherointi algoritmin, jolloin ditherointi esim. vaikuttaa enemmän vain ylätaajuuksiin ja jättää alemmat taajuudet vähemmälle.

Nämä erilaiset plugarit tekevät ditheroinnin hiukan eri tavalla. Niissä voi valita ditherointi tyypin ja sen laadun, mutta ihmiskorvan pitää olla todella tarkka, jotta se kuulisi ja erottaisi erilaiset ditherointitavat mitä musiikkikappaleelle on tehty.

Mittareilla on kuitenkin helposti nähtävissä, miten ditherointi lisää kohinaa ja ditherointikohinan voi jopa erottaa omaksi signaaliksi jota voi boostata ja kuunnella miltä se kuulostaa.

Konvertoidun kappaleen hiljaisemmissa kohdissa voi huomata ja kuulla ditheroinnin selkeämmin. Ne ovatkin niitä kohtia joissa masteroinnissa kannattaa kiinnittää huomio ja valita ditherointi menetelmä mikä sopii parhaiten aina kyseessä olevalle kappaleelle.

Alla oleva kuva havainnoiltaa mitä ditheroinnissa tapahtuu.

ditherointi

Kuvassa vasemmalla oleva palkki edustaa 16 bittistä tiedostoa ja miten informaatio siinä jakautuu tummiin ja vaaleimpiin sävyihin. Seuraava kuva näyttää mitä tiedostolle on tapahtunut, kun sen bittimäärä on konvertoitu 4 bittiseksi, eli neljäsosaan alkuperäisestä. Nähdään, miten paljon informaatiota on tiedostosta on hävinnyt ja kuvan alalaidassa oleva informaatio ei ole enää ollenkaan luettavissa. Oikealla oleva palkki näyttää mitä tapahtuu konversiossa, jossa käytetään ditherointia. Kaikki informaatio alkuperäisestä tiedostosta on luettavissa, mutta kokonaiskuva on laadullisesti jonkin verran heikentynyt alkuperäisestä.

Juuri näin ditherointi tekee musiikillekin.

Kaikki jotka pelaavat tietokonepelejä, tietävät, että näytönohjaimelta vaaditaan paljon prosessitehoa, jotta se voisi näyttää nopeasti liikkuvat kuvat mahdollisimman laadukkaina. Silloin kun teho näytönohjaimessa ei riitä tai kun pelataan alemmilla asetuksilla, jotkut muuten pyöreät reunat pelin grafiikassa voivat näyttää kulmikkailta. Kulmikasta grafiikkaa nähdään jokaisessa 80 -ja 90 -luvun peleissä - havainnekuva alla, jolloin tietokonetekniikka ei ollut yhtä kehittynyttä kuin nykypäivänä.

game graphics

Pelivertauksessa on olennaisesti samasta asiasta kysymys. Kuva ruudulla on ikään kuin ditheroitu, eli se esitetään alempana bittimääräisenä tiedostona kuin mitä se voisi olla ja siksi se näkyy kulmikkaana. Tässä syynä on näytönohjaimen tehot, kun taas musiikissa ditherointi tehdään, jotta saadaan musiikkikappale konvertoitua kohdealustalle sopivaan tiedostomuotoon ja kokoon.

Syvemmälle asiaan mentäessä herää ehkä kysymys, kuinka älykäs prosessi ditherointi on ja mistä se tietää minkä informaation säilyttää vahvemmin ja mitä osaa heikentää?

Ditherointialgoritmi nimittäin antaa 50 prosentin mahdollisuuden audio biteille jäädä prosessoimatta tai joutua prosessoiduiksi. Tästä syystä ditherointi algoritmi on nykyään kaksisuuntainen; ensin ajetaan prosessi kerran yhteen suuntaan ja sitten toisen kerran toiseen suuntaan. Näin se käsittelee mahdollisimman suuren määrän dataa ja lopputulos kuulostaa yhteneväiseltä.

Masteoinnissa ditherointi tehdään aina kaikkein viimeisimpänä prosessina. Mutta kannattaako miksatessa käyttää ditherointia?

Ditherointi miksatessa:

Kertaan vielä perusasian, että kvantisaation tuottama haitallinen särö (mikä tapahtuu, kun tehdään digitaalisesti matemaattinen koversio) lisää teräviä ja epämusikaalisia häiriöitä musiikkiin ja vaikuttaa myös huonontavasti stereokuvaan. Kun ditheroidaan, se saa kvantisaation kuulostamaan lämpimämmältä, tasaisemmalta ja enemmän analogiselta.

Kuvitellaan että tehdään projektia DAW työasemassa, jossa on monta äänitettyä raitaa. Sitten esimerkiksi joku näistä raidoista prosessoidaan tavalla tai toisella, renderöidään prosessoinnin päätteeksi tai se ns. "bouncataan" ja tuodaan sitten takaisin projektiin. Jos bittimäärää ei vähennetä, ditherointia ei tarvitse tehdä, varsinkin jos käytössä on 32 bittinen floating point resoluutio.

Jos käytössä on 32 bittisyyttä tukeva työasema (DAW), niin silloin ei tarvitse tehdä miksauksen sisäisissä rendauksissa ditheröintiä, mutta kun koko miksaus rendataan ulos pienemmällä bittiresoluutilla (esim. 32bit - 24bit), silloin pitää tämänkin tiedostomuodon kanssa käyttää ditherointia. 24 bittisestä tiedostosta on paljon vaikeampi kuulla häiriötä minkä ditheroinnin pois jättäminen aiheutti kuin sen kuuleminen on 16 bittisessä tiedostossa, mutta ellei ditheroi, se ikävä sivuääni on olemassa.

32bit

Aina kun tehdään valmis miksaus, joka konvertoidaan alaspäin yhdeksi 24 tai 16 bittiseksi raidaksi masterointia tai vaikka asiakkaalle esikuuntelua varten kannattaa käyttää ditherointia.

Noin 10 vuotta sitten oli vallalla käsitys, että ditherointia ei kannata tehdä esim. 24 bit miksaukseen, kun se lähetetään masterointiin ja rendataan ulos 16 bittisenä tiedostona. Syynä oli se, että ajateltiin masteroinnin tekevän lopullisen ditheroinnin joka tapauksessa ja jos ditherointi tehdään kaksi kertaa, se vaan heikentää äänenlaatua.

Mutta kun tosiasia on ensiksikin se, että digitaalinen konvertointi alspäin, eri bittiresoluutioon, aiheuttaa ikäviä sivuääniä musiikille. Toiseksi 24 bittisen projektin rendaus 16 bittiseksi tuottaa sivuääntä jonka voi huomata ja joka heikentää lopullisen raidan äänenlaatua. Masterointi lisäksi korostaa kappaleen erilaisia elementtejä ja se tuo myös esille kappaleen sisältä informaatiota mitä miksatessa ei välttämättä huomaa ja ikävät sivuäänet voivat tulla enemmän esille. Tietenkin niitä ääniä voi ja pitääkin leikata masteroinnissa, mutta mitä vähemmän joutuu leikkaamaan, sen tuhdimpi ja laadukkaampi lopputulos on mahdollista saavuttaa.

Yhteenvetona sanoisin, että nykyiset ditherointiplugarit ovat hyvin laadukkaita ja niitä kannattaa käyttää. Liika ditherointi sumentaa kappaletta sekä yksittäisiä raitoja, mutta vähän käytettynä se takaa paremman äänenlaadun.

Takaisin KW-Masterointi blogi sivulle

Puhelin: 040 5022 867

E-mail: KW Masterointi

KW-Masterointi
Kuurintorpantie 1 J
02750, Espoo