Megszólítva érzem magam, holott úgy tűnik, olyasmiket adsz a ...z ujjaimba (? ), amiket nem állítottam!Aszpirin írta: ↑2019.09.04., szer. 10:58Meggyőztél, na, kivonható, összeadható, sőt KELL. Legyen.juliush írta: ↑2019.09.04., szer. 07:47A dB-es (azaz 10-es alapú logaritmikus) ábrázolást a bemeneti változó mozgására exponenciális választ adó jelenségek egyszerűbb kezelhetősége céljából vezették be. Ezzel praktikusan "linearizálják" a változást, így szimplán összeadással és kivonással leírhatóvá válnak.
Vagyis nem csak hogy összeadható, hanem össze KELL adni, csak a józan paraszti ésszel látszólag ellentmondóan a valós eredmény nem lineáris, hanem exponenciális változás lesz.
DE.
Azt hiszem, Te sem látod (még) a problémát.
(többieknek: Vigyázat. hosszú lesz, és nem is feltétlenül egyszerűen érthető. Azért örülnék, ha a valódi szakértők elolvasnák, és megmutatnák a logikai hibát a gondolatmenetemben, ha van)
Olvasd el az eredeti hozzászólást, amire reagáltam. Ott az jön ki, hogy egy 30 dB SPL zajszintű (vagyis alapvetően nagyon csendes!) szobábam 70 dB maximális hangnyomással hallgatunk zenét, akkor a dinamikatartományunk 40 dB, "ami kevesebb, mint 7 bit". Ami azt sugallja, hogy a CD-n lévő LPCM 16 bitjéből valójában 7 hasznos (az LPCM-ben az "L"-et most szándékosan írtam oda, és remélem már itt pedzegeted, hogy hova lyukadok majd ki, és mi ezzel a probléma)
Na lássuk:
1. a bit, az nem mértékegysége a dinamikatartománynak. A decibellel bármilyen teljesítményarány-érték leírható egy logaritmikus skálán (a 10 hatványkitevőjeként). a 16 bit "decibelben" kifejezve egy elméleti szám, aminél magasabb dinamikatartományú jelet nem lehet torzulásmentesen ábrázolni 16 biten. A számítási képlet (az ábrázolható kvantálási szintek szmának tízes alapú logaritmusa szorozva 20-szal) miértjeit úgy látom itt nagyon sokan nem ismerik, azt viszont mindenki ismeri, hogy ha a bitek számát megszorzod 6-tal (már ez az érték kerekítést tartalmaz), akkor nagyon jó közelítéssel megkapod a "biteknek megfelelő decibeleket". 16 bit esetében: 16*6=96 dB. Innen már egy paraszti logikai lépés, hogy akkor egy adott dinamikatartomány (vagy SNR) decibelben kifejezett értékét ha elosztjuk 6-tal, akkor megkapjuk a dinamikatartomány bitekben kifejezve. Khm... ismerjük egymást, tudom, mi a szakmád, látod a problémát, ugye? Ha van 16 bitem, és ezeket egymás mellé teszem egy kvantálási szint leírásához (16 bites PCM), akkor ebből a 16 bitből mindegyiknek más-más a "súlya". van, amelyik durván 32ezerszer annyit "ér", mint a másik. Szóval kérdem én: a CD-n lévő LPCM 16 bitjéből melyik 7 bit marad meg "hasznosnak"? A válasz, hogy ennek a kérdésnek így nincs értelme, mert a fenti 16 bit -> 96 dB leképezés megfordítása bármely decibel-értékre (paraszti logikával) teljesen hibás következtetésre vezet, vagyis így nem fordítható meg (a paraszti logika kifejezést nem pejoratívan és nem sértően használom, egyszerűen nem találtam jobb kifejezést).
2. LPCM. Mi is az az L? "Linear". Mit jelent? Azt, hogy az amplitúdó-kvantálási szintek linárisan helyezkednek el (egymástól egyenlő távolságra az y tengelyen). Namost, vegyük a paraszti logikát, és mondjuk azt, hogy a 30 dB környezeti zaj elnyomja az összes olyan hasznos jelszintet, amely 30 dB-nél (SPL) alacsonyabb hangnyomást eredményez. Ez lényegében azt jelenti, hogy a 30dB-nél alacsonyabb hangnyomást eredményező kvantálási szintek "hangját" már nem tudjuk elválasztani a "zajtengertől" (ez a legpesszimistább eset mellesleg, ami csak elméletileg nem következhet be, de legyünk pesszimisták). Tételezzük fel továbbá, hogy a láncunk tökéletes, tehát 70dB SPL mximális szinte hallgatva leképezi a teljes kvantálási (a szint-tartományt a 0-70dB tartományra (SPL). Itt jön képbe az "L" jelentősége az LPCM-be, ugyanis ez a leképezés lineáris lesz, míg a dB skála logaritmikus. 70 dB és 30 dB között az eltérés kereken tízezerszeres a hangnyomásban illetve az azt jelképező PCM kvantálási szintértékekben, tehát a 30dB-es "zajtartományba" a 16 biten lehetséges 65536 amplitúdó-lineárisan elhelyezett kvantálási szint egy tízezrede, azaz durván 7 kvantálási szint "merül el" a környezeti zaj tartományában. Marad 65529 olyan amplitúdószíntünk, ami pillanatnyi hangnyomásra leképezve a környezeti zaj "fölé" megy, azaz elméletileg már elkülöníthető a zajtól. Ezek hasznos jelszintek lesznek, tehát mind ábrázolni kell tudnunk őket. És ennyi kvantálási szintet binárisan hány biten tudsz ábrázolni? Bizony, még mindig 16 biten. Egyetlen bit sem vált fölöslegessé a 30 dB környezeti zaj miatt. De ha mégis hasznos mind a 16 bit, akkor hogy állunk a dinamika-tartománnyal? Na ez a baj azzal, amikor a CD elméleti decibeleit és a hangnyomás-decibeleket egymással keverve aritmetikázol és mellette ide-oda konvertálsz bitek és decibelek között.
3. "Reductio ad absurdum": Tegyük fel, hogy tényleg 7 hasznos bitet hallanánk. Akkor lényegében összesen 128 különböző kvantálási szint kombinációja írná le a teljes általunk hallott zenét. Bár az ilyen zene nem válik felismerhetetlenné (hallottam már a Sinclair Spectrum-korszakban 1 bites, azaz kvázi 2 kvantálási szintet tartalmazó zenét is /hangszórómembrán teljesen behúzva, hangszórómembrán teljesen elengedve, a létező legprimitívebb DAC vagy mondjuk inkább úgy: ehhez már a mai értelemben vett DAC sem kell/, és valamennyire felismerhető az is), de hifinek már tutira nem neveznéd, akkorát torzulna :-)
Just my two pence.
Én mindössze a dB-es számítások matematikájáról beszéltem.
A digitális jelrögzítés és -feldolgozás során a bit csupán a mintavételezett és kvantált jel matematikai reprezentációjának egyetlen bináris helyiértékének felel meg. Az, hogy adott bitszámmal hány kvantált jelszintet ábrázolhatunk, matematikailag behatárolja az elérhető, kvantálásból származó jel-zaj viszony mértékét. Nagyjából ez ugye 6dB / bitnek felel meg. De a bit továbbra sem mértékegysége a dinamikatartománynak.
A további gondolatmeneteddel kapcsolatban szerintem tévúton jársz (egy 16-biten ábrázolt 96 dB jel-zaj viszonyú csatornán továbbított információ 30 dB-nyi zajjal történő maszkolása esetén továbbra is praktikusan 16-biten ábrázolható információmennyiséget tartalmaz, ha jól értem?), én pont fordítva közelíteném meg a kérdést!
Tegyük fel, elfogadjuk axiómaként, hogy a környezeti zajszint alatt nem érdemes információt továbbítanunk (ami az emberi hallás, érzékelés ismeretében már nagymértékű leegyszerűsítése a dolgoknak)! Tegyük fel továbbá, hogy 1-bit (az LSB) alatt nincs értelmezhető információ rögzítve (ez sem igaz, de egyszerűsítsünk)!
Na már most éljünk a következő peremfeltételekkel!
- A digitális jel teljes kivezérléséhez a hallgató pozícióban mondjuk 95 dB hangnyomás tartozik, (az analóg erősítés megfelelő szabályozásával, adott érzékenységű és karakterisztikájú hangfalakkal, stb.)
- A helyiségben 35 dB-es háttérzaj mérhető.
- A teljes lánc a hallgatóig nem végez dinamika kompressziót.
Változik némileg a helyzet, amennyiben nem áll rendelkezésre az analóg oldalon csillapítás és a teljes kivezérlés esetén fülsiketítő 120 dB az eredmény. Ebben az esetben a kívánatos 95 dB eléréséhez szükséges 25 dB-es csillapítást digitális jelfeldolgozással érjük el. Vegyük észre, hogy ebben az esetben ugyanolyan 60 dB-es jel-zaj viszonyt próbálunk elérni, ami a 16-bites CD-felbontás esetén továbbra sem gond, az elméletileg elérhető 96 dB-es jel-zaj viszony továbbra is elegendő számábrázolásbeli kapacitást biztosít ehhez. Viszont a szükséges számú kvantálási jelszint ábrázolásához már nem a legfelső 10 bitet használjuk.