Die Welt des DIGITAL-AUDIO (Probleme & Lösungen)

Update 10.01:  DVD, DVD-A, PCM, DSD, SACD, Ausblick: CD/DVD-A/SACD
Update 09.02:  JISCO, Jitter Erweitert
Update 04.05:  Digitalleitungen
Update 05.05:  Korrelierter Jitter

Neue Technologie alte Probleme:

Das waren noch Zeiten als 1983 die ersten CD-Player vorgestellt wurden. Ein neues Musikmedium das perfekte Musikwidergabe versprach war geboren. Kein Rauschen oder Knistern, unbegrenzte Dynamik hoher Bedienungskomfort,  Kratzern gegenüber unempfindlich etc. wurde propagiert. Alle von der Fachpresse vorgestellten CD-Player waren sofort Spitzenklasse!

Nur die Gemeinde der „ewig Gestrigen“ Analogies (oder die wirklichen Musikhörer ?) haben immer wieder auf die hörbaren Fehler hingewiesen, der gegenüber der Analogwiedergabe unnatürlichen „digitalen“ Wiedergabe. Waren die Redakteure taub, oder mußten sie nur die Industrie puschen ?

Es hat über 30 Jahre gedauert bis das analoge Medium Stereo-Schallplatte ihre „volle“ Qualität offenbaren konnte. Hervorragende LP´s der 60´er (Living Stereo, Decca, Verve, Blue Note ...) können erst heute in ihrer vollen Klangqualität erlebt werden.
Erst das unermüdliche Forschen der kleinen weltweiten High-End-Gemeinde (Anwender und Entwickler) hat dazu geführt, daß die von dem Urheber unentdeckten oder vernachlässigten Fehler Schritt für Schritt immer mehr erkannt wurden. Heute sind diese, sofern es der Hersteller richtig umsetzt und der Kunde es bezahlen will, beseitigt. 

Genau den gleichen Weg scheint die digitale Audiotechnik zu gehen. Viele der angeprangerten klanglichen Eigenschaften (fehlende -Wärme, -Räumlichkeit, -Feinzeichnung und Luftigkeit) sind heute in der Ursache klar. Die anfängliche „Vollkommenheit“ (Fehlerunanfälligkeit) der Digitaltechnik hat mehr und mehr Ihre Schwächen preisgegeben. Den Entwicklern der CD-Technik (PHILIPS,  SONY) waren diese wohl zum Teil nicht bewußt, die Technologie war noch nicht vorhanden, oder die Schwächen wurden bewußt in Kauf genommen. Für High-End wurde die CD ja auch nicht entwickelt.

Mit der heute zur Verfügung stehenden Digital-Technologie ist es möglich den „analogen Klang“ zu erreichen. Um so verwunderlicher ist es, daß immer noch, auch in High-End-Geräten, der „digitale Klang“ vertreten ist. Es ist erstaunlich welche klangliche Qualitäten in der guten alten CD stecken, wenn die bekannten Fehlerquellen konsequent angegangen werden.

Die erweiterte Technologie DVD und DVD-Audio mit erhöhter Quantisierung (von 16 -> 24 Bit) und erhöhter Samplingfrequenz (von 44,1 -> 96 bzw. 192 kHz) ist ein zukunftsicherer Weg in die richtige Richtung der natürlichen Musikwiedergabe. Diese Technologie basiert wie bei der CD auf dem PCM-Verfahren.
Der Anspruch "natürliche Musikwiedergabe" gilt selbstverständlich auch für die von Philips und SONY forcierte SACD-Technologie (Super-Audio-CD), die nach dem neu entwickelten DSD-Verfahren arbeitet.
Für diese erweiterte bzw. neue Technologien hat sich der Begriff High-Definition-Audio - kurz “HD-Audio” etabliert.
(Siehe auch Ausblick auf die neuen Digital-Audio-Technologien)

Es ist aber zu Bedenken, daß nicht allein die neuen Schlagwörter 24 Bit / 96, 192 kHz, DSD den Fortschritt bringen !
Denn nur in Verbindung mit der Peripherie, (Laufwerk, Netzteil, Taktgeber, I/U-Wandler, Filter ..), an die deutlich höhere Anforderungen gestellt werden, wird daraus ein High-End-Ergebnis. Es ist zu hoffen, daß die Kenntnisse über Fehlerquellen hier sofort einfließen. Aber das ist ja, wie immer, eine Preisfrage.

Die Abtastung der CD/DVD:

Um eine Vorstellung von der Abtastung der Daten zu bekommen, folgen hier ein Paar Infos aus der CD-Technologie. Bei der DVD (Digital-Versatile-Disc = Digitale-Vielseitige-Scheibe) sind die Abmessungen kleiner und die Datenmenge ist umso größer. Daten der DVD in [Klammern].

Variable geregelte Drehzahl von 486 bis 196 U/min [1530 bis. 630 U/min] (Abtastung von Innen nach Außen) damit die Kanalbitrate von 4,218  [9.5] MegaBit/sek immer konstant bleibt. Die maximale Speicherkapazität beträgt 650 MByte [bis zu 17GByte], die Spielzeit 74Min [8Stunden],  die Abtastgeschwindigkeit ca. 1,2-1,4 [4] m/sek. 

Die Größe der Informationsträger (Pits): Länge ~0,833-3,05 [~0,4-1,5] µm, Höhe 0,11[?] µm, Breite 0,5 [0,25] µm.

Spurmittenabstand: 1,6 [0,74] µm. Der Abtastlaser bildet ein Fokusfleck von ~1 µm auf der CD-Oberfläche (nur wenige Zehntel mm vor der Labelseite). Einen mm darüber (auf der Abtastseite) hat er einen Durchmesser von ~1 mm. Die Schärfentiefe beträgt nur 2 µm. Die Länge der Spur auf der 12 cm Makralon-Scheibe beträgt 5 km ! Um sich über die Größenordnung klar zu werden sollte man alle Werte mit 1000 multiplizieren, dann werden aus µm mm ... ! 

Der Laser von nur 1 mW-Leistung muß mit einer Genauigkeit von +/-0,1 µm auf der Spur gehalten werden (Spurregelung). Die Fokusierung (Bündelung des Laserstrahls) darf eine maximale Abweichung von 0,5 µm aufweisen, sonst werden Fehler gelesen (Fokusregelung). Die Drehzahl der Scheibe muß entsprechend der Datenrate geregelt werden (Drehzahlregelung). Die beiden Servoregler für Spur und Fokus sowie der Geschwindigkeitsregler müssen sehr präzise und synchron arbeiten. Die Versorgung dieser Digitalregler erfordert natürlich ein hochpräzises, eigenes stabiles Netzteil, das möglichst frei von Digitalschmutz sein muß.

Welche klangliche Veränderungen durch eine unsaubere Abtastung entstehen kann an Hand der Verbesserungen durch: Vibrationsdämpfung des Laufwerks und der CD, Dämpfungsscheiben, CD-Spray, CD-Kanten anmalen oder anschrägen und anmalen, Bedini ... nachvollzogen werden. Diese Veränderungen können in Abhängigkeit der Qualität der Laufwerksmechanik und der Abtastregler wenig oder viel Verbesserung bringen. Die optische Qualität des Laufwerkes (Schublade oder Toplader, Laufwerk aus Metall oder Kunststoff, usw.) gibt leider keine Auskunft über die Abtastqualität. Diese ist abhängig von dem perfekten Zusammenspiel der Mechanik und der Elektronik.

Grundsätzlich gilt es hier Fehler zu vermeiden.  Andernfalls werden sie, wenn sie nicht mehr zweifelsfrei mit Hilfe der Fehlerkorrektur und Redundanz-Daten (zusätzliche überflüssige Daten zur Rekonstruktion im Fehlerfall) korrigiert werden können, geschminkt bzw. vertuscht. Weiterhin muß man bedenken, daß die Musik (leider) nach CD-Norm zeitsynchron ausgelesen wird, es ist also nicht möglich, wie bei Computer-CD-ROM´s bei festgestellten Lesefehler wiederholt einzulesen. Der Steuerprozessor stellt teilweise einen Ausgang bereit, der die Fehlerrate wiedergibt. Dieser wird aber im Allgemeinen leider nicht zu Anzeige gebracht!

Der Systemtaktgenerator (Clock):

Das Herz einer digitalen Signalverarbeitung ist der Taktgenerator (Quarzoszilator). Er stellt die Referenz-Zeitbasis für den Steuer- und Regelprozessor des Laufwerks (Geschwindigkeit) dar und legt die Zeitintervalle für die Digital/Analog-Wandlung der eingelesenen Abtastworte (Samples) fest. Er liefert auch den Basistakt für den Digitalausgang.

In der Regel wird der Takt auf primitive Weise mit einem Inverter-Gatter und einem Standardquarz im Rückkopplungszweig erzeugt. Bei dem Gatter handelt es sich um eines von vielen im hochintegrierten DA-Wandler oder Steuerprozessor. Der Quarz wird oft übersteuert, der Inverter rauscht und das Signal wird zusätzlich mit Störungen über die schlecht entkoppelte Betriebsspannung verschmutzt. Zusätzlich wird der Quarz (ein nur ca. 5 µm dicker Kristall) meist direkt auf der Platine montiert und ist daher sehr mikrofonieempfindlich. All dies führt unweigerlich zu Jitter !

Versuche mit unseren Präzissionsquarzgenerator AC-Clock haben gezeigt,  das sogar der Typ und die Bauform des Quarzes einen Einfluß hat. Geringste Übersteuerungen des Quarzes bewirken Oberwellen auf dem Ausgangssignal und diese sind ein Indiz für Jitter. Ob ein Quarz im Generator perfekt, d.H. klirrarm, arbeitet war klanglich nachvollziebar ! 

Jitter:

Dies ist eine kleine, schnell schwankende Veränderung der Sollfrequenz (engl.=Zittern), quasi Rauschen im  Zeitbereich. Die Analogie in der analogen Welt ist die Tonhöhenschwankung (Frequenzmodulation) auf Grund nicht konstanter Drehzahl (Gleichlaufschwankung) bei Plattenspieler und Tonband. Der Jitter (Zeitmodulation) wirkt sich gehörmäßig aber fataler aus, er ist einer der gravierendsten Ursachen des „digitalen-Klangs“. Der erfahrene Analog-Fan weiß wie positiv sich ein perfekter Gleichlauf, meist durch Masselaufwerke und stabile Antriebe (siehe QPS) erreicht, auf die „Ruhe“ und das „Timing“ (dem Fluss) der Musik auswirken.

Für die Klangqualität ist die Jitter-Amplitude und das Jitter-Spektrum aussschlaggebend. Jitter bewirkt im anlogen Ausgangssignal  eine Frequenzmodulation.

Seit den Untersuchungen von "Charles Altmann" (www.jitter.de) wird zwischen zwei Typen von Jitter unterschieden.

  • Der unkorrelierte (zufällige) Jitter: Der Verursacher des schlechten, digitalen Klanges, der vermieden werden muss - und kann (z.B. AC-Clock, Digitalkabel).
  • Der  korrelierte (Gerätetypische, wiederholbare) Jitter:  Jede digitale Quelle hinterlässt ihren eigenen digitalen Fingerabdruck ("Korrelation", "Signatur").  Jede Form mechanischer Schwingungen des Laufwerkes und der CD wirkt sich auf den Datenstrom aus. Dies kann nicht verhindert, sondern nur beeinflusst werden. (-> Magic-Disc, Wonder-Pads, externes Netzteil). Eine einmal in den Datenstrom eingebrachte Klanginformation kann nicht mehr, oder nur mit sehr großem Aufwand, entfernt (blockiert) werden.

Es werden drei Arten von unkoreliertem Jitter unterschieden:

1.) Zufälliger, Rausch-Jitter (Random-Jitter): Entsteht durch eine Amplitudenmodulation vom Signal (Takt) mit einer Rauschspannung (Halbleiterrauschen, Störmodulation der Betriebsspannung und der Signalmasse, Störeinstrahlung...). Der Nulldurchgang, bzw. Triggerpunkt (Schwellpunkt an der Signalflanke) für nachfolgende Schaltungen wird unscharf, und damit unsicher (Erkennung der Flanke wechselt, mal früher oder später). Die Ursache dieses Jitters ist meist der Systemtaktgenerator (Clock). Übliche interne Quarzgeneratoren liefern einen Jitter von 200-300 ps (Spitzenwert). Hochwertige gekapselte Industriegeneratoren liegen bei 20-50 ps. Die Spitzenklasse liegt bei ca. 10 ps (1 ps = 10-12  Sekunden) 

2.) Dateninduzierter- Jitter, SRTE (Signal relatet timing error): Hier steht die zeitliche Variation in direkter Beziehung zu dem Datensignal. Die direkte Folge sind Verzerrungen durch Frequenzmodulation des Analog-Signales. (Siehe Wandler). Dieser Jitter tritt hauptsächlich innerhalb komplexer Bausteine wie Digitalfilter und Wandler auf. Dort werden verschiedene datenabhängige Signale asynchron verarbeitet. Durch Übersprechen, Modulationseffekte der gemeinsamen Betriebsspannung (Akatuatoren=Stellglieder, Motoren, Insbes. Spindelmotor, Servos, Digitalanzeige, ..) und Gatter-Laufzeitverzögerungen wird der Systemtakt verschmutzt. 

3.) Daten-Jitter: Entsteht oft bei der digitalen Signalübertragung. (siehe S/P-DIF, Digitalausgang, Digitalleitung). Die Ursache ist ein verrauschtes Signal, Kabelrauschen, Leitungsreflexionen und Bandbreitenbegrenzung. 

Auf Grund des Jitters bleibt von dem theoretischen Dynamikumfang von 96 dB bei 16 Bit (Näherung: 20*log216 , oder 6*16 + 1,7) und 144 dB bei 24 Bit (Bei 24 Bit gibt der Wandler Hersteller 112 dB an) meist nur ca. 65-75 dB übrig. Dies ist vergleichbar mit einem Plattenspieler!

Ein Beispiel: Die Samplingfrequenz bei CD beträgt 44,1 kHz, mit dem üblichen 8-fach Oversampling wird daraus 352,8 kHz. Die Verweilzeit eines Samples beträgt demnach ts =2,83 µs (bei DVD 1.3 µs). Typische CD-Player kämpfen mit einem Jitter von tj=200-500 ps (Pikosekunden). Die nutzbare Dynamik bei z.B. 300 ps Jitter errechnet sich folgendermaßen: D[dB] = 20*log(ts/tj)  = 79 dB für CD und 73 dB für DVD. Daraus läßt sich nun die tatsächlich nutzbare Quantisierung errechnen: Q[Bit] = D / 20*log(2)  = 13Bit.

Das Digitalfilter:

Das Digitalfilter hat die Aufgabe, daß bei CD´s im 16 Bit Format quantisierte und mit fs=44,1 kHz abgetastete Signal auf ein 18...24 Bit Signal umzurechnen. Weiterhin findet hier das s.g. Oversampling (Überabtastung) statt. Der Algorithmus zum Hochrechnen auf ein höheres Datenwort, z.B. 24 Bit, und das Mischen mit quasi analogem Rauschen (Dither) ist das große Geheimnis der Filterhersteller und sehr klangentscheidend. Einige Filter bieten die Möglichkeit zwischen verschiedenen Filtercharakteristiken (Soft/Sharp) auszuwählen, die entweder auf den Frequenzgang oder den Phasengang optimiert sind (impulsoptimierte Filter). Seltener ist die Umschaltmöglichkeit der Interpolationsalgorithmen (z.B. Spline-, Bezier- Filter). Die Digitalfilterung wird teilweise auch mit DSP´s (Digital-Signal-Prozessor) durchgeführt. Im Digitalfilter werden auch Funktionen wie Deemphasis verwirklicht. Dies ist eine Höhenabsenkung nach vorheriger, bei der Aufnahme durchgeführten, Höhenanhebung (wird kaum noch angewandt). Bei einfachen Playern wird dies im Analogteil durchgeführt (zwangsläufig mit mehr Fehlern). Eine weitere Funktion ist die Invertierung der Phase. Die Wirkung ist vergleichbar mit dem Umpolen beider Lautsprecherboxen. Bei falscher Polarität ist die räumliche Abbildung verzerrt, die Musik wirkt kraftlos und diffus (Es ist schon vorgekommen, daß bei der CD-Produktion „ungewollt?“ eine Invertierung erfolgt ist). Einige Filter bieten auch eine digitale Lautstärkeeinstellung (durch Bit-Shifting) . Der Nachteil ist, daß mit Verringerung der Lautstärke sich die Auflösung verringert und zwar bei je 6dB Absenkung um 1 Bit. Für High-End ist dieses Verfahren somit nicht geeignet. Im PAPILIO wird ein Digitalfilter neuester Generation DF 1704 von Burr Brown eingesetzt. 

Der DA-Wandler (DAC-Digital-Analog-Converter):

Mit Hilfe des DAC wird das vom Digitalfilter bereitgestellte Datenwort (16, 18, 20 oder 24 Bit) in die äquivalente analoge Größe Strom oder Spannung umgewandelt. Die Datenworte stehen im Takt der Samplingfrequenz  multipliziert mit der Oversamplingrate jeweils für den rechten und linken Kanal parallel zur Verfügung (also 1/fs*8=2,83 µs bei CD). Bei Primitiv-Playern wurde früher, aus Kostengründen, auf den zweiten Wandler verzichtet und sequentiell gewandelt, was zu einem zeitlichen Versatz und damit zu Phasenfehlern von über 80° führte. Später wurde mit Sample & Hold Bausteinen der Analogwert zwischengespeichert und dann parallel freigegeben. Heute werden ausschließlich zwei Wandler eingesetzt.

Die Qualitäten eines DAC werden in den Kenngrößen Klirrfaktor plus Rauschen (THD+N), Linearität  und Dynamikbereich gemessen. Hier muß prinzipiell zwischen zwei Wandlerprinzipien unterschieden werden:
Dem 1Bit-Wandler (Je nach Prinzip auch als Delta-Sigma- oder Bit-Stream  bezeichnet) und dem Parallel-Wandler (auch als Multibit oder R-2R Wandler bezeichnet).

Die 1-Bit-Wandler wurden speziell für Portables- und Low-Cost- HiFi entwickelt. Heute werden sie in fast allen CD und DVD-Playern (bis ca. 700€-Klasse -manchmal sogar bis 2500€) eingesetzt. In diesen hochintegrierten Bausteinen sind das Digitalfilter, die beiden Wandler, der Taktgenerator (externer Quarz) und die zwei Ausgangstreiber mit Analogfilter (oft geschaltetes Filter) enthalten. Dies macht die Bausteine im Verhältnis zu einer Multibitlösung sehr preiswert (ca. Faktor 7 preiswerter als die Multibitlösung ! ).  Außerdem sind nur wenig externe Bauteile erforderlich.
Der Nachteil dieses Verfahrens liegt in der schlechteren Linearität (Frequenzgang) und dem geringeren Störabstand bei der Wandlung kleiner Signale (bei –60dB ca. 18dB). Gerade bei kleinen Signalen reagiert das Ohr sehr empfindlich auf Verzerrungen. Die Kanaltrennung und Intermodulationsfestigkeit ist auf Grund des Aufbaus in einem Chip schlechter. Delta-Sigma-Wandler produzieren auch mehr Quantisierungsrauschen, das aber weitestgehend durch einen umstrittenen Trick (Noise Shaping) aus dem Hörbereich (von ca. 3 kHz auf >10 kHz) geschoben wird. Dieses spezielle (IIR-) Filter reagiert leider empfindlich auf Rundungsfehler. Die intern deutlich erhöhte Taktrate (256-faches Oversampling) macht den 1-Bitler zudem empfindlicher für jitterbehaftete Signale als es die Multibitler sind. 
Auf Grund des integrierten Aufbaus besteht keine Möglichkeit auf die einzelnen Baugruppen von außen einzuwirken (z. B.: Einsatz eines besseren Ausgangs-Operationsverstärkers, oder dasEinstellen anderer Filtereigenschaften).

Preiswerte Parallelwandler haben Probleme mit dem Nulldurchgang (Nulldurchgangsverzerrungen, Wandlermonotonie), das zu sehr störenden Klangeffekten im Kleinsignalbetrieb führt (dynamische Nichtlinearitäten). Die Ursache liegt darin, daß die internen Widerstandsnetzwerke (R-2R) nicht exakt genug abgeglichen sind und zudem unter Temperatureinfluß sich auch noch ändern. Aus diesem Grund kann die Wahl auf diese in der Studiotechnik eingesetzten Wandler nicht pauschal fallen. Die älteren 16 und 18 Bit Wandler sind sicher schlechter als ein heutiger Delta-Sigma mit äquivalenter 18..24Bit Auflösung. Die aktuellen Multibit-Wandler (24Bit) werden in mehreren Qualitätsstufen geliefert (Linearität, THD+N). In High-End Geräten sollten (dürfen) nur die mit der höchsten Stufe zum Einsatz kommen (ca. 3facher Preis zum Standard !), dann ist dieses Prinzip unumstritten das Bessere. Im PAPILIO wird der hochgelobte PCM1704 U-K von Burr-Brown eingesetzt.

Der „Mash-Wandler“ war der erste Versuch die beiden Wandlerprinzipien zu vereinen. In die gleiche Richtung zielt das neue Wandlerprinzip  „Ring-Wandler“ entwickelt von der Fa. dCS (Data Converting Systems). Bei dem Ring-Wandler werden 5-Bit mit 64-fachem Oversampling verwendet. 

Die reale Auflösung (in Bit) hängt ab von den internen Qualitäten des Wandlers, die hauptsächlich ein Fertigungsproblem sind (Abgleich), der Peripherie, und der externen Beschaltung (Spannungsversorgung, Stabilität des Systemtakts (Jitter),  Störeinflüsse von Außen). Durch negative Einflüße können in CD-Playern 4 oder mehr Bits an Auflösung verloren gehen; ganz zu Schweigen von DA-Wandlern die in einem Rechner eingebaut sind (Soundkarten) ! 

Auch wenn auf der CD (nur) 16Bit-Auflösung vorhanden sind, lohnt sich der Einsatz der 24 Bit-Technologie (Digitalfilter + Wandler) vorausgesetzt die Peripherie ist dafür ausgelegt. Bei jedem Wandler geht auf Grund der Konvertierungsungenauigkeit bei niederwertigen Bits die Auflösung verloren, bei 24Bit sind quasi 8 Bit Reserve vorhanden um die volle Nutzdynamik der CD auszunutzen. 

Die D/A-Signalauskopplung:

Bei einem Multibit-Wandler (16..24Bit, R-2R-Wandlung)  wird das noch mit Quantisierungstufen versehene Analogsignal prinzipbedingt als Strom ausgekoppelt. Ein nachfolgender I/U-Wandler aufgebaut mit einem Operationsverstärker übernimmt im Allgemeinen die Umwandlung von einem Signalstrom in eine Signalspannung. An diesen OP werden extreme Anforderungen gestellt. Bei geforderten niedrigen Verzerrungen muß die Bandbreite dieser Stufe bei einem 20 Bit-Wandler 30 MHz (Closed Loop) und bei einem 24 Bit-Wandler sogar 50 MHz, betragen!  Bei gleichzeitig geforderten Audio-Eigenschaften (geringer Klirr und weiches Klirrspektrum) ist die Auswahl sehr gering und dementsprechend teuer. Der üblich eingesetzte Standard-OP für 1,-€ erfüllt diese Anforderungen nicht. Weitere Probleme an diesem neuralgischen Punkt sind Umschalt-Signalstörspitzen (Glitches) am Wandlerausgang, die wirkungsvoll unterdrückt werden müssen. Alternativ kann auch wie im PAPILIO eine passive Wandlung durchgeführt werden, die diese Probleme geschickt umgeht. Der OP und die Peripherie müssen natürlich auch hier speziell für diese Aufgabe angepaßt sein. 

Das Analogfilter:

Das nachgeschaltete Analogfilter (Rekonstruktionsfilter) hat quasi die Aufgabe die Treppenstufen des Ausgangssignals (Oberwellen) glattzubügeln, bzw. HF-Störungen, die aus dem Taktsignal des Wandlers stammen wegzufiltern. Je höher die Samplingfrequenz (44,1/48/96/192 kHz), und der Grad des Oversamplings (4 oder 8 fach) sind, umso höher kann die Grenzfrequenz des Tiefpaßfilters gewählt werden. Im Allgemeinen ist hier ein weiterer OP eingesetzt, der als Filter 2. oder 3. Ordnung (12/18 dB/Oktave) beschaltet wird. Die klanglichen Qualitäten sind abhängig von der Qualität des OP`s und der gewählten Grenzfrequenz und Filtercharakteristik. Eine zu niedrige Grenzfrequenz sowie ein steiler Übergang vom Durchlaß- zum Sperrbereich des Filters (z.B. Tschebyscheff) haben eine negative Beeinflussung im Hörbereich zur Folge (Welligkeit der Amplitude, Phasenverzerrungen, schlechtere Impulswiedergabe). Im PAPILIO wird ein passives Bessel-Filter 3. Ordnung eingesetzt, das prinzipbedingt keine weiteren Klangverfälschungen verursacht (konstante Gruppenlaufzeit => Phase über der Frequenz ist konstant, keine weitere Klirr- und Rauschquelle).

Die Analoge-Ausgangsstufe:

Die wenigsten CD-Player haben eine zusätzliche hochwertige Ausgangsstufe. Wenn diese überhaupt vorhanden ist, so ist sie mit einem preiswerten OP ausgestattet, der sich oft als klangliche Schwachstelle entpuppt. Die gleichspannungsfreie Auskopplung wird meist über einen Elko vorgenommen. Hinter dieser Stufe ist im Allgemeinen noch eine mit Transistoren aufgebaute Mute-Schaltung, die Klickgeräusche beim Ein / Ausschalten verhindert, untergebracht. Besser ist es hier eine diskrete Treiberstufe in Class-A-Betrieb einzusetzen, die am Ausgang keinen Kondensator benötigt (DC-Kopplung, auch gute Elkos vermindern drastisch die Feindynamik). Professionelle Mute Schaltungen benutzen Relais, die den Ausgang  gegen Masse ziehen, Transistoren bringen zusätzlich Rauschen. 

Die Spannungsversorgung:

Bei einer gewünschten hohen Dynamik von über 90 dB muß die Versorgungsspannung insbesondere für die D/A-Wandler extrem sauber sein. Da die Referenzspannung des Wandlers daraus gewonnen wird muß diese Rauscharm sein. Analoge- und digitale Baugruppen müssen jeweils aus einer separaten Quelle gespeist werden, damit möglichst wenig HF-Störungen  (Hochfrequenz) die Analogbaugruppen stören können. Digitale Baugruppen mit unterschiedlichen Aufgaben (Steuerung, Regelung, Taktgenerator, Wandler) müssen über eigene Spannungsregler versorgt werden. Der Strombedarf ist hier sehr unterschiedlich. Während die Servo- und Antriebs-Regelung Ihren Bedarf bei unterschiedlichen niedrigen Frequenzen hat (Ausgleich von Höhenschlag und Excentrizität der CD), wird von der Digitalelektronik viel Strom bei hohen Frequenzen benötigt (Stromspitzen im HF-Bereich). ->Signalverwirrung. Zudem wird bei CD-Playern noch das Anzeige-Display getacktet (Multiplexbetrieb). Minimalste Masseausgleichströme (gegenseitige Beeinflussung der Baugruppen) durch ungünstige Masseführung gefährden zusätzlich die Dynamik.
Ideal sind externe Netzteile oder eine Akkuversorgung. All dieser Aufwand ist aber aus Kostengründen sehr selten anzutreffen ! 
Bei 24Bit Auflösung entspricht dem niederwertigstem Bit eine Spannung von <1µV ! Tatsache ist dass fast alle CD-Player und Wandler auf Grund einer sparsamen und falsch dimensionierten Stromversorgung gerade mal eine Auflösung von 10-12 Bit aufweisen. Gerade bei CD/DVD/SACD-Playern ist dies der Fall, da dort noch die Störspannungen des Motors und des Servos u.s.w. rumgeistern. 

Das externe CD-Laufwerk:

Ein reines CD-Laufwerk enthält in einem Gehäuse die Laufwerksmechanik (Frontlader- oder Toplader-Ausführung) mit der Steuerelektronik (Steuerprozessor für die Antriebssteuerung und Regelung), der Bedienungssteuerung (Tastatur und Fernbedienung) und das Netzteil. Der Steuerprozessor liefert ein digitales Ausgangssignal (serielle Schnittste S/P-DIF), das alle Nutzdaten und Steuerdaten (Clock) zur Weiterverarbeitung in einem externen Wandler enthält. Das Digital-Laufwerk verhält sich klanglich wie ein analoges Laufwerk, es bestimmt also die Energieverteilung, das Timing und den Fluß der Musik maßgeblich. Die wichtigsten Kriterien hierfür sind eine möglichst fehlerfreie Abtastung gesteuert von einem konstantem Takt, so daß am  Digitalausgang ein jitterarmes Datensignal zur Weiterverarbeitung in einem externen DAC bereitgestellt wird. 

Der Digitalausgang: 

Dieses Digital-Schnittstellensignal ist im s.g. DOBM Format (Digital out Biphase Mark) codiert. Diese standardisierte, asynchrone, serielle Schnittstelle ist als asymetrisches-Format unter S/P-DIF (Sony/Philips-Digital-Interface-Format) für den Konsumerbereich als symmetrisches-Format unter AES/EBU (Audio-Engeniering-Society / European-Broadcasting-Union) für den Studiobereich festgelegt. Der S/P-DIF-Standard ist mit einer Ausgangsimpedanz von 75 Ohm +/-20 % und der Pegel auf 500 mVss mit einer Steilheit von 5-30 ns festgelegt. Der AES/EBU-Standard  ist mit einer Ausgangsimpedanz von 110 Ohm +/-20 % und der Pegel auf 3-10 Vss mit einer Steilheit von 5-30 ns festgelegt. Bei AES/EBU wird als Steckverbindung der Studio-Standard XLR (3polig) verwendet, bei S/P-DIF wird eine Cinch-Buchse als Ausgang benutzt. Optische Ausgänge (über Lichtwellenleiter) werden üblicherweise über TOSLINK (von Toshiba), selten über den ST-Standard (von AT&T) bereitgestellt. Proffessionelle Geräte bieten zusätzlich einen 75 Ohm BNC- Ausgang (Meßgerätestandard). Die CD-Datenübertragungsrate beträgt 2,8224 MBit/s (2 * 32Bit * 44.1kHz), die hier anstehende Frequenz ist der doppelte Wert der Datenbertragungsrate 5,6448 MHz.

Die Qualität des Digitalausganges ist sehr stark von der Qualität des Ausgangstreibers abhängig. Dieser muß ein möglichst steiles, rauscharmes Signal bereitstellen. Je steiler der Impuls, desto zeitgenauer kann die Übertragung erfolgen. Bei üblichen CD-Playern wird das Signal nur mit einer unzureichenden Signalform (Bandbreitenbegrenzt) zur Verfügung gestellt. Meist über einen minderwertigen Übertrager ausgekoppelt, so daß nachfolgende hochwertige Signalkabel und DA-Wandler nicht ihre volle Qualität zum Ausdruck bringen können.

Optische Ausgänge können Signale prinzipbedingt nur mit geringerer Steilheit bereitstellen (20-30 ns). Die Signalverluste der normalen Sende- und Empfangsdioden (LED´s), die Brechungs- und Streuverluste der Stecker, sowie der Kunststoff Lichtwellenleiter sind relativ hoch. All dies kann Daten-Jitter erzeugen, der die Ursache für die geringere Klangqualität ist. Besser, aber wesentlich teurer, sind Laser-Dioden mit Glasfaserleitern (ST-Standard).

Der neue Standard zur Übertragung von digitalen SACD und DVD-A  -Daten heist Fire-Wire.

Durch einen unzureichenden Digitalausgang, kombiniert mit schlechten, langen Kabel, kann Daten-Jitter bis zu einigen Nanosekunden (1-5 ns) entstehen ! 

Die Digitalleitung:

Der s.g. Wellenwiderstand der Coax-Signalleitung muß der Ausgangsimpedanz des Senders entsprechen (75 Ohm), ansonsten entstehen Reflexionen und damit Jitter. Entsprechendes gilt für die Studioleitung (110  Ohm), die als abgeschirmte verdrillte Zweidraht-Leitung ausgelegt ist. Da das Digital-Audio-Signal entgegen den HF-Signalen in der Funktechnik aus energiereichen Rechteck-Impulsen (hohe Steilheit) besteht, kommt es bei diesen Kabeln sehr auf die mechanische Stabilität, bzw. gutes mechanisches Dämpfungsverhalten (Mikrofonie) des Leiters sowie der Steckverbindung (BNC) an (=Jitterarm). Die Signalbandbreite muß sehr hoch sein. (Niedriger Kabel- Widerstand, Kapazität und Induktivität). Das Kabel sollte nur minimal rauschen. Aufgrund der Steilheit der Signale (bei S/PDIF ca. 5-10 ns -> 50...100 V/µs) ergibt sich eine Signalbandbreite von über 100 MHz ! Eine sehr gute Abschirmung ist also unumgänglich. Da bei hohen Frequenzen die Energie im Dielektrikum gespeichert wird, hat sich hier das hochwertige Teflon (PTFE) bewährt. Noch besser währe Luft!

Die klanglichen Unterschiede bei Digitalleitungen können ähnlich dramatisch ausfallen wie bei Analogleitungen. Die Preisspanne liegt zwischen ca. 50-2000€! Nach unserer Erfahrung ist die Qualität der Leitung weit weniger kritisch wenn der Eingang des DAC mit einem sehr schnellen Komperator ausgerüstet ist (siehe PAPILIO), der das Signal für den Empängerbaustein aufbereitet.

Die bei Bastlern (DIY) wohlbekannten Industie- und Militär- Standardleitungen (75Ohm: RG 59 U oder B/U, RG11 U, RG 187 A/U, RG 179 B/U, oder sogar 50Ohm: RG 142 B/U, RG 178 B/U, RG188 A/U ...) werden von guten Digital-Audioleitungen wie unserer NEXUS-SPDIF bei weiten übertroffen. Es gibt aber auch Hersteller deren Leitungen Baugleich den o. g.,  aber wesentlich teuerer sind. Einige Hersteller erklären sogar, dass ihre Wunder-Leitung sowohl für NF, Digital und auch Netzversorgung perfekt ist!. Das Märchen vom "Vollwaschmittel", bzw. dem "Allekleber" wird auch bei Audio fortgesetzt. 

Der externe DA-Wandler (DAC):

Ein externer DA-Wandler besteht aus folgenden Baugruppen: dem Empfänger (Receiver) für das S/P-DIF-Signal, dem Wandler mit Digitalfilter und Signalauskopplung, dem Analogfilter, dem Analogausgangstreiber und natürlich der Spannungsversorgung für die jeweiligen Baugruppen. Wie schon beschrieben kann 
die Wandlerbaugruppe als preiswerte integrierte Lösung mit einem 1-Bit-Wandler oder als diskrete Lösung mit Multibitwandlern aufgebaut sein. 
Der Receiver ist für die Rückgewinnung des vom Laufwerk gelieferten Systemtaktes (Clock), bei gleichzeitiger Aufschlüsselung der Nutzdaten zuständig. Diesem neuralgischen Punkt muß besondere Aufmerksamkeit hinsichtlich Jitterarmut gewidmet werden, da dieser Takt die Basis für die nachfolgende Digitalfilterung und Wandlung ist. Die Voraussetzung dafür ist ein professioneller Receiverbaustein, dessen eingebaute PLLexakt auf den Datenstrom einrastet. Unterstützt werden muß dies durch eine rauscharme Versorgungsspannung und ein zuvor aufbereitetes S/P-DIFSignal, (Leitungsempfänger, Komperator) das eine möglichst hohe Steilheit und Rauscharmut haben muß. Ein Übertrager am Eingang sorgt dafür, daß keine niederfrequenten Masseausgleichströme zwischen Laufwerk und Wandler fließen. Werden all diese Maßnahmen nicht eingehalten ist mit dem besten nachfolgenden Wandler keine klangliche Steigerung zu erwarten! Am Ausgang des Empfängers stehen der Master-Clock, die Musikdaten und die Steuerdaten (Byte-Clock, Word-Clock) für das nachfolgende Digitalfilter bereit. Im PAPILIO wird ein Receiverbaustein neuester Technologie der Firma Crystal (CS 8414 bzw. 8420) eingesetzt.

Die Vorteile eines externen Wandlers liegen in der räumlichen Trennung von Laufwerksmechanik und der damit verbundenen Vibrationsarmut, der separaten  Stromversorgung, sowie der geringeren Beeinflussung durch fremde digitale Störsignale der Wandlerelektronik und umgekehrt. Zusätzlich kann der externe Wandler auch mit Daten anderer Quellen gespeist werden, z.B. DAT. Oft wird auch die Aufwertung eines betagten CD-Players, mit veralteter Wandlertechnologie, aber robuster und hochwertiger Laufwerksmechanik angepriesen. Letzteres funktioniert allerdings nur wenn auch der Digitalausgang und der interne Systemtakt hochwertig sind. Dies kann allerdings nachgerüstet werden. Beim gleichen Tuning-Einsatz können dann auch noch andere sinnvolle Modifikationen und ein Abgleich der Laserelektronik durchgeführt werden.

PLL (Phase-Locked-Loop):

Diese Schaltung triggert auf die mit Rausch- und Daten-Jitter verschmutzten Flanken (Phase) des einlaufenden Rechtecksignals. Der Daten-Jitter darf laut AES-Vereinbarung bis zu 80 ns (Spitzenwert) betragen, dies entspricht etwa 13 ns-RMS (Effektivwert). Zum Glück liegt er aber im Allgemeinen mit maximal ca. 1ns-RMS weit niedriger. Die PLL filtert diese Schwankungen aus, indem über eine Vielzahl von einlaufenden Flanken gemittelt wird. Die Filterung wird durch eine geschlossene Kontroll-Schleife (Locked-Loop), mit möglichst geringer Bandbreite erreicht. Auf diese Weise wird eine Jitterunterdrückung von ca. Faktor 100-130 erreicht, so daß ein maximaler Jitter von ca. 100-200 ps (Spitzenwert) übrigbleibt.

Verbesserung der kritischen S/P-DIF Datenschnittstelle:

Der kritische Punkt der asynchronen S/P-DIF Digitalschnittstelle ist die Rückgewinnung des im DAC benötigten Systemtaktes aus dem im CD-Laufwerk generierten Datenstrom (Daten-Jitter-Problematik). Eine Verbesserung (Daten-Jitter-Reduzierung) kann hier ein s. g. Clock-Link bringen (AES2-Standard). Hierbei wird der Systemtakt im DAC erzeugt und über eine zweite Datenleitung zum CD-Laufwerk zurückgeführt. Der hier vorhandene Taktgenerator wird entweder deaktiviert oder mit dem Takt des DAC synchronisiert.
Ein weiterer Weg ist,  nicht die vom Laufwerk gelieferten Daten als S/P-DIF Signal im DOBM-Format sondern die hier integrierten Daten (4-Signalleitungen: Daten, Datenworttakt, Clock und Masse ) getrennt vom Laufwerk zum DAC zu übertragen (I²S für interne Verbindungen im CD-Player, bzw. I²S-enhanced für Verbindung zum Laufwert). In beiden Fällen ist für die Zusammenarbeit eine Kompatibilität von Laufwerk zu Wandler erforderlich (Nur bei Geräten von einem Hersteller möglich).
Unser Laufwerk ORIGO ist mit dieser Schnittstelle verwirklicht. Ein möglichst kurzes und hochwertiges Spezialkabel ist auch hier erforderlich. 

Quantisierung:

Das binäre Datenwort mit 16 Bit teilt eine analoge Größe (Spannung, Strom) in 216 = 65 536 Stufen auf, bei 24Bit sind dies 16 777 216 Stufen! Bei den üblichen maximalen Ausgangsströmen von ca. 1 mA ist der kleinste Wert ca. 60 pA ! oder bei 1V 60 nV ! Da kann man sich gut vorstellen das diese Auflösung nicht bis zum Ohr erhalten werden kann. Einige Bits fallen dem Rauschen zu Opfer.

PCM
Abkürzung für Puls-Code-Modulation. Dies ist in den Aufnahmestudios die Standarttechnik der digitalen Signalverarbeitung bzw. Aufzeichnung. Ein analoges Signal wird im Takt der Abtastfrequenz (Samplingfrequenz) erfasst und der dazugehörige Amplitudenwert als digitaler Wert mit einer bestimmten Quantisierung (16, 20 oder 24Bit) binär-codiert abgelegt.
Die PCM-Technik arbeitet mit absoluten Werten. Daher bleibt der Quantisierungsfehler abhängig von der Wortlänge konstant. Bei kleinen Pegeln stehen daher nur wenige Bits zur Verfügung. Dort ist der Quantisierungsfehler gegenüber dem Nutzsignal am grössten, was sich  klanglich sehr negativ bemerkbar machen kann, da ja auch noch die Problematik Rauschen hinzukommt. 

Die AD-Wandlung bei der Aufzeichnung:
Am Anfang einer digitalen Signalkette steht der AD-Wandler. Seit Mitte der neunziger Jahre benutzt man in modern ausgerüsteten Aufnahmestudios dazu ausschliesslich sogenannte Sigma-Delta-Modulatoren.

Dies ist eine Konverterschaltung, die ein beliebiges, bandbegrenztes analoges Eingangssignal in ein digitales 1-bit Ausgangssignal wandelt (mit 64 fachem Oversampling fs*64). Das Ausgangssignal wird dabei durch das Eingangssignal in der Pulsdichte moduliert. Die Pulsdichte des 1-Bit-Ausgangsignals steht dabei in direkter Relation zur Amplitudenänderung des Audiosignals; je grösser das Delta (Amplitudenänderung), umso höher ist die Auflösung.

Für die Verarbeitung und Aufzeichnung in PCM-Technik wird nun der hochgetaktete 1-Bit Datenstrom des Wandlers im s.g. Decimationfilter (digitales Filter) auf die Samplingfrequenz und Auflösung von CD, DVD umgerechnet. Integriert ist gleichzeitig das in der PCM-Technik benötigte Anti-Alias-Filter bei der halben Samplingfrequenz. Dieses Filter ist nötig weil der AD-Wandler Signale mit einer Eingangsfrequenz größer der halben Abtastfrequenz falsch (als Signal tieferer Frequenz) wandeln würde.

Die DA-Wandlung beim Abspielen:
Das Multibit-PCM Signal vom Datenträger wird g.g. über ein Interpolationsfilter "upgesampelt" und mit einem Parallelwandler oder sehr oft wieder mit einem Delta-Sigma-Wandler in eine analoge Spannung umgewandelt.

Sampling-Frequenz, Abtastfreuqenz (fs):

Beschreibt das Zeitraster in dem die Abtastwerte (Datenwörter) vorliegen. Für die Abtastung einer analogen Spannung mit einer Frequenz von 20 kHz muß mindestens die doppelte Abtastfrequenz angewandt werden (Abtasttheorem nach Shannon). Bei der CD wurde 44,1 kHz gewählt. Dies entspricht einer Zeit von ca. 22,7 µs zwischen den Samples. Je höher die Frequenz bzw. je kürzer die Zeit ist, umso genauer wird die Kurvenform erfaßt. Das Ohr kann Zeitdifferenzen von ca. 10µs auswerten! Die neue Festlegung von 96 kHz für DVD ist ein sinnvoller Wert. Für DVD-A (für Audio) sind 192kHz festgelegt worden. Eine Verbesserung ist nur bei konsequenter Umsetzung zu erwarten.
Wichtig für die richtige Rekonstruktion der Kurvenform ist neben dem richtigen Amplitudenwert (auch bei kleinsten Signalen, Problem Rauschen), daß diese immer zum exakt gleichen Zeitpunkt vorliegen (Problem Jitter), ansonsten entsteht eine Abweichung der Kurvenform und das bedeutet Klirr ! 

Up-Sampling:

Beim Up-Sampling werden z.B. 16Bit codierte Datenwörter im Takt von 44,1 kHz empfangen und neue Datenwörter von z.B. 24 Bit im neuen Zeitraster von 96 kHz ausgegeben. Um dies zu ermöglichen, muß eine bestimmten Anzahl von Daten zwischengespeichert werden. Aus dem Verlauf der Daten (Hüllkurve) werden mit Hilfe ausgeklügelter Algorithmen und DSP´s (Digital-Signal-Prozessoren) die Zwischen-Abtastwerte errechnet (Interpolationsfilter). Dies ist  im oberen Frequenzbereich schwieriger, da dort immer weniger Werte (Stützpunkte) zur Verfügung stehen. Eine falsche Interpolation ist für das Ohr kritischer als fehlende Werte, oder das Einsetzen des Vorgängerwertes. Dieser D/D-Converter wird zwischen der digitalen Quelle und dem DAC geschaltet. (Siehe auch Sample-Rate-Converter). Dieses Hochrechnen auf einen neuen Systemtakt erfordert natürlich einen eigenen hochpräziesen jiatterarmen Taktgenerator. Anders als beim Oversampling  ist es nämlich nicht ein ganzzahliges Vielfaches der Samplingfrequenz (z.B. 8*44,1) sonder eine krummer Wert (z.B. 96/44,1 = 2,18*fs). Man bezeichnet dieses verfahren auch als Re-Sampling

Unsere Hörtests (mit dem dCS-PURCELL + dCS-Elgar bzw. und dem dCS-PURCELL + PAPILIO) ergaben, daß die Erhöhung der Samplingfrequenz von 44,1auf 96 kHz eine deutliche Steigerung ergab, während eine zusätzliche Erhöhung der Quantisierung von 16 auf 24 Bit nur eine geringfügige Verbesserung bewirkte. Eine Vorführung auf der High-End 99 zeigte deutlich, daß ein Up-Sampling von CD- auf DVD- Format mit einem Profi-CD-Laufwerk als Quelle dem DVD-Player überlegen war, auch wenn beide über den gleichen externen Wandler liefen (Laufwerks-, Jitter- Probleme ?). Eine weitere Erhöhung auf 196kHz (DVD-Audio Standard) brachte kaum wahrnehmbare Veränderungen, was sicher am nicht optimalem Aufbau lag. 

Down-Sampling:

Der umgekehrte Weg wird in den Aufnahmestudios angewandt um aus 24 Bit / 96 kHz A/D-gewandelten Aufzeichnungen die 16 Bit / 44,1 kHz nach CD-Norm zu berechnen. Die dabei überzähligen Bits werden nicht gekappt, sondern über Noise-Shaping und Zumischung von Dither (ein quasi-analoges Rauschsignal) klangschonend gerundet. Nur wem diese Technik bekannt ist kennt auch den umgekehrten Weg! Ansonsten kann nur eine Annäherung erfolgen, da es mehr oder weniger zum Ratespiel wird.

HDCD (High Definition Compatible Digital):

Das bekannteste Verfahren zur Steigerung der CD-Auflösung wurde von der amerikanischen Firma Pacific Microsonic entwickelt. Hier wird das 16 Bit Ausgangsmaterial auf 96 kHz / 24 Bit D/A-gewandelt, im Bereich besonders hoher und schwacher Pegel neu berechnet (mit Dither versehen) und nach einer dynamisch optimierten Digitalfilterung im üblichen Format mit 44,1 kHz / 16 Bit auf die CD gebrannt. Bei der Wiedergabe wird die im Audiosignal verschlüsselte Anweisungmit mit Hilfe des HDCD-Chips (Digitalfilter) nahezu verlustfrei rekonstruiert. Dieses Verfahren soll der CD eine Dynamik von 20 Bit verleihen. CD-Player die diesen Chip nicht haben (Lizenzgebühr), können die HD-CD´s zwar absypielen, die klanglichen Vorteile aber nicht voll nutzen. 

Sample-Rate-Converter:

Mit Hilfe dieses D/D-Konverters werden Daten im Zeittakt von z.B. 32, 44.1 oder 48 kHz empfangen und z.B. im 96 kHz Format ausgegeben. Der Ursprung dieser Geräte liegt im Studiobereich, indem Signale verschiedener Geräte mit unterschiedlichen Samplingfrequenzen gemischt werden. Durch den Einsatz eines eigenen, erforderlichen Taktgenerators wird (wenn dieser hochpräzise arbeitet) eine deutliche Jitter-Unterdrückung erreicht, daher werden diese Baugruppen auch in s.g. Jitter-Bugs eingesetzt. Die Erhöhung der Samplingfrequenz verringert zusätzlich die Problematik mit dem Analogfilter am Ausgang des DA-Wandlers (Siehe Oversampling). 

Praktische Voruntersuchungen mit dem Chip (Crystal 8420 von Ende 1999) haben ergeben daß das Up-Sampling (von 44,1 auf 96 kHz) nicht zwangsläufig mit einer deutlichen klanglichen Verbesserung verbunden ist. Ein Grund hierfür ist wohl das integrierte Digitalfilter. Dieses sorgt für eine radikale, harte Bandbreiten-Begrenzung in Abhängigkeit der Eingangsfrequenz (bei CD -110dB bei 20 kHz), so daß ein nachfolgendes Digitalfilter keinen nennenswerten Einfluß mehr nehmen kann. Die Notwendigkeit eines sehr guten (jitterarmen) Quarzgenerators bestätigte sich. Ein probeweise eingesetzter industrieller Standard-Quarzgenerator bewirkte eine sofort hörbare Verschlechterung. Möglich ist auch, daß der  intern verwendete Up-Sampling-Algorithmus (Berechnung neuer Samples), der eine entscheidende Rolle bei die Klangqualität spielt, noch nicht optimal arbeitet. Die jahrelange Erfahrung der in der Studiotechnik etablierten Fa. dCS ist wohl noch nicht erreicht.

Mitlerweile (seit Anfang 2000) gibt es den CS 8420 in der Version D. Das Klangbild ist jetzt ausgereifter.

Upsampler und Wandler die den DVD-A-Standard (24Bit / 192 kHz) benutzen benötigen eine spezielle Datenverbindung. Vorübergehend wurden 2 XLR-Verbindungen benutzt (dCS). Mitlerweilen hat sich als Verbindungsleitung der Fire-Wire-Standard etabliert.

Oversampling (Überabtastung), Re-Sampling:

Dies ist ein Hochtransformieren auf eine höhere Taktfrequenz (4 oder 8 mal fs), ohne das neue Zwischenwerte berechnet werden (keine Signalverbesserung). Dieser Trick wird (im Digitalfilter) angewandt damit das entstehende Störspektrum beim späteren DA-Wandeln weiter entfernt vom genutzten Audioband (bis 20kHz) liegt. Das nachfolgende Analogfilter kann dann einfacher und mit weniger Fehlerrückwirkung aufgebaut werden.

DSP (Digital-Signal-Processor):

Ein DSP ist ein Rechnersystem das im wesentlichen aus folgenden Baugruppen besteht: dem DSP-Chip (µ-Prozessor), einem Programmspeicher (E-PROM) für den Rechenalgorithmus und dem Taktgenerator. Der Prozessor ist mit einem speziellen Befehlssatz ausgestattet um komplexe mathematische Berechnungen extrem schnell (in Echtzeit) durchzuführen. Obwohl diese speziellen Prozessoren während eines Programmschritts gleichzeitig auf Daten- und Adreßbus zugreifen können, also parallel mehrere Zyklen verarbeiten, reicht die Rechenleistung eines µP´s oft nicht aus, so daß zwei sich die Arbeit teilen müssens ! Das Einsatzgebiet in der Audiotechnik liegt hauptsächlich beim Filtern digitaler Musikdaten. Diese Filteraufgaben sind: Over-, Up- und Down- Sampling, Sample-Rate-Konvertierung, Tief-, Hoch- ... Filter, Lautstärkeeinstellung ... 
Der Vorteil ist natürlich daß die Filterprogramme ausgetauscht werden können ohne das die Hardware (andere integrierte Bausteine) sich ändert muß. Es können Filter-Algorithmen verwirklicht werden, die als Chip (in Hardware gegossen) „noch“ nicht erhältlich sind!  Der Nachteil ist ein größerer Hardwareaufwand und Preis.

Dither:

In der digitalen Studiotechnik ist Dither das Zauberwort für guten Klang. Im Prinzip ist Dither ein zufälliges digitales Rauschsignal, das dem Datenwort zugemischt wird, um Rundungsfehler, die zwangsläufig bei einer begrenzten Binären-Auflösung entstehen, zu kaschieren. Eingesetzt wird Dither z.B. im Studio beim Abmischen digitaler Quellen, beim Down-Sampeln von einer 20- oder 24 Bit Aufnahme auf das 16 Bit CD-Format und beim Up-Sampeln von 16 Bit auf 20- oder 24 Bit im Digitalfilter vor dem Wandler. Natürlicher-Dither entsteht z.B. durch thermisches Rauschen im Wandler und Digitalfilter. Das Rauschen steigt mit der Temperatur, so daß dies wohl die Hauptursache dafür ist, daß Digitalgeräte erst nach einer längeren Aufwärmphase  „analog bzw. warm“ klingen. 
Dither im richtigem Maß (nicht zu viel, aber erst recht nicht zu wenig) ist entscheidend verantwortlich für die „Athmosphäre“ der Musikwiedergabe. 

Signalverwirrung:

Im CD-Player oder externen Wandler werden verschiedene Signale mit unterschiedlichen Frequenzen verarbeitet. Der Systemtakt (Clock) ist das 256-, 384- oder 512-fache der Samplingfrequenz. Bei CD`s mit fs = 44,1 kHz ergeben sich hieraus Frequenzen von: 11.289, 16.934 oder 22.579 MHz. Weitere Vielfache der Samplingfrequenz:  Bit-Clock = 64*fs = 2,822 MHz, Word-Clock = 8*fs = 352.8 kHz, 2*Fs zur R/L-Umschaltung und das S/P-DIF (DBM) Signal für den Digitalausgang = 2*Bit-Clock = 5,6448 MHz. Dazu kommen Frequenzen des Prozessors zum Steuern und Regeln des Laufwerks und die Multiplexfrequenz des Anzeigedisplays. Bei einem DVD-Player kommen zusätzlich noch die Frequenzen für die Bildverarbeitung hinzu (27 MHz).

Jitter-Bugs (Jitter-Killer, Jitter-Absorber, JISCO):

Diese Geräte liegen im digitalen Signalweg zwischen Quelle (CD, DAT ...) und dem externen D/A-Wandler. Mit ihnen werden kleine Taktfehler behoben. Diese können bereits bei der Aufnahme entstanden sein, z.B. im DAT-Recorder. Beim Eingangssignal (DOBM-Signal) sind Takt und Daten gemischt. Der Takt wird separiert, gleichmäßiger (frequenzstabiler) wiedergegeben und die Daten dann wieder taktgenau damit verknüpft. Jitter-Killer können helfen, sind aber kein Allerheilmittel. Lieber von vornherein Fehler vermeiden ! 

Das neueste Produkt in dieser Sparte ist der "Jisco" - JItter Scrambling deCOrrelator.
Hier wird dem verjitterten Eingangs-Signal eine wohldosierte Portion hochfrequenten, dekorrelierten und somit - laut Herstellerangaben - klanglich harmlosen Jitter beimischt. Die Empfänger-PLL wird mit einem in höhere Regionen transformiertem Jitter überlistet (Die PLL-Filterung ist wirksamer), so das der empfangene Systemtakt jitterreduziert ist.
Der Jisco funktioniert unabhängig vom Samplingtakt.
Unsere Tests mit dem JISCO brachten folgende Erkenntnis: Wird ein "Billig-Player"als Quelle benutzt, so wird die Wiedergabe deutlich aufgewertet. Es wird aber nicht die Qualität erreicht, die mit einer guten Laufwerk/Wandler-Kombination (z.B. ORIGO/PAPILIO) möglich ist. Wird er hier zusätzlich eingesetzt, so ist die Steigerung nachvollziehbar, aber nicht mehr sehr groß.
Fazit:Je besser Laufwerk und Wandler zusammenpassen um so eher kann man auf ihn verzichten. Bei 
schlechten Laufwerken kann er keine Wunder vollbringen. Die Musikwidergabe wird aber stets detailreicher, räumlicher und seidiger in den Höhen - eben analoger ! 
Es wird eine der vielen Jitterquellen bekämpft. Es bleiben noch die Jitterquellen im DAC und die schlechte Taktquelle in den meisten Laufwerken.

Lautstärkeeinstellung:

In CD-Playern oder externen-DAC´s werden verschiedene Verfahren zur Lautstärkeeinstellung (üblicherweise per Fernbedienung) angewandt:

Analoge Lautstärkeeinstellung mit einem manuellen-, oder mit einem Motor-Potentiometer. Hier wird die Achse des Potis (einstellbarer Spannungsteiler) manuell, oder mit einem Gleichstromgetriebemotor bewegt. Probleme haben professionelle Potis (z.B. Alps, Noble, Panasonic) nur mit dem Hinzufügen von etwas Rauschen und dem Gleichlauf (rechts/links-Abweichung), der in der Nähe der Nullstellung am größten ist. Tolerierbare  Gleichlaufabweichungen liegen bei 0,5-1dB (ca. 5-10%) bei einer Spannungsteilereinstellung bis -60dB (1/1000 des Maximalwertes). Diese Methode ist gut und teuer. Die Qualität ist natürlich auch abhängig vom Einsatzort des Potis. In einigen CD-Playern wurde schon beobachtet, daß dieses Poti direkt am Analogausgang angeordnet war. Dieser grobe Fehler, zudem auch noch mit billigen abgeschirmten und quer durchs Gerät verdrahteten Signalkabeln, führt dazu, daß der Ausgangswiderstand sehr hoch liegt (bis 10kOhm) und abhängig von der Poti-Einstellung ist. Der Einsatz eines hochwertigen externen Kabels erübrigt sich dann ! 

Anmerkung zum Spannungsteiler mit Drehschalter: Bei dieser Variante des Potis wird eine Kette von Widerständen aufgebaut. Über einen Drehschalter wird der Spannungsabgriff (Lautstärke) vorgenommen. Gelobt wird diese Variante auf Grund ihrer hohen Genauigkeit (Gleichlauf). Es ist aber zu bedenken, daß hier eine Vielzahl von Metallfilm-Widerständen (16-30 Stufen sollten es schon sein) und mindestens die gleiche Anzahl von Lötstellen in Reihe angeordnet sind und dies bedeutet wieder eigene Probleme! Die konsequente Lösung ist das Umschalten von z.B. 16 festen Spannungsteilern mit somit nur 2 möglichst hochwertigen Widerständen in Reihe. Dies wird durch einen Drehschalter mit 2-Ebenen (pro Kanal) erreicht. Diese Lösung ist natürlich sehr kostenintensiv und nicht fernbedienbar (Hersteller z.B. : DACT, Goldpoint). Gleiche Präzision, bei vergleichbarem Preis, wird mit Potis von Penny & Giles erreicht.

Digitale-Lautstärkeeinstellung durch Bit-Shifting durchgeführt im Digitalfilter. Der Nachteil ist, daß mit Verringerung der Lautstärke Auflösung verlorengeht, und zwar bei je 6dB Absenkung um 1 Bit. Dieses sehr preiswerte Verfahren ist für High-End somit leider nicht geeignet.

Quasi-Analoge-Lautstärkeeinstellung mit einem digitalen-Poti. Diese integrierten Bausteine beherbergen eine Kette von Widerständen. Der gewünschte Teilungswert (in 0,5 dB Schritten) wird durch Eingabe eines binären-Datenwortes über einen Steuerprozessor ermöglicht. Intern werden Halbleiterschalter (MOS-FETs) zum Schalten des Abgriffs verwendet. Der Vorteil ist die sehr geringe Kanalabweichung (Gleichlauf 0,05 dB). Diese Bausteine sind deutlich preiswerter als ein professionelles Motorpoti. Der Nachteil ist das hier wieder eine Digitale-Schnittstelle zur Audiowelt existiert. Störungen über die Masse und über die Betriebsspannung sind nicht ausgeschlossen. Außerdem sind auch die professionellsten Bausteine, die in namhaften US-Geräten eingesetzt werden, nicht frei von Verzerrungen und Rauschen. Die Schwachstelle ist wohl hauptsächlich der intern als Ausgangstreiber eingesetzte OP,  der zudem von zweifelhafter Audio-Qualität ist. Im Vergleich zum Analog-Poti hat es bei uns nur den Platz 2 eingenommen.

Bei DSD-Daten (SACD) ist die Lautstärkeeinstellung problemlos. Es muss nur die Referenz-Gleichspannnung am Wandler eingestellt werden. Dies hat keinen Einfluss auf die Auflösung, sondern nur auf die Höhe der "digitalen Trepenstufen".

DSD (Direct Stream Digital)

Die AD-Wandlung bei der Aufzeichnung:
Dies s.g.. Bitstream-Verfahren benutzt direkt den bei der Aufnahme mit Sigma-Delta-Modulatoren (mit 64fachem Oversampling) entstandenen Datenstrom als Aufzeichnungsformat.

Der Datenstrom hat eine beindruckende Bitrate von 2,8224Mbits/s (44,1 kHz mit Faktor 64). Die nach der 1-Bit Wandlung bestehenden Rauschanteile werden durch Noiseshaping in Bereiche ausserhalb des Audiobandes verschoben. Der hochgetaktete 1-Bit Datenstrom wird bei DSD direkt auf ein Speichermedium plaziert (SACD).

Auf Grund der hohen Bandbreite von 100kHz für die  Wiedergabe reicht im Prinzip sogar ein einfaches analoges (passives) Tiefpassfilter (ohne störende Rückwirkung auf den Hörbereich). Der Signal/Rauschabstand entspricht theoretisch über  120 dB.
Bei 1Bit-Daten spielt beim DA-Wandeln die Wandlerlinearität keine Rolle. Eine Überleitung in die digitale Verstärkung ist besonders einfach (welche Probleme auch immer damit verbunden sind ?!). Die Lautstärkeregelung wird durch einfache Veränderung der Versorgungsspannung realisiert.

Die Sigma-Delta-Modulation repräsentiert das analoge Ursprungssignal – nach heutigen Massstäben – ausgesprochen genau und gehört zu den „erhaltensten“ Konversionsmethoden. Gerade für die langsam verfallenden Bänder aus den Anfängen der Musikaufzeichnung könnte DSD gerade zur richtigen Zeit kommen.

Ein Merkmal von DSD ist die Fähigkeit, aus entsprechenden Umrechnungen und Mappingfunktionen jede gewünschte Auflösung und Abtastfrequenz skalieren zu können. Der DSD Prozess archiviert die Daten in einer Art „idealen“ Rohform. Aus dieser können dann die gewünschten Derivate: CD oder DVD im PCM-Format oder datenreduzierte Formate wie MPEG fürs Internet gezogen werden.

Eine wichtige Eigenschaft des DSD-Formates ist seine hohe Auflösung im Nulldurchgangdes Analogsignals (vgl. Class-A-Verstärker: geringe Verzerrungen im Nulldurchgangsbereich).  Das selbe gilt für die Auflösung bei kleinen Lautstärken.
Bekannterweise ist das menschliche Ohr sehr empfindlich für Häufungen an Übernahme- (Crossover) Verzerrungen, die den Klang als hart erscheinen lassen.
 

DVD und DVD-A

Die DVD gleicht optisch der CD (Durchmesser 120mm Dicke 1.2mm). Sie besteht aber, zur Verbesserung der Verwindungssteifheit, aus zwei 0,6 mm dicken Platten, die Rücken an Rücken aneinandergeklebt sind. Sie kann pro Seite zwei Informationsebenen enthalten. Dies verdoppelt ihre Speicherkapazität. Schon eine Informationsebene auf einer Seite bietet die Kapazität von ca. 7 CDs (4.7GByte). Bei beidseitig 2 Informationsebenen ergibt sich die Kapazität von etwa 26 CDs. Von Anfang an wurde die DVD als Multimedia-Datenträger (Musik, Video und Computer) konzipiert. Ein DVD-Wiedergabegerät kann die Daten etwa 10 mal so schnell ausgeben wie es bei CD der Fall ist. Sie bietet theoretisch eine 10mal größere Störsicherheit. Die Daten sind wie bei der CD im PCM-Verfahren abgelegt.

DVD-Video:
Mehr als 8 Stunden Videoprogramm mit Untertiteln in bis zu 32 Sprachen und bis zu 8 Versionen 5+1 Digital-Surround-Sound (Front-Rechts/Links, Center, Hinten-Rechts/Links + Subwoofer).
Der Ton ist maximal mit einer Auflösung von 24Bit / 96 KHz abgelegt. Auf einem DVD (Video) Player können auch CD´s, aber keine Audio-DVDs abgespielt werden.
Zusätzlich zu dem Systemtakt für Audio ist hier noch der 27MHz-Takt für Video vorhanden. Zumeist wird aus diesem der Audio-Takt über eine PLL abgeleitet. Dies kommt einem niedrigem Jitter nicht gerade entgegen. Klanglich konnten DVD-Player im CD-Modus (oft auch im DVD-Modus) guten CD-Playern bzw. Laufwerk/Wandler-Kombinationen nicht das Wasser reichen. 

DVD-ROM (nur lesen), DVD-R (einmal beschreiben), DVD-RAM, DVD-R/W  (mehrfach beschreiben)
Bis zu 17GigaByte Speicherkapazität bei beidseitiger Nutzung. Normalerweise 4.7 GByte. 

DVD-A (Audio):
Der Standard für DVD-Audio wurde im September 1998 festgelegt. Er erlaubt je nach Verwendungszweck verschiedene Qualitätsstufen. Auch die Zahl der Übertragungskanäle kann den Wünschen und Erfordernissen angepasst werden, von mono bis Surroundsound. Auch in der höchsten Qualitätsstufe und mit allen Surroundkanälen bleibt noch immer eine Spieldauer von mindestens 74 Minuten auf einer Seite. In der höchsten Auflösung stehen 24 Bit mit 192 kHz Samplingfrequenz zur Verfügung. CD´s können in einem DVD-A-Player ebenfalls abgespielt werden, Video-DVDs natürlich nicht. 
 

SACD (Super-Audio-CD)

Eine SACD entspricht der Größe und dem Aussehen der CD. Die Datendichte entspricht etwa der DVD.
Sie besitzt 2 Aufzeichnungsschichten (Dual-Layer, Hybrid-CD). Die untere Schicht, mit identischem Musikprogramm, ist im CD-Format geprägt und kann mit einem normalem CD-Player abgespielt werden (Laser 780nm Wellenlänge). Die SACD-Information liegt davor und wird vom 650nm-Laser abgetastet. Auf Grund der anderen Wellenlänge (andere Farbe) erkennt dieser die andere Informationsspur nicht an.

Die Entwickler Sony und Philips haben die Super Audio-CD-Spezifikation, die den herkömmlichen CD-Standard mit einbezieht,  im s.g. “Scarlet Book” abgelegt. 

Auf dem SACD-Layer können Stereo oder Mehrkanal-Programme mit bis zu 6-Kanälen in voller Auflösung gespeichert sein. Als Kopierschutz und Funktionen gegen Piraterie werden mit einem aufwendigen Rechenverfahren Informations-Bits bei der Aufnahme hineingerechnet (SACD Signum, bzw.Wasserzeichen in der Informationsschicht). Digitale Kopien spielen der SACD-Player nicht ab (bis irgendwelche Hacker auch diesen Code entschlüsseln....).

Auf einer SACD ist  das Musikprogramm  im DSD-Format gespeichert.

Wie zu Anfang des Kapitels erwähnt ist die Qualität der Wiedergabe von Lücken in der Gesamtkonzeption und den Fehlern der Übertragungskette (Raumakustik, elektrische Anschlüsse, Vibrationen durch Mikrofonie, Netzstörungen, Fehler in der Digitaltechnik z.B. Systemtakt ...) abhängig. So bleibt an diesen Störstellen mehr auf der Strecke als die SACD gegenüber der CD gewinnt. 

Ausblick auf die neuen Digital-Audio-Technologien

SACD und DVD-A sind eine höher auflösende CD, Ihre Vorteile liegen in der Exaktheit der Analogdaten-Abbildung. Die Unterschiede zu CD, ausgedrückt in Längeneinheiten sind nicht cm, sondern nur Bruchteile eines mm (µm).

Um diese Feinauflösung in der Übertragungskette zu verarbeiten müssen bei den meisten Anlagen zuerst viele andere Fehler beseitigt werden. Selbst innerhalb des DVD-A oder SACD- Players sind mit Sicherheit noch viele Fehlerquellen unentdeckt, oder aus Kostengründen akzeptiert, vorhanden.
Rein theoretisch ist das SACD-Verfahren, auf Grund der DSD-Aufzeichnung und des geringeren Aufwandes der Signalverarbeitung, das Bessere Verfahren. Ob dies sich klanglich auch niederschlägt hängt leider auch von vielen anderen Faktoren ab.

Welches dieser beiden Technologien das Rennen macht wird sicherlich hauptsächlich von Marketing Strategien und vom Preis abhängen.

Die Praxis im Aufnahmestudio:

Im normalem Tonstudio spielt sich das DSD-Verfahren nur ganz am Anfang und ganz am Ende der Übertragungskette ab. Dazwischen, also alles was mit Klangbearbeitung zu tun hat, läuft auf der guten alten PCM-Strecke. Und sogar die DSD-Wandler, die für SACD eingesetzt werden, arbeiten mit PCM-Wandlung unterschiedlicher Wortbreite und konvertieren erst am Ausgang auf das gewünschte Format.
Ein kritischer Punkt sind die anstehenden Kosten für die Aufnahmestudios. Sony hat mit DSD quasi Digital-Audio neu erfunden. Von Digitalmischpulten über den Recorder bis zum Schnitt- und Editierplatz muss die gesamte digitale Infrastruktur auf DSD umgestellt werden, was Kosten in noch unbekannter Höhe verursacht. Schließlich macht es überhaupt keinen Sinn, PCM-Geräte für DSD-Produktionen zu verwenden.

Die Software: Bis genügend Musik in den neuen Formaten DVD-A und SACD bereit steht, vergehen möglicherweise Jahrzehnte. Der Preis liegt dann wohl immer um den Faktor 1.5 - 2 höher als der einer CD. Massenkonsum-Musik wird wohl nicht auf diesen High-End-Medien produziert werden, so das der Markt immer klein sein wird. CD wird also wohl die nächsten Jahrzehnte weiterlaufen. 

Fire Wire

Schnittstelle für Digital- Video und Audio sowie DVD´s (IEEE 1394-Norm) mit einer maximalen Übertragungsratze von 400 MBit/s. 4polige Steckverbindung. Wird im Audiobereich verwendet bei Laufwerk-Wandler-Kombinationen z.B. DVD-A  (24Bit, fs=192kHz) oder bei SACD.

Ob diese, aus dem Computer- und Videobereich stammende, Consumerverbindung derzeit high-endigen Anspruchen genügt ist fraglich.

zu weiteren Infos