Diese Schritt-für-Schritt-Anleitung für die Android App Room Acoustics Meter, genauer zum Lesen von Frequenzgang, Phase, Impulsantwort und verwandten Größen soll einen Einstieg in das Gebiet ermöglichen. Wie bei jeder einfachen Anleitung zu einem komplexen Thema lassen sich manchmal Gegenbeispiele erdenken. Ziel ist, zu helfen bei Messungen eines typischen Wohnraums überhaupt erstmal "den Fuß in die Tür zu bekommen". Für kleinere Räume wie beim Car Hifi oder größere Räume wie Veranstaltungshallen gelten die hier vorausgesetzten Bedingungen nicht. Am Ende werden zur Veranschaulichung einige Messkurven von privaten Wohnräumen interpretiert.

Anleitung zur Durchführung der Messung

Voraussetzung der folgenden Abschnitte ist, dass die Daten von einer korrekt ausgeführten Messung stammen. Vor Beginn der Messung sollten wiederum die elementaren Regeln zur Aufstellung von Lautsprechern berücksichtigt worden sein.

Hifi-Apps führen schrittweise durch die Messung. Entscheidbar ist, mit wie vielen Mikrofonpositionen gemessen werden soll. In einem durchschnittlichen Wohnzimmer, bei dem die Hörplätzen nicht mehr als 2 m auseinander liegen, geben zwei oder drei Messungen oft schon einen Überblick, welche Maßnahmen sinnvoll sind. Das Mikrofon sollte sich dort befinden, wo sonst die Ohren der Hörer sind.

Was wird durch mehr Messungen besser?

Wenn möglich, sollten mehrere Aufstellungen der Lautsprecher und Hörpositionen vergleichen werden. Pro Aufstellung sollten wieder mindestens 2 bis 3 Messungen erfolgen. Manchmal entstehen schon durch Änderungen im Bereich von 50 cm deutliche Verbesserungen.

Ein besserer, aber auch aufwändigerer Weg ist eine sog. Schallfeldmessung: Statt innerhalb einer Messung über benachbarte Frequenzen runden (Glättung) werden mehrere (über 10) Messungen in einem Bereich von vielleicht 50 cm gemacht und die (weniger stark gerundeten) Frequenzgänge gemeinsam interpretiert. Das Ergebnis wird die Ergebnisse anderer Messungen sicher nicht umwerfen, liefert aber zusätzliche Präzision für den Feinabgleich eines Soundprozessors oder Equalizers.

Mehr Mikrofonpositionen präzisieren naturgemäß das Ergebnis, wenn es sich um weitere Hörplätze handelt. Für die Wertung des Hörerlebnisses wird im Allgemeinen nur an (potenziellen) Hörplätzen gemessen. Messungen an anderen Mikrofonpositionen haben einen indirekten Nutzen: Bei mehr Interesse kann auch eine komplette Matrix des Raums, z.B. in Ohrhöhe mit 1x1 m Rasterung, aufgenommen werden. Auf diese Weise erhält man ein tieferes Verständnis über das gesamte Wellenfeld im Raum und kann Dämmmaßnahmen und die Positionierung von Schallquellen und Hörplätzen gezielt planen.

Hifi-Apps sind so geschrieben, dass mit wenig Aufwand auch sehr viele Messungen gemacht werden können: Zwischenspeichern und die Bestimmung der Mikrofonposition sind automatisiert. Die Android-Geräte können leicht im Raum umhergetragen werden, da die externe Stromversorgung ebenso wie das externe Audio-Interface entfällt.

Beim Start der App erscheint der Hinweis, das Android Gerät möglichst über Kabel mit dem Wiedergabesystem zu verbinden. Praktische Erfahrungen für verschiedene Verbindungstypen:

Anfangs kann auch ohne Messmikrofon gearbeitet werden, mehr dazu hier. Diese Einführung geht davon aus, dass die Messung mit einem Mikrofon mit Kugelcharakteristik erfolgte. Das ist hat sich etabliert, weil verschiedene Messungen andernfalls kaum vergleichbar wären. Für Interessierte spricht natürlich nichts dagegen, trotzdem z.B. mit sog. 3D-Messverfahren zu experimentieren [Protheroe 2013]: Für die App spielt es keine Rolle, woher die Daten kommen. Grundsätzlich ist Richtungsinformation in der Praxis natürlich nützlich: Die Suche störender Reflexionen kann und sollte durch Klatschen und (Richtungs-)Hören (siehe unten) unterstützt werden.

In den folgenden Schritten führt die App dialogbasiert bis zum Start der Messung. Der verwendete Farina-Algorithmus ist relativ unempfindlich gegen Umgebungsgeräusche während der Messung. Er wird in der Praxis sogar kurz vor Konzertbeginn mit wartendem Publikum eingesetzt. Trotzdem ist es eine gute Idee, ggf. laut mit klappernde Gegenstände bei dieser Gelegenheit unter Kontrolle zu bringen und die Messung zu wiederholen.

Die Messung muss bei moderater Lautstärke erfolgen: Das Messsignal belastet Ohren und Lautsprecher erheblich mehr als Musik der gleichen Lautstärke. Manche professionelle Akustiker tragen grundsätzliche bei jeder Messung einen Gehörschutz.

Setup Einstellungen (für Fortgeschrittene)

Im Setup Menü kann die Dauer des Logsweeps und dessen Grenzfrequenzen eingestellt werden. Da der Sweep aus technischen Gründen langsam ein- und ausgeblendet wird (Blackman windowing 0.05 s leadin, 0.005 s leadout), ist der später verwendbare Frequenzbereich etwas schmaler. 20 Hz als Start sind ausreichend, um Resonanzen in Räumen bis 8 m Länge zu finden. Die obere Grenzfrequenz hilft bei verschiedenen Längenmessungen aus der Schall Laufzeit, 20 kHz sind in der Praxis bewährt. Ob der Lautsprecher laut Hersteller einen größeren Frequenzbereich abdeckt, spielt für den wichtigen Teil der Messwerte keine Rolle.

Die Dauer bestimmt die Präzision der Messung. Sie sollte so lang sein, dass störende Raumresonanzen die Chance haben sich aufzuschwingen und damit in den Ergebnissen gefunden werden können. Um eine Raumresonanz anzuregen, muss der Sweep lange genug in ihrem Frequenzbereich sein. Ein guter Anfang sind 2 Sekunden. Beispiel für Techniker: Für eine Raummode mit 300 ms rise time und 1/3 Oktave Bandbreite vs. 10 Oktaven für den Sweep erhält man 300 ms * 1/(1/3) * 10 ≃ 10 Sekunden. Das ist der höchste einstellbare Wert. Wer bewusst kurze Sweeps einsetzt, um mit der einhergehenden schlechten Auflösung optisch schön gerade Frequenzgänge zu erzeugen, sollte sich wohl besser nach einem anderen Tätigkeitsfeld umsehen.

Im Setup Menü kann die Samplerate eingestellt werden. Die angebotenen Werte erhält die App vom Android System des Gerätes, ebenso die Information "nativ" für einen bestimmten Wert, meist 48.000 pro Sekunde. Von diesem Wert sollte ohne konkrete Gründe (siehe unten im Abschnitt "Impulsantwort") nicht abgewichen werden. Hohe Werte ("viel hilft viel") sind nicht per se hilfreich.

Auswertung des Frequenzgangs

Mit "Frequenzgang", auch FR (Frequency Response) und SPL (Sound Pressure Level) ist hier der Summenfrequenzgang gemeint, d.h. der Schalldruck, mit dem eine bestimmte Frequenz irgendwann einmal beim Mikrofon ankommt, nachdem sie in das System eingespeist wurde. Somit sind sowohl direkt vom Lautsprecher ausgesendeter Schall als auch Reflexionen an den Wänden usw. enthalten. Um die Raumeigenschaften zu überblicken ist das ein guter Start.

Nebengedanken zum Summenfrequenzgang und Target Curve

Der Anblick des Summenfrequenzgangs ist anfangs ungewohnt: Verglichen mit den Lautsprechermessungen des Herstellers entstehen durch die Raumeigenschaften viel größere Schwankungen. Herstellerseitige Lautsprechermessungen zeigen i.d.R. ausschließlich den Direktschall - der Raum des Benutzers ist zum Zeitpunkt der Messung schließlich noch nicht bekannt. Die Messung wird manchmal wirklich im Freien durchgeführt. Der Summenfrequenzgang in einem Hörraum hat mit den Eigenschaften des Lautsprechers kaum etwas zu tun. Beide Frequenzgänge haben ihre Berechtigung und spiegeln sich im Höreindruck: Ein ausgewogenes Verhalten im Direktschall kann als Grundvoraussetzung gesehen werden, ähnlich wie die Lichtquelle in einem Projektor weißes Licht liefern muss. In Hintergrundwissen ist beschrieben, welche klanglichen Eigenschaften bei welchen Eigenschaften des Raums zu erwarten sind. Unser Hörsinn ist offenbar imstande, den ersten Direktschall vom Lautsprecher und die Reflexionen so zu trennen, dass nicht alle diese Schwankungen wichtig sind.
Der Summenfrequenzgang sollte an einer Zielkurve orientiert werden, die zu höheren Frequenzen einige dB abfällt [Møller 1974], [Toole 2015], [Websuche "Target Curve spl" oder "Frequenzgang Zielkurven" bzw. "Hauskurven"]. Die App bietet die Möglichkeit, einige etablierte Zielkurven einzublenden.

Voraussetzung für die Interpretation sind korrekt durchgeführte Messungen (s.o.). Die Ergebnisse sollten den hier abgebildeten Kurven ähneln.

Ungefiltert1/24 Okatv Glättung1/8 Okatv Glättung 1/3 Okatv Glättung
Bilder zum Vergrössern anklicken
Summenfrequenzgang von zwei Standlautsprechern der Mittelklasse (Quadral Chromnium Style 50) ohne Klangkorrektur in einem 5m x 7m großem Raum. Die Mikrofonpositionen aller Messungen liegen weniger als 20 cm auseinander, also in einem Bereich von Ohrabstand und Kopfbewegungen. Die oberen blauen Kurven und unteren roten Kurven sind vom linken bzw. rechten Kanal. Die Kurven haben einen Shift von jeweils 20 dB. Die Messung erfolgte mit einem geeichten Messmikrofon Audix TM-1, das über einen Shure X2u XLR-auf-USB Adapter mit einem Samsung SM-T510 Tablet verbunden war. Die breite hellblaue Kurve ist die nach [Toole 2015] präferierte Zielkurve von trainierten Hörern.
Die selben Daten, ohne Shift.

Linke Spalte - (fast) Allgemeingültiges: Für eine Intuition, wo die Daten herkommen und welche Genauigkeit zu erwarten ist, schadet es sicher nicht, anfangs ein paar ungefilterte Frequenzgänge anzusehen. Später kann dieser Schritt übersprungen werden. Die extremen Schwankungen ab ca. 300 kHz entstehen durch Reflexionen. Bei Freiluftmessungen und im Nahfeld des Lautsprechers sind sie sehr abgeschwächt oder gar nicht zu sehen. Die Stärke dieses Kammfiltereffektes lässt die jeweilige Unsicherheit in den Ergebnissen erahnen: Es ist strittig, inwieweit sich der Hörsinn an den Spitzen oder an den Durchschnittswerten orientiert. Bei großen Schwankungen kann ein Höhenabfall nach der Mittelwertbildung also eine Folge der Rundungsmethode und für den Höreindruck vollkommen bedeutungslos sein. Bei den Beispielmessungen weiter unten sind diese Rohdaten deshalb ebenfalls angefügt.

"1/... Oktav Glättung" Spalten - (fast) Allgemeingültiges: Vergleicht man (in den unteren Diagrammen) zunächst die verschiedenen Messungen (jeweils eines Stereo-Kanals), dann sieht man, dass die Werte bei ca. 300-400 Hz (also Wellenlängen von 1 m) auseinanderlaufen. Das ist plausibel, weil bei stehenden Wellen Maximum und Knoten 1/4 der Wellenlänge auseinanderliegen, also in dem Bereich, in dem das Mikrofon bewegt wurde. Die Unsicherheiten liegen bei ungefähr 5 dB.
Zwischen eng (≪ 1/3 Oktave) benachbarten Frequenzen innerhalb jeder einzelnen Messung treten ebenfalls Schwankungen von ungefähr 5 dB auf. Offenbar sind ab ca. 300 Hz die wellenlängenabhängigen Verstärkungen und Auslöschungen durch kleine Änderungen der Mikrofonposition sehr vergleichbar mit denen durch kleine Änderungen der Frequenz. Im Bereich unterhalb von 300 Hz ähneln sich die Messungen stärker. Die einzelnen Messkurven schwanken an einigen Stellen aber stärker. Ob das durch Reflexionen oder Raummoden verursacht wird, kann man im Summenfrequenzgang nicht immer erkennen.

Diese Effekte treten bei praktisch allen Summenfrequenzgängen normaler Wohnräume auf. Bei einem höheren Direktschallanteil kann die Schwankungsbreite unter 5 dB fallen, was wünschenswert ist. Bei günstig aufgestellten (und angesteuerten) Subwoofern oder weniger Reflexionen durch einen geeigneteren Grundriss sollten die Peaks im Bereich unter 300 Hz deutlich moderater sein. Der zusätzliche Aufwand für Schallfeldmessungen, d.h. über viele eng benachbarte Mikrofonpositionen zu mitteln, lohnt sich nur in seltenen Fällen. Die Mittelwertbildung über benachbarte Frequenzen führt im oberen Frequenzbereich zu sehr ähnlichen Ergebnissen, im unteren Frequenzbereich ähneln sich die Messungen sowieso. Manche Tontechniker verwenden diese Methode beispielsweise nur für ein endgültiges letztes Einstellen der Klangkorrektur für einen bestimmten Hörplatz.

Qualitativ generalisierbar: Sowohl die 5-dB-Schwankungen benachbarter Frequenzen als auch die wesentlich stärker ausgeprägten Raummoden oder Reflexionen im Bassbereich zeigen, dass der Raum akustisch noch "einige Luft nach oben" hat, aber nicht "katastrophal" ist. Wie bei vielen Wellenbildern in der Natur zählt das Gesamtbild, die einzelnen Schwankungen haben kaum Bedeutung, solange sie gleichmäßig verteilt sind. Grundsätzlich ist nicht jede Reflexion schlecht. Der über 1/3-Oktave geglättete Frequenzgang sollte aber auf jeden Fall Schwankungen unter 10 oder maximal 15 dB haben. Diese sind erstmal unproblematisch, solange sie gleichmäßig verteilt sind. Setups, bei denen wenige Frequenzen sehr prominent hervorstechen, sollten einem Hörtest unterzogen werden. Positionierungen von Lautsprechern, Hörplätzen und Dämmung mit ausgewogenem Verlauf werden wahrscheinlich besser klingen. Mit der Information "ab ca. 300 Hz Schwankungsbreite im Nahbereich (d.h. ≪ 1/3 Oktave) ca. 5dB, anfangs eher 10 dB, keine gar zu prominenten Peaks" im Hinterkopf kann mit dem stärker geglätteten Frequenzgang (1/8 oder 1/3 Oktave) weiter gearbeitet werden. Einige dann besonders deutlich erkennbare Phänomene ergänzen das Bild so weit, dass klar wird, welche Maßnahmen zur Klangverbesserung anstehen. Noch nicht erkennbar sind Details, d.h. wo genau Dämmelemente zu montieren sind, oder ob auch Diffusoren empfehlenswert sind.

Die breiteren Anhebungen und Absenkungen im Frequenzgang kann man bestimmten Klangcharakteren zuordnen. Das kann zum Verständnis eines Hörtests beitragen. Wenn keine Neutralität angestrebt wird, kann es in die Korrekturmaßnahmen einfließen. Suchmaschinenanfragen "Klangcharakter vs. Frequenzgang" liefern interessante Erkenntnisse, von denen einige aus der persönlichen Sicht des Autors nachvollziehbare hier zusammengefasst sind:

Alle Frequenzen in Hz20-4040-200200-500500-2k2k-6k6k-12k12k-20k
Wichtig fürSpürbare Vibrationen100: Beginn der tiefsten menschlichen Stimmen 150: Wärme des Klangs, Körper der Stimmen200: Fundament der menschlichen Stimme empfindlicher Bereich des Gehörs. Für Gitarren und Stimmenempfindlichster Bereich des Gehörs. Deutlichkeit, Nähe von Stimmen.Brillianz, Offenheit. Becken, Streicherfür funkelnde brilliante transparente Höhen. Becken.
Klang bei Anhebung +10 dBJe nach Hörerfahrung und Geschmack40-60 dröhnend, 100: Bass matschig, "boomy", aber 60-150: anheben für Fülle im Bassbereich, fetten Sound, 125-250: "als ob eine Decke drüber liegt"300: topfig... 600: trötig, hupig, hohl 500-2k "altes Küchenradio". 1k: nasal, dünn, 2k: dünn, harsch2k-6k: "Megafon-Sound". 5k: scharf, zischend 7k: unangenehme "s" und "t" Laute, Websuche: "De-Esser"
Klang bei Absenkung -10 dBSchade150: Bass wirkt abgetrennt250 Bass wirkt hohl, 450: Stimmen wirken hohl1k: ca. 5 dB absenken zum "Entmulmen"2k: Klarheit fehlt 3k: "attack" Fehlt, süßlich, romantisiert4k: Finesse fehlt
Blauert 300-600: vorne700-1800: hinten2,2k-6k: vorne8k-11k: oben 11k-17k: hinten

Die Empfindungen in den Zeilen 2–4 genügen keinem wissenschaftlichen Anspruch, sie sind sicher nicht systematisch reproduzierbar. Wenn einzelne Frequenzen angegeben sind, ist ein Bereich von 1 bis 2 Oktaven FWHM gemeint. Die letzte Zeile bezieht sich auf die sog. Blauertschen Bänder: Durch Anhebung bestimmter Frequenzbereiche kann man den Höreindruck erzeugen, der Schall käme von vorn, oben, hinten oder unten [Blauert 1974, Wikipedia].

Nebengedanken zur Glättung

Die Frage, welche Glättung die Aussagekräftigste wofür ist füllt viele Forenseiten. Grundsätzlich kann (bei Schallfeldmessungen - siehe oben) über mehrere Messungen gemittelt werden, oder die Mittelung erfolgt über den Frequenzgang, wobei es auch wieder mehrere Verfahren gibt. Vor der Lektüre sollte durch Umschalten (insbesondere zwischen 1/3- und 1/8-Oktav-Glättung) eine eigene Intuition erschaffen werden, was jeweils zu sehen ist. Als Basis sollten auch probeweise die Rohdaten angesehen werden. Sowohl der durchschnittliche Schalldruck als auch der maximale Schalldruck jedes kleinen Frequenzbereichs geht in die wahrgenommene Lautheit ein.

Für den Höreindruck sind die Trends in der Überlagerung von direkten und reflektierten Signalen am Mikrofon bzw. Ohr wichtig. Auch in den geglätteten Daten sollten die daraus resultierenden einzelnen Peaks nicht überinterpretiert werden: Ihre Lage ändert sich auch je nach Mikrofonstandort. Außerdem ändern Zuhörer ihre Sitzposition und haben ca. 14 cm Abstand zwischen den Trommelfellen. Wichtig ist, dass sich dadurch der Klang nicht zu sehr ändert. Es gibt zwei grundsätzliche Wege das zu realisieren:

  • durch einen hohen Direktschallanteil. Dafür gibt es in der Studiotechnik Nahfeldmonitore. Der Hörabstand ist meist unter 2 m. Je stärker der Raum gedämmt ist, desto unkritischer ist der Hörabstand. Hornlautsprecher ermöglichen ebenfalls größere Hörabstände.
  • durch Ergodizität, d.h. eine gute Durchmischung, so dass möglichst alle Frequenzen zu allen Zeiten aus den richtigen Richtungen reflektiert werden. Rund- oder dipolartig abstrahlende Lautsprecher sorgen sicherlich "für einen guten Anfang", wenn eine solche Schallverteilung bevorzugt ist.

Selten erwähnt wird die Kanalgleichheit. Sie hat mindestens die gleiche Priorität wie der Frequenzgang: Ein System bei dem Sänger nicht, oder schlimmer an einer völlig falschen Stelle geortet werden, kann nicht ernsthaft als "eingemessen" bezeichnet werden. Die Kanalgleichheit hat mit der Gleichheit der Frequenzgänge des rechten und linken Kanals zu tun, viele weitere Effekte gehen aber ebenso ein. Anfangs sind Hörtests sicher der bessere Weg zur Wertung.

Auswertung von Phase, Delay, Gruppenlaufzeit

Während der Frequenzgang zeigt, wie stark eine bestimmte Frequenz wiedergegeben wird, zeigen diese Kurven in verschiedenen Formen, wann sie wiedergegeben wird. Nicht alle Frequenzen kommen immer gleich schnell an: Ein Beispiel aus der Natur ist das Knacken von Eis auf einem zugefrorenem See: Aus einiger Entfernung ändert sich das "Knack"-Geräusch zu einer Art "Piu", weil die höheren Frequenzen von Eis schneller übertragen werden. Auch beim Einschlag eines Blitzes kommt der tieffrequente Donner oft später als der Knall des Einschlags an. Im Gegensatz zum brechenden Eis, dessen Verhalten sich physikalisch nachvollziehen lässt, spielen hier allerdings viele nicht genau bekannte Faktoren zusammen. Bei entfernten Explosionen ist der zeitliche Verlauf beispielsweise völlig anders.

Das Verhalten von Schall in Wohnräumen entspricht eher dem zweiten Beispiel. Nur Teilaspekte scheinen manchmal durch Konzepte wie Bassreflexkanäle erklärbar. Ohne Maßnahmen an der Raumakustik braucht man sich wohl nicht damit zu beschäftigen. Danach sicherlich im High End Bereich, ansonsten vielleicht. Ein Rezept zum Verständnis der Kurven steht bereits an anderer Stelle.

Auswertung der Impulsantwort

Grob gesagt ist Impulsantwort, auch Impulse Response (IR), das, was man hört, wenn ein scharfer Knall abgespielt wird. Sie charakterisiert sowohl Echos, Reflexionen, Hall usw. im Hörraum als auch die Reaktion der Lautsprecherboxen samt zugehöriger Elektronik. Statt des Knalls spielen Hifi-Apps einen verträglicheren Logsweep ab und rekonstruieren daraus die Daten des Knalls.

Vor Auseinandersetzung mit der gemessenen Impulsantwort sollte intuitiv klar sein, worum es geht. Dazu kann man in verschiedenen Räumen die Hände klatschen und hören, wie der Hall abklingt. Der ideale Hörraum darf weder "völlig tot" noch hallig wie ein Badezimmer sein. Der Hall sollte sich auch gleichmäßig im Raum verteilen und nicht (z.B. zwischen gegenüberliegenden Wänden) oder hin- und hergeworfen werden. Mit etwas Übung ist das gut hörbar. Es kann helfen, den Kopf beim Klatschen in verschiedene Richtungen zu drehen.

Die gemessene Impulsantwort zeigt den zeitlichen Verlauf des Schalldrucks oder einer eng verwandten Größe. Auf der x-Achse steht immer die Zeit, bei Hifi-Apps wahlweise auch als Produkt mit der Schallgeschwindigkeit in Metern. Die Kurve lässt sich in drei Teile unterteilen:

Während der Direktschall ein einzelnes Ereignis ist, das gut identifiziert werden kann, ist die Trennung zwischen den frühen Reflexionen und dem späten Nachhall weniger offensichtlich: Sie können überlappen oder es kann eine Lücke "transition time" zwischen beiden geben [Defrance 2009]. Die folgende Abbildung zeigt immer dieselben 4 Impulsantworten oder eine Auswahl davon in verschiedenen Darstellungen. Praktisches Ziel könnte sein, durch Dämmung, Anbringung von Diffusoren, Änderung der Hörplätze usw. die schlechte hellblaue/beige Impulsantwort in den Bereich der guten dunkelblau/roten zu bringen.

ImpulsantwortZoom auf AnfangsbereichLineare Darstellung zugehöriger Frequenzgang
Bilder zum Vergrössern anklicken
Spalte 1: Vergleich der Impulsantworten eins leerem quadratischen Raums und eines gedämmten Hörraums, jeweils linker und rechter Kanal.
Spalte 2: Ausschnitt aus dem ersten Bild, die beiden prominentesten Peaks von a) mit Werten markiert.
Spalte 3: Lineare Darstellung der selben Messung, zur Übersichtlichkeit nur die linken Kanäle (blau).
Spalte 4: Zugehöriger Frequenzgang von a). Die roten Kurven sind durch berechnete Werte: Sie zeigen die Schallintensität bei Überlagerung zweiter um den jeweils angegebenen Betrag verzögerten Wellen.
Spalte 1: Wie oben (Zeitachse verlängert 500 ms), zusammen mit Schroeder Kurven und davon abgenommenen Werten für
- EDT (Early Decay Time gem. ISO 3382), d.h. Dauer des Abfalls vom dB-Wert bei t=0 bis -10 dB, multipliziert mit 6
- T20, d.h. die Dauer des Abfalls von -5 dB auf -20 dB, multipliziert mit 4.
Die Schroederkurve startet hier bei -10 ms, deshalb ist der Wert bei t=0 etwas unter 0 dB. Dadurch ändern sich die Ergebnisse nicht. Alle Nachhallzeiten beziehen sich auf einheitlich 60 dB Abfall, d.h. die abgelesenen Werte für 20 dB bzw. 15 dB sind bereits mit 3 bzw. 4 multipliziert.
Spalte 2 und 3: gefilterte Impulsantworten von jeweils 2 ausgewählten Oktavbändern mit Schroederkurven. Spalte 2: ungedämmter Raum (hellblau), Spalte 3: gedämmt (dunkelblau). Erkennbar ist die starke Methodenabhängigkeit der T60 Werte: Im Bassbereich des ungedämmten Raumes sind die Schwankungen so stark, dass eine Festlegung des Nachhalls unabhängig von der Messmethode sinnlos erscheint. Der Anstieg bei ca. 300 ms ist psychoakustisch sicher völlig anders zu beurteilen als der Beginn der Kurve. Die Entscheidung ihn in die Bestimmung von T60 aufzunehmen ist damit subjektiv. Vergleicht der EDT Werte beider Spalten zeigt, dass auch hier Ausreißer auftreten können, die das Hörerlebnis wohl nicht widerspiegeln.
Spalte 4: Die in Terz-Schritten gefilterten Impulsantworten mit Schroederkurven und T20 Werten. Wie für Spalte 2 erläutert, sollten den Werten für den Bassbereich nicht naiv vertraut werden.

Hellblau: Die Impulsantwort des leeren Raums ist erwartungsgemäß so schlecht, dass die Einzelheiten kaum interpretiert werden müssen. Trotzdem - Spalte 2: In der Vergrößerung stechen insbesondere der Einschwingvorgang in den ersten 3 ms und die Peaks danach heraus. Die ersten beiden Peaks wurde mit der Schall Laufzeit gekennzeichnet. Offenbar gibt es zwei Schall spiegelnde Flächen, die den Schall mit 2,84 bzw. 4,56 m Umweg von linken Lautsprecher zum Mikrofon reflektieren. Die akustische Behandlung könnte mit der Suche nach diesen Flächen per Schnur-Methode und ihrer Behandlung beginnen. Um den Einschwingvorgang am Anfang etwas zu verteilen, könnte an Diffusoren gedacht werden. Andererseits zeigt die untere Bildreihe, dass die Nachhallzeit viel zu lang ist, was mehr für Dämmung spricht. Vermutlich wäre jede Behandlung eine Verbesserung.

Bei den Längenangaben sind Toleranzen von 10 bis 20 cm normal, bei großen Lautsprechern entsprechend mehr, weil der genaue Ort der Schallquelle durch das Zusammenspiel mehrerer Chassis oft unklar ist. Über ähnliche Abweichungen zwischen Raumgröße und gemessenen Verzögerungen sollte man sich auch nicht zu sehr wunden. Es genügt wahrscheinlich zu wissen, dass die akustische Größe eines Raumes bis zu 20 % größer sein kann als seine architektonische. Insbesondere wenn die Wände aus Holz oder Gipskarton sind und mitschwingen (Websuche "Schall an Mediengrenzen" für mehr).

Für die Y Achse der Impulsantwort gibt es mehrere Möglichkeiten. Grundsätzlich kann im ersten Schritt zwischen linearer und logarithmischer Darstellung gewählt werden. Da der Schalldruck in der Impulsantwort eines Wohnraums über weite Strecken logarithmisch abfällt, bietet sich letztere quasi von selbst an. Der Abfall erscheint als Gerade und Abweichungen davon werden erkennbar. Die lineare Darstellung ist dafür näher an den gemessenen Rohdaten. Entsprechend besser sind technische Details wie das Zusammenspiel verschiedener Lautsprecherchassis sichtbar. Um Teile mit kleiner Amplitude anzusehen, kann die Kurve mit Zwei-Finger Gesten vergrößert werden.

Bei beiden Darstellungen gibt es ein grundlegendes Problem: Die beim Mikrofon ankommende Energie für einen Zeitabschnitt ist je nach Darstellung eng verwandt der Fläche unter dem entsprechenden Stück Kurve. Sie ist im Idealfall auf einen einzigen schmalen hohen Peak konzentriert. In der realen Welt laufen aber dessen hochfrequente und niederfrequente Anteile früher oder später auseinander. Die hochfrequenten Anteile bleiben aber naturgemäß auf einen kurzen Zeitabschnitt beschränkt. Mithin werden sie durch hohe schmale Peaks dargestellt. Die niederfrequenten Anteile überdecken zwar eine vergleichbare Fläche, diese geht aber über einen viel weiteren Zeitabschnitt. Sie sind deshalb kaum zu sehen, obwohl sie für den Hörsinn viel wichtiger sind. Bei Forendiskussionen zur Raumakustik wird meist eine rohe oder leicht geglättete logarithmische Darstellung gepostet.

Leider sind die Peaks auf der anderen Seite ein nützlicher Indikator, um einzelne Reflexionen möglichst genau zu identifizieren. Sie können nicht einfach "weggeglättet" werden. Zum Verständnis des Systems sollte also zwischen den Darstellungen hin- und hergeschaltet werden. Die App bietet folgende Möglichkeiten:

Die Button-Zeile darunter [T=0] [FILTER]... öffnet verschiedene Einstellmöglichkeiten, die aus Platzgründen bei Start ausgeblendet sind. Ihre Dokumentation wird in der App gezeigt: Wenn [HINTS] aktiviert ist, erscheint zu dem jeweils letzten berührten Bedienelement eine Kurzanleitung. [FILTER] ist weiter unten beschrieben.

Wasserfall

Der "normale" Summenfrequenzgang zeigt, wie stark jede Frequenz wiedergegeben wird, wobei egal ist, wann sie ankommt. Im Wasserfalldiagramm ist wie beim Summenfrequenzgang die Amplitude gegen die Frequenz aufgetragen. Allerdings wird die ankommende Schallintensität in Zeitabschnitte zerhackt und so auf mehrere Kurven verteilt. Diese werden ab jetzt FR(t) genannt, was darstellen soll, dass es sich um zeitabhängige Frequenzgänge (Frequency Responses) handelt. Der erste FR(t) ist also beispielsweise der Frequenzgang für die ersten 5 ms, der nächste für die nächsten 5 ms usw. Dadurch wird besser erkennbar, ob einzelne Unregelmäßigkeiten im Summenfrequenzgang z.B. von kurzen, intensiven Reflexionen oder weniger intensiven aber dafür längeren Resonanzen kommen. Sowohl die Hörsamkeit (also ob überhaupt Maßnahmen dagegen nötig sind) als auch die Maßnahmen selber hängen davon ab.

Die Ausgabe entsteht, indem der Frequenzgang nicht aus der gesamten Impulsantwort berechnet wird, sondern jeweils aus dem Abschnitt, der für FR(t) zeitlich untersucht werden soll. Jeder FR(t) entsteht also aus einem bestimmten Abschnitt der Impulsantwort um die Zeit t herum.

Selbst ein ideales Wasserfalldiagramm in einem absolut reflexionsfreien Raum würde sich nicht auf FR(t=0) beschränken: Würde man im Beispiel die Breite der untersuchten Zeitabschnitte auch auf 5 ms (= 1/200 Hz) setzen, könnten Frequenzen unterhalb von 200 Hz schlichtweg nicht definiert werden, da keine volle Periode in diesen Zeitabschnitt passt. Dieses Heisenberg-Limit verhindert, dass es schnelle Bass Arien gibt. Es kann nicht durch geschickte Algebra überwunden werden.

Aus diesem Grunde muss immer ein Kompromiss aus Zeit- und Frequenzgenauigkeit gewählt werden. Dafür gibt es zwei etablierte Methoden:

Spektrogramm

Das Spektrogramm ähnelt inhaltlich dem Wasserfalldiagramm. Es benutzt statt verschiedener Kurven verschiedene Farben. Bei beiden Diagrammen ist eine Achse für die Frequenz. Beim Spektrogramm ist die andere Achse für die Zeit und die Farbe für die Intensität. Beim Wasserfalldiagramm ist die andere Achse für die Intensität und für verschiedene Zeiten werden verschiedene Kurven angezeigt. Mit diesen Unterschieden im Hinterkopf entspricht die Dokumentation der des Wasserfalldiagramms.

T60

Im Abschnitt Auswertung der Impulsantwort wurde erläutert, wie Hifi-Apps die Nachhallzeit T60 messen und verschiedene gefilterte Impulsantworten mit zugehörigen T60 dargestellt. Die Berechnungen hier sind identisch, gehen aber einen Schritt weiter: Die Nachhallzeit wird mit Terz- oder Oktav-Abstand für viele Frequenzen berechnet und als Funktion der Frequenz dargestellt. Dadurch wird ein direkter Vergleich mit gängigen Normen möglich. Diese können ausgewählt und eingeblendet werden. Zur Berechnung der Normwerte muss das Raumvolumen festgelegt werden.

Die berechneten Nachhallzeiten im Bassbereich darf nicht blind vertraut werden. Wie im Abschnitt "Auswertung der Impulsantwort" gezeigt, unterliegt die gefilterte Impulsantwort dort erheblichen Schwankungen verschiedenster Periodendauern. Diese entstehen aus einer Mischung von chaotischer Raumakustik (unterhalb der Schroederfrequenz) die stark von der Mikrofonposition u.Ä. abhängen und Filtereffekten. Letztlich kann ein einzelner T60 Wert niemals das hochkomplexe Verhalten eines Hörraums in diesem Frequenzbereich vollständig beschreiben. Nur wenn sein Verhalten aber Vergleichsmessungen und verschiedenen Auswertungen stabil ist, kann er als Anhaltspunkt dienen. In [Zehner Ringversuch] werden Messungen mit verschiedenen 13 Akustik-Softwarepaketen, bedient von Toningenieuren mit meist weit über 10 Jahren Berufserfahrung, vergleichen.

Es ist viel einfacher, hohe Frequenzen zu dämmen als tiefe. Tiefe Frequenzen spielen aber eine wichtige Rolle für die Wortverständlichkeit. Entsprechend ist die Nachhallzeit im unteren Frequenzbereich möglichst gut unter Kontrolle zu halten. Bei der Erstellung der DIN 18041 wurden für den unteren Frequenzbereich Kompromisse zwischen akustischer Qualität und Machbarkeit geschlossen [Fuchs 2019]. Im Zweifel ist es also besser, wenn die gemessenen Werte weiter unten im Bereich der Norm liegen.

Ist die Nachhallzeit im Tieftonbereich zu lang, kann im Spektrogramm oder Wasserfalldiagramm nach der Ursache geforscht werden. Im jeweiligen Frequenzband sollte eine Raummode zu finden sein. Die Beseitigung bei einem bestehenden Gebäude ist schwierig. Einige Ansätze finden sich hier.

Room Acoustics

Diese Darstellung kann als parametrisierte Schalldruckkarte verstanden werden. Schalldruckkarten zeigen, wie laut es an den einzelnen Hörplätzen ist. Bei privaten Räumen spielt das aber keine große Rolle, die Lautstärke ist überall mehr oder weniger gleich. Problematisch sind dafür Resonanzen und Reflexionen, die an jedem Platz ein unterschiedliches Hörbild erzeugen können. Der Schalldruck jeweils für eine bestimmte Frequenz ist also hier viel entscheidender. Genau da setzt die Darstellung an: Die Schalldruckkarte ist durch einen Regler ergänzt, mit dem die Frequenz durchgestimmt werden kann:

Rohdaten44 Hz (λ = 7,8 m)140 Hz (λ = 2,5 m) 170 Hz (λ = 2,0 m)
Bilder zum Vergrößern anklicken
Spalte 1: Rohdaten aus den Frequenzgängen (1/3 Okt geglättet).
 1: Umschalter "Alle Frequenzen" vs. "Raummoden": für das Verhalten des Sliders zur Frequenzeinstellung daneben
 2: Setup zum Umschalten zwischen Darstellung der Rohdaten und als Heatmap etc.
 3: Auswahl der Kanäle.
Spalte 2, 3, 4: Heatmap bei verschiedenen Frequenzen. Der schmale schwarz - weiß wechselnde Streifen am rechten Bildrand stellt die Wellenlänge dar.

Für das Beispiel wurde an 28 Plätzen gemessen. die Grafik zeigt, den Grundriss des Raumes, die roten Stellen sind für die jeweilige Frequenz laut, die grünen leise. Bei 44 Hz und 140 Hz bauen sich deutliche Raumresonanzen auf, einmal quer und einmal längs. Die 44 Hz Resonanz verhält sich nicht "lehrbuchhaft": auf der rechten Seite ist sie kaum sichtbar. Der Raum hat dort zwei dünne Glastüren, die offenbar akustisch günstig sind. In den nächsten Schritten sollte untersucht werden, welche anderen Lautsprecher Aufstellungen oder Ansteuerungen das Bild verbessern. Klar erkennbar ist, dass der grün / blaue Bereich kaum durch mehr Leistung verbessert werden kann: Für die erforderliche Erhöhung des Schalldrucks um ca. 10 dB müsste die Leistung verzehnfacht werden, womit der Bass in anderen Raum- und Frequenzbereichen (und außerhalb des Raumes) unerträglich würde.

Details zur Messung

Die Messung sollte sich in einem Raster in Ohrhöhe über die gesamte Grundfläche des Raumes erstrecken. (Später bei der Auswertung zeigt das Diagramm so den Grundriss des Raumes.) Die App bestimmt dabei die Mikrofonpositionen automatisch anhand der Schall Laufzeiten. So werden die horizontalen Moden mit ihren jeweiligen Maxima sichtbar. Je deutlicher das Maximum an einer bestimmten Stelle hervortritt, desto wirkungsvoller ist Dämmung an genau dieser Stelle. Man erhält also konkrete Vergleichswerte, was Dämmung an einer bestimmten Stelle bewirken kann und ist weniger auf Intuition und Vermutungen angewiesen.

Als Maschenbreite hat sich 1 m bewährt. Schwankungen in kleinerem Maßstab sollten, wie oben beschrieben als Trends verstanden werden. Man kann sich die Mühe sie einzeln zu vermessen also sparen.

Die Messung erfolgt über den rechten und linken Kanal getrennt. Wenn Subwoofer eingesetzt werden, sollten sie angesteuert werden "wie immer". Auch bei Stereo Aufnahmen ohne gesonderten Bass (LFE) Kanal kann der Bassbereich allerdings (teilweise) monophon abgemischt sein. Dadurch können Verstärkungen und Auslöschungen zwischen beiden Lautsprechern entstehen, die durch weitere Messungen, bei denen mehrere Lautsprecher gleichzeitig angesteuert werden, erfasst würden. Nach persönlichen Erfahrungen des Autors endet damit allerdings schnell im "Fluch der vielen Parameter", wenn man keine fest Vorgehensweise befolgt. Ein Vorschlag hierzu findet sich in der Dokumentation zur App "Subwoofer Optimizer".

Details zur Auswertung

Oberhalb des Diagramms befindet sich ein Slider zur Auswahl der Frequenz. Der Umschalter "Alle Frequenzen" vs. "Raummoden" links daneben steuert das Verhalten des Sliders. "Alle Frequenzen" ermöglicht die freie Auswahl der Frequenz, "Raummoden" bietet einige "besonders verdächtige" Frequenzen mit großen Pegelunterschieden je nach Raumposition gezielt an.

Falls mehrere Kanäle (R, L...) oder mehrere Lautsprecheraufstellungen gemessen wurden, wird im unteren Bereich eine entsprechende Auswahlmöglichkeit eingeblendet:

  • All speakers (max. SPL of ...) zeigt einen ersten Überblick. Raummoden sind erkennbar, egal durch welchen Lautsprecher in welcher Position sie angeregt werden. Die App verwendet für jeden Mikrofonplatz alle Messungen (rechter und linker Kanal, ggf. mehrere Lautsprecheraufstellungen) und zeigt den maximal gemessenen Schalldruck an. (Die Messungen sind automatisch gegeneinander eingepegelt.)
  • All positions of spkr. ... funktioniert wie der erste Punkt, beschränkt sich aber auf den jeweiligen Kanal (nur rechter und nur linker Kanal). So kann ermittelt werden, ob bestimmte Moden durch einen einzelnen Lautsprecher angeregt werden.
  • Single pos. of spkr. ... beschränkt sich schließlich auf eine Aufstellung eines bestimmten Lautsprechers. So kann ermittelt werden, ob bestimmte Moden durch einen einzelnen Lautsprecher in einer bestimmten Aufstellung angeregt werden.

Die Impulsantwort - technischer Background

Frequenzgang und Impulsantwort sind zueinander Fourier transformiert. In den Beispielen oben wurden sowohl im Frequenz- als auch im zeitlichen Bereich Filter eingesetzt. Die Fourier- und Hilbert-Transformierte dieser Filter erzeugt Artefakte, die nicht mit den physikalischen Eigenschaften des untersuchten Systems vermischt werden dürfen: Filter im Frequenzbereich sind im zeitlichen Bereich als eine Art Einschwingvorgang zu sehen und umgekehrt. Das wird als Filterklirren bezeichnet und tritt auch bei linearen Systemen auf, hat also technisch gesehen einen anderen Ursprung als das "normale Klirren" durch Nichtlinearitäten.

Die Beispiele wurden in der App generiert, indem das gemessene Mikrofon-Signal durch den Logsweep ersetzt wurde. Es wurde damit ein ideales System simuliert, das den Logsweep exakt wiedergibt. Die Filterung der Impulsantwort erfolgt in der Ansicht [IMP RESP] durch Aktivieren von [FILTER]. In einigen Fällen wurde der Logsweep zusätzlich per Wave-Editor bearbeitet (siehe Tabellen).

Die folgende Tabelle zeigt Artefakte, die durch verschiedene Sampleraten und die Begrenzung des Frequenzgangs bei 20 kHz entstehen:

ImpulsantwortZoom auf AnfangsbereichLineare Darstellung zugehöriger Frequenzgang
Bilder zum Vergrößern anklicken
Spalte 1: Die Filterung der Impulsantwort erfolgt in der Ansicht [IMP RESP] durch Aktivieren von [FILTER].
Spalte 2: Impulsantwort für Input = Logsweep. Ausschnitte mit vergrößerter Zeitachse und verschiedenen Sampleraten.
Spalte 3: Analoges Bild bei niedrigerer Frequenz unter Verwendung eines Filters in der App.
Spalte 4: Logarithmische Darstellung derselben gefilterten Daten mit Nachhallzeit.

Die Impulsantwort zeigt in der normalen Ansicht kaum erkennbare, aber nach Zoom der Zeitachse deutliche Ausschläge mit ca. 0.05 ms Periodendauer, also grob 20 kHz. Diese hängen nicht von der Samplerate ab. Es ist nur zu erkennen, dass das Bild bei 192 kHz klarer wird. Die ungeglättete Hilbert-Transformierte (ETC für Energy Time Curve) bildet die Einhüllende.

Zum Vergleich wurden mehrere Filter mit verschiedener Steilheit bei 50 Hz gesetzt. Hier zeigt sich ein analoges Bild in der entsprechenden Zeitskala. Das sichtbare Artefakt ist also höchstwahrscheinlich auf den bei 20 kHz begrenzten Frequenzgang zurückzuführen. Ein ideales Filter, das an der Kreisfrequenz $\omega_g$ schlagartig abregeln würde, hätte die Impulsantwort $\sin(\omega_g t)/t$ und die Null-Durchgänge lägen etwas weiter außen bei 10 ms (Websuche: si-Filter, Küpfmüller–Tiefpass). Die hier eingesetzten Filter haben eine endliche Bandbreite und klingen deshalb schneller ab. Einer Roloff-Bandbreite von 1/3 Oktave lässt die Impulsantwort nach 5 bis 10 Perioden auf ein nicht mehr störendes Maß abklingen. Um diese zusätzliche 1/3 Oktave abzudecken, müssten die Messdaten bis 25 kHz gehen.

Fazit: Schwingungen im Bereich der Roloff-Frequenz sind Artefakten und kein Indiz für Defekte oder Ungenauigkeiten im verwendeten Equipment oder Folgen wunderlicher "abgestuft reflektierenden" Gegenstände. Falls sie bei der Untersuchung von Reflexionen auftreten sollte man sie entsprechend einordnen und sich nicht stören lassen. Zu Beseitigung wäre ein Roloff deutlich über den 20 kHz Bereich hinaus nötig. Da übliche Messungen dort keine Daten liefern, ginge das nur mit rechnerischen Kunstgriffen.

Das vierte Bild zeigt dieselben Daten logarithmisch (in dB) und den zugehörigen T60-Wert. Auch wenn die verwendete Impulsantwort eine Nachhallzeit von nahezu Null hat, ist die berechnete Nachhallzeit nach der Filterung nicht Null. T20 (d.h. T60 ermittelt aus einem Abfall von 20 dB) hat im Bild bei 1 Oktave Bandbreite und 50 Hz Eckfrequenz den Wert 150 ms. Bei einer Bandbreite von 1/6 Oktave steigt der Wert auf 327 ms. In der Praxis kann bei zu eng gesetzten Filtern das Filterklirren in die Größenordnung des Nutzsignals kommen [Goertz 2020]. Das darf bei der Untersuchung enger Frequenzbänder nicht vergessen werden.

Verschiedene Lautsprecher und Räume

  BeschreibungFrequency und Implse Response - Bild zum Vergrössern anklicken Hifi-Apps Ergebnis und Kommentar
PC R5x5
Kleine PC Lautsprecher auf einem Tisch in einem nahezu ungedämmten quadratischen Raum (5m x 5m). 2019-08-29_INT.PCSPKR.WZ5X5 (Deutsch)
PC OFFICE
Kleine PC Lautsprecher im Büro. 2019-08-13_TAB_PC_SPKR_CABLE_CONNECTED LIST_2019-08-13_TAB_PC_SPKR_BT_CONNECTED
GAUS + ABSORBER
Modularer Eigenbau mit Plasma Hochtönern (Magnat MP 02) - Dämmung mit aktustischen Vorhägen. img4-s LIST_2019-08-19_INT.GAUS.VORH.OFFEN LIST_2019-08-19_INT.GAUS.VORH.ZU LIST_2019-08-19_AUDIX.GAUS.VORH.OFFEN LIST_2019-08-19_AUDIX.GAUS.VORH.ZU.
ML + ABSORBER
Dipol Lautsprecher (Martin Logan ESL 9) 2019-09-22_ML_INT_XXX
QU50 LIV
Standlautsprecher (Quadral Chromnium Style 50) in 5m x 7m grossem durchschnittlich möbliertem Raum LIST_2019-06-11_AUDIX.WZ.STR-GTN LIST_2019-06-11_INT.WZ.STR-GTN.
QU30 BA
Kein worst case Szenario: Quadral Chromnium Style 30 in einem Badezimmer. LIST_2019-10-17_INT_QUADRAL_BAD
QU30 R5x5
Künstliche Provokation von Bodenreflexionen (rechter Lautsprecher zum Boden geneigt) LIST_2019-10-17_AUDIX_W5_FB. LIST_2019-10-17_INTW5_FLOORBOUNCE.
MARTION
Hornlautsprecher MARTION Bullfrog aktiv LIST_2019-10-30_MARTION_BULLFROG

Literatur

[Blauert 1974, Wikipedia] Wikipedia Artikel "Blauertsche Bänder": https://de.wikipedia.org/wiki/Blauertsche_B%C3%A4nder

[Defrance 2009] G. Defrance, L. Daudet and J-D. Polack: Using Matching Pursuit for estimating mixing time within Room ImpulseResponses. DOI:10.3813/AAA.918239 https://www.institut-langevin.espci.fr/IMG/pdf/defrance2009.pdf

[Fuchs 2019] Helmut Fuchs, Vortrag TU-Berlin 2019.

[Goertz 2020] Anselm Goertz: Seminat "Studioakustik und Monitorlautsprecher" 2020 TU-Berlin.

[Møller 1974] Møller, Henning: Relevant loudspeaker tests in studios inHi-Fi dealers' demo rooms in the home etc. using 1/3 octave, pink-weighted, random noise. 47th Audio Engineering Society Convention, 1974-02-26/29, Copenhagen (Denmark), https://www.bksv.com/media/doc/17-197.pdf

[Toole 2015] Toole, Floyd E: The Measurement and Calibration of Sound Reproducing Systems, in: Journal of the Audio Engineering Society 63(7/8):512-541, August 2015, http://www.aes.org/e-lib/download.cfm/17839.pdf?ID=17839

[Usher 2010] John Usher: "An improved method to determine the onset timings of reflections in an acoustic impulse response". The Journal of the Acoustical Society of America 127, EL172 (2010); https://doi.org/10.1121/1.3361042 https://asa.scitation.org/doi/10.1121/1.3361042

[Zehner Ringversuch] Markus Zehner: Ringversuch Nachhallzeit http://www.zehner.ch/lab/ringversuch4.html

[Protheroe 2013] Daniel Protheroe, Bernard Guillemin: "3D impulse response measurements of spaces using aninexpensive microphone array". Toronto, Canada International Symposium on Room Acoustics 2013 http://www.iris.co.nz/media/14459/ISRA2013.pdf