Bei einer Virtualisierung eines Symphonieorchesters muss darauf geachtet werden, dass der Ton, den man in der Anwendung hören kann, auch einem solchen Orchester gemäß wird. Daher wurde für die finalen Aufnahmen des Projektes ein Experte beauftragt, der das Orchester mit 64 Mikrofonen aufgezeichnet und in langer Post-Production abgemischt hat. Es wurde eng mit diesem Tonkutscher zusammengearbeitet, um die Audiospuren auf die VR-Anwendung zuzuschneiden. So wurde der Ton vorerst in die einzelnen Instrumentengruppen (wie 1. Violine, Bratsche, Holzbläser etc.) eingeteilt, da diese auch in der VR interaktiv auswählbar sein sollen. Zu Anfang des Projekts war im Gespräch, alle Musiker als einzelne Tonspur auszugeben, es wurde sich allerdings dagegen entschieden, da das für die VR-Szene eine große Belastung wäre und für den Tonmischer ein noch größeren Aufwand, jede einzelne Spur perfekt zu bereinigen.
Die Lösung lag hier in Stereo Spektren für jede Instrumentengruppe. Für jede Gruppe wurde eine Stereo Datei angelegt, in der alle einzelnen Instrumente von links nach rechts im Panning-Spektrum verteilt sind. Der Klang hört sich also genau so an, als würde man direkt vor dieser Gruppe stehen. Für die VR-Szene wurden diese Stereo-Sounddateien wieder in zwei Mono-Dateien zerlegt, da nur die zur räumlichen Soundverrechnung gut benutzt werden können. Das liegt daran, dass eine Stereo Soundquelle im Raum nicht wüsste, in welche Richtung jeweils der linke und der rechte Kanal ausgehen würden. Daher wird die Soundverrechnung – wie in echt – nur mit Mono-Sounds gemacht, die so im Raum platziert werden, dass der Stereo-Effekt wieder auftritt, wenn man sich im virtuellen Raum zwischen ihnen befindet. So stehen also immer an den äußeren Kanten der Gruppenplattformen jeweils die Tonquellen.
Zusätzlich zu den Spuren, die den Klang innerhalb der Gruppe darstellen, sind noch zwei weitere Tonspuren von jeder Gruppe erstellt worden, die mit einem starken Raumklang-Effekt versehen worden sind. Sie sind auf den Klang angepasst, den man von dieser Instrumentengruppe hört, wenn man am Platz des Dirigenten steht. Es ergeben sich also 4 Tonspuren pro Instrumentengruppe, zwei trockene (ohne Effekt) und zwei nasse (mit angewandtem Effekt), also zwei Monospuren auf der linken Seite und zwei auf der rechten Seite der Gruppe. Das eigentliche Abmischen im Raum passiert durch den Benutzer der VR-Anwendung, indem er sich im Orchester bewegt. Jede Soundquelle hat 2 Radii: Der erste Radius bestimmt, in welcher Reichweite man die Tonspur bei voller Lautstärke hört, der zweite bestimmt, wann der Sound gar nicht mehr zu hören ist. Der VR-Benutzer bestimmt also durch seine Distanz zur Soundquelle, wie stark dieser bestimmme Sound zu hören ist.
Um alle Soundquellen im Orchester gut zusammenzumischen, müssen deshalb Lautstärkelevels zwischen diesen Radii durch Bezierkurven angepasst werden, um einen realistischen Klang zu erzeugen, der sich immer aus den umliegenden Soundquellen zusammenstellt. Hier bekommen die Spuren mit Raumklang eine grundlegend andere Kurve als die trockenen Spuren, da sich die erst in den Klang mischen sollen, wenn man sich weiter von der Soundquelle entfernt. Gleichzeitig verstummt die trockene Spur schon nach einigen Metern, da der Raumklang dann übernehmen soll.