Brandstätter, W. (2004). Perception oriented, delay-controlled echo cancellation in IP based telephone networks [Dissertation, Technische Universität Wien]. reposiTUm. https://resolver.obvsg.at/urn:nbn:at:at-ubtuw:1-9814
E354 - Institut für Elektrische Mess- und Schaltungstechnik
-
Date (published):
2004
-
Number of Pages:
146
-
Keywords:
Telefonnetz; IP; Echokompensation
de
Abstract:
Modern speech communication reveals a strong trend from the well proven circuit towards upcoming packet switched networks. Beside substantial cost savings and exploitation of synergies through convergent networks, packet switching establishes a basis for new, value-adding services, which arises from the opportunity to combine diverse types of media such as video, text, pictures, and audio. The underlying technology of packet switched telephone networks is inherited from the Internet, which has been originally designed for the reliable transmission of time-insensitive data. Therefore, real-time applications experience significant and unpredictable end-to-end delays, which directly impair the perceived voice quality. Another disturbing factor is the unavoidable echoes, which degrade the user's satisfaction with increasing delays. Hence, echo cancellers are facing stringent requirements, which are only partly met especially under double talk conditions. The delay-controlled enhancement of the conventional principle of echo cancellation improves the perceived voice quality by lessening the extent of influence on the voice signals to be transferred with decreasing echo round-trip times. The signal at the ingress of the echo cancellers is made up of the wanted signals of the local participant and the undesired echo components originated by the distant talker. The control algorithm of the newly developed idea is based on two continually observed parameters. On the one side, the delay of the voice signals from the talker's mouth to the talker's ear determines the overall required echo attenuation according to a predetermined characteristic. On the other side, the measured reduction of the signal levels along the echo path results in — in combination with the aforementioned echo attenuation — the residual echo attenuation needed for the echo canceller. The determination of the echo round-trip delay represents the most demanding challenge within the scope of this work. In this context, the discussed methods of resolution mainly take advantage of the timestamps placed in the transferred voice packets. The results obtained from a listening test confirm that there is room for improvement in the delay-controlled approach. The modeling of two analog subscriber lines, which are connected by an IP based telephone network, acts as basis for the simulation of various network conditions as well as for the optimization of diverse parameters of the echo canceller. Different aspects of the binaural voice samples, which have been created in this manner, have been evaluated by a panel of subjects in a listening test. The results conclude considerable improvements in terms of voice quality compared to the conventional approach. As the delay decreases the voice quality, under certain conditions, increases to a level equivalent to that of an a priori echo-free telephone connection.
en
Die moderne Sprachkommunikation zeigt einen starken Trend, der von der bewaehrten Leitungsvermittlung ausgeht und in Richtung aufkommender Paketvermittlung weist. Neben den erheblichen Kosteneinsparungen und der Nutzung von Synergieeffekten durch ein konvergentes Netz, ermoeglicht die Paketvermittlung auch die Einfuehrung neuer Mehrwertdienste, die durch die Kombination verschiedener Medientypen wie Video, Text, Bilder und Audio entstehen. Die zugrunde liegende Technologie paketvermittelnder Telefonnetze basiert auf dem Internet, das grundsaetzlich fuer die zuverlaessige Uebertragung zeitunempfindlicher Daten entworfen wurde. Daher erfahren Echtzeitanwendungen erhebliche und auch nicht vorhersagbare Ende-zu-Ende Verzoegerungen, die direkt die subjektiv wahrgenommene Sprachqualitaet beeintraechtigen. Ein weiterer Stoerfaktor stellen die mit steigenden Laufzeiten zunehmend als stoerend empfundenen und auch unvermeidbaren Echos dar. Aus diesem Grund stellt man hohe Anforderungen an die verwendeten Echokompensatoren, denen vor allem unter Gegensprechen nur teilweise entsprochen wird. Die laufzeitgesteuerte Erweiterung des herkoemmlichen Prinzips der Echokompensation verbessert die durch den Teilnehmer wahrgenommene Sprachqualitaet, indem es mit kleiner werdenden Echolaufzeiten weniger stark in das zur Uebertragung anstehende Signal eingreift. Das Eingangssignal des Echokompensators setzt sich aus dem Nutzsignal des lokalen Teilnehmers und den unerwuenschten Echos des fernen Sprechers zusammen. Die Steuerung des neu entwickelten Konzeptes basiert auf zwei kontinuierlich erfassten Parametern. Einerseits bestimmt die Echolaufzeit vom Mund bis zum Ohr des Sprechers nach einer vorgegebenen Kennlinie die notwendige Gesamtdaempfung des Echos. Andererseits ergeben die gemessenen Daempfungswerte entlang des Echopfades gemeinsam mit der zuvor ermittelten relativen Pegelreduktion die benoetigte Restechobedaempfung des Echokompensators. Die Bestimmung der Echoumlaufverzoegerung stellt die groesste Herausforderung im Rahmen der vorliegenden Arbeit dar. Die diskutierten Loesungsansaetze machen sich in diesem Zusammenhang grossteils die in den uebertragenen Sprachpaketen enthaltenen Zeitstempeln zu nutze. Die Ergebnisse eines Hoerversuches bestaetigen das Verbesserungspotenzial des laufzeitgesteuerten Ansatzes. Die Modellierung zweier analoger Teilnehmeranschluesse, die durch ein IP basierendes Telefonnetz miteinander verbunden sind, diente sowohl als Grundlage fuer die Simulation verschiedener Netzzustaende als auch fuer die Optimierung diverser Parameter des neuen Echokompensators. Die derart erzeugten, binauralen Sprachproben wurden von Versuchspersonen nach verschiedenen Gesichtspunkten in einem Hoerversuch beurteilt. Die Ergebnisse zeigen beachtliche Qualitaetsgewinne gegenueber dem herkoemmlichen Ansatz, die mit abnehmenden Laufzeiten zunehmen und unter bestimmten Bedingungen sogar den Qualitaetsstandard einer von vornherein echofreien Telefonverbindung erreichen.