Bibliographic Metadata

Title
Recognizing structure in report transcripts : an approach based on conditional random fields (CRFs) / Jeremy Martin Jancsary
AuthorJancsary, Jeremy Martin
CensorTrost, Harald
Published2008
Description111 Bl. : Ill., graph. Darst.
Institutional NoteWien, Techn. Univ., Mag.-Arb., 2008
Annotation
Zsfassg. in dt. Sprache
LanguageEnglish
Document typeMaster Thesis
Keywords (DE)Strukturerkennung / Conditional Random Fields / Berichte / Graphische Modelle
Keywords (EN)structure identification / Conditional Random Fields / reports / graphical models
URNurn:nbn:at:at-ubtuw:1-14542 Persistent Identifier (URN)
Restriction-Information
 The work is publicly available
Files
Recognizing structure in report transcripts [1.01 mb]
Links
Reference
Classification
Abstract (German)

Typischerweise gibt automatische Spracherkennung lediglich eine Folge von Wörtern aus. Diese Sichtweise mag für einige Anwendungen ausreichend sein; andere wiederum benötigen eine etwas strukturiertere Vorgehensweise. Diese Diplomarbeit stellt ein Framework vor, das es ermöglicht, zugrundeliegende Strukturen in diktierten Berichten zu erkennen. Die explizite Ausweisung von strukturellen Elementen wie Abschnitten, Überschriften und Aufzählungen ist ein wichtiger Schritt in Richtung automatischer Nachverarbeitung von Diktaten. Der wissenschaftliche Beitrag dieser Diplomarbeit ist einerseits die Entwicklung eines generischen Ansatzes, der bestehende Spracherkennungssysteme dahingehend erweitert, dass strukturierte Ausgabe generiert werden kann; andererseits liegt der Beitrag in der Veröffentlichung eines frei verfügbaren CRF Toolkits, das dem zuvor genannten Ansatz zugrunde liegt, aber auch für viele andere Problemstellungen einsetzbar ist.

Abstract (English)

Typically, the output of ASR is a mere sequence of words. This view may be sufficient for some tasks, whereas others require a more structured approach. This thesis presents a framework that allows for identification of deep, underlying structure in report dictations.

Identification of structural elements, such as headings, sections and enumerations is an important step towards automatic post-processing of dictated speech. The contributions of this thesis include a generic approach that can be integrated seamlessly with existing ASR solutions and provides structured output, as well as a freely available CRF toolkit that forms the basis of aforementioned approach and may also be applicable to numerous other problems.

Stats
The PDF-Document has been downloaded 30 times.