Titelaufnahme

Titel
Gesichtserkennung in uneingeschränkten Video streams / von Philipp Omenitsch
Weitere Titel
Face recognition in unconstrained video streams
VerfasserOmenitsch, Philipp
Begutachter / BegutachterinKropatsch, Walter ; Laptev, Ivan
ErschienenWien, 2016
Umfangxv, 67 Seiten : Illustrationen, Diagramme
HochschulschriftTechnische Universität Wien, Univ., Diplomarbeit, 2016
Anmerkung
Zusammenfassung in deutscher Sprache
Text in englischer Sprache
SpracheEnglisch
DokumenttypDiplomarbeit
Schlagwörter (DE)Gesichtserkennung / Videosuche
Schlagwörter (EN)Face recognition / video search
URNurn:nbn:at:at-ubtuw:1-6798 Persistent Identifier (URN)
Zugriffsbeschränkung
 Das Werk ist frei verfügbar
Dateien
Gesichtserkennung in uneingeschränkten Video streams [11.41 mb]
Links
Nachweis
Klassifikation
Zusammenfassung (Deutsch)

Das Thema Gesichtserkennung ist gibt es schon lange in der Mustererkennung. Die jüngsten Fortschritte versprechen erfolgreiche Anwendungen für Videoüberwachung in großem Maßstab. Das Erkennen von Millionen von Menschen aufgenommen von tausenden Kameras birgt aber auch signifikante Kosten bezüglich Rechenleistung und Datenkommunikation. Diese Arbeit versucht die Komplexität von Gesichtserkennung in Videos zu reduzieren und verfolgt zwei komplementäre Strategien. Einerseits untersuchen Gesichtserkennung im "whitened"Deskriptorraum und verbessern die Komplexität der state-of-the-art Matched Background Similarity (MBGS) Methode. Andererseits untersuchen wir den Effekt den das Auswählen einer Teilmenge von Videobildern auf die Erkennungsgenauigkeit hat und zeigen, dass es möglich ist mit einem Bruchteil von Videobildern robuste Resultate zu erzielen. Für ein besseres Verständnis von Tiefen Faltenden Neuralen Netzwerken geben wir eine Einführung in das Thema und fassen aktuelle Entwicklungen zusammen, speziell im Bezug auf den weitbekannten ImageNet Wettbewerb. Wir evaluieren unsere Methoden und präsentieren konkurrenzfähige Resultate für den YTF und TSFT Benchmark mit signifikant niedrigerer Komplexität im Vergleich zu anderen Methoden.

Zusammenfassung (Englisch)

Face recognition is a long-standing topic in machine learning. Recent advances promise successful applications in large-scale video surveillance. Recognizing millions of people in thousands of streaming cameras, however, implies significant costs in terms of computations and communication bandwidth. This work aims to reduce the complexity of face recognition in video and pursues two complementary strategies. We first investigate face recognition in the whitened descriptor space and improve the complexity of the state-of-the-art Matched Background Similarity (MBGS) approach. Second, we study frame selection and demonstrate robust recognition performance from a small fraction of video frames. For a better understanding of the advancing Deep Convolution Neural Networks field, we give a thorough introduction to the topic and briefly summarize the recent development with a focus on the ImageNet classification challenge. We evaluate our methods and present competitive results for the YTF and TSFT benchmarks while significantly reducing the complexity of previous methods.