Titelaufnahme

Titel
Data mining strategies in large-scale agent-based models with applications in econophysics / von Werner Bayer
VerfasserBayer, Werner
Begutachter / BegutachterinThurner, Stefan
Erschienen2009
UmfangXII, 76 Bl. : Ill., graph. Darst.
HochschulschriftWien, Techn. Univ., Dipl.-Arb., 2009
Anmerkung
Zsfassung in dt. Sprache
SpracheEnglisch
DokumenttypDiplomarbeit
Schlagwörter (DE)data mining / agentenbasierte modelle
Schlagwörter (EN)data mining / agent-based models
URNurn:nbn:at:at-ubtuw:1-30338 Persistent Identifier (URN)
Zugriffsbeschränkung
 Das Werk ist frei verfügbar
Dateien
Data mining strategies in large-scale agent-based models with applications in econophysics [2.11 mb]
Links
Nachweis
Klassifikation
Zusammenfassung (Deutsch)

Agentenbasierte Modelle haben sich als unschätzbares Werkzeug in einer breiten Palette an Forschungsfeldern erwiesen - trotz der einhergehenden Nachteile von oft komplexer und modellabhängiger Programmierung der Agenten. Die Verwendung eines Massive Multiplayer Online Games (MMOG) mit Menschen als Teilnehmern anstelle von programmierten Agenten beseitigt viele dieser Nachteile und gibt Forschern zusätzlich die Gewissheit, dass sie echtes menschliches Verhalten studieren.

Das MMOG Pardus generiert täglich Millionen an Datensätzen und zeichnet dabei jede relevante Aktion eines jeden Spielers auf. Diese Aufzeichnungen sind in Form von täglichen Datenbank Sicherungen verfügbar. Es muss ein System konzipiert und implementiert werden, das alle Daten anonymisiert und vereint. Forscher müssen umfassende Abfragen auf den gesamten Zeitraum der gesammelten Daten tätigen können.

Data Mining Strategien werden evaluiert und in mehreren Bereichen wie Speicher Effizienz, Sicherheit, Geschwindigkeit und Fähigkeit zur simultanen Benutzung verglichen. Schließlich wird ein relationales Datenbank Management System (RDBMS) aufgrund seiner überlegenheit in allen Gebieten als Daten Back-End verwendet. Ein Datenbank Design wird so entworfen, dass es den enormen Fluss an Daten aufnehmen kann. Eine Applikation bestehend aus einem Kommandozeilen Programm und einem Web Front-End wird implementiert. Das Kommandozeilen Programm enthält Funktionen zur Extrahierung relevanter Daten der Sicherungen, zur Anonymisierung und zur Integration in das neue System. Das Web Front-End kann sowohl von Forschern für den Zugriff zu den Daten im System, als auch von Administratoren verwendet werden um neue Sicherungen zu importieren, Sicherungen vom System selbst anzulegen oder zur automatischen Ausführung zu planen.

Eine erste Verwendung der Applikation zeigt vielversprechende Resultate, die namhafte sozialwissenschaftliche Hypothesen erfüllen, und folglich auch die Realisierbarkeit von Data Mining in menschlichen agentenbasierten Modellen in großem Umfang wie in MMOGs untermauern.

Zusammenfassung (Englisch)

Agent-based models have proven to be a unique and valuable tool in a wide range of research areas, despite the inherent drawbacks of complex, large-scale, and often model-specific programming of agents.

The use of a massive multiplayer online game (MMOG), with real human participants in place of programmed agents, eliminates many of those drawbacks and allows researchers to confidently read data as accurately reflecting genuine human behavior.

The MMOG Pardus generates millions of data sets each day, logging each and every relevant user action including various social and economic engagements. These data sets are available in form of daily database backups. A system must be designed and implemented to combine and anonymize all data while keeping all correlations intact. Researchers need extensive querying capabilities on any and all timeframes of the data.

Data mining strategies are evaluated and compared in regards to storage size, practicality, security, speed and ability for concurrent usage.

Eventually a relational database management system (RDBMS) is used as data storage back-end due to its superiority in all areas. Subsequently a database layout is designed to accommodate the huge input of data. An application consisting of a command-line tool and a web front-end is implemented. The command-line tool contains functions for extracting the data from backups, anonymizing it and integrating it into the new system. The web front-end is both used by researchers accessing the data, and by administrators creating schedules for or manually exporting and importing data.

First usage of the application shows promising results, supporting famous social science hypotheses and thus confirming the feasibility of data mining in large-scale human agent-based models like MMOGs.