Titelaufnahme

Titel
Bayesian foundations for improving robustness and reliability of computational biological inference / von Alexandra Posekany
VerfasserPosekany, Alexandra
Begutachter / BegutachterinFelsenstein, Klaus ; Sykacek, Peter
Erschienen2013
UmfangVIII, 163 S. : Ill., graph. Darst.
HochschulschriftWien, Techn. Univ., Diss., 2013
Anmerkung
Zsfassung in dt. Sprache
SpracheDeutsch
Bibl. ReferenzOeBB
DokumenttypDissertation
Schlagwörter (DE)Bayes, Robuste Inferenz, ANOVA, MCMC, Mischverteilung, Student-t Verteilung, Bioinformatik, Microarray Analyse
Schlagwörter (EN)Bayesian statistics, robust inference, ANOVA, MCMC, Bayesian mixture model, student's t distribution, bioinformatics, microarray analysis
Schlagwörter (GND)Microarray / Datenanalyse / Statistische Schlussweise / Bayes-Verfahren / Robuste Statistik
URNurn:nbn:at:at-ubtuw:1-57574 Persistent Identifier (URN)
Zugriffsbeschränkung
 Das Werk ist frei verfügbar
Dateien
Bayesian foundations for improving robustness and reliability of computational biological inference [8.87 mb]
Links
Nachweis
Klassifikation
Zusammenfassung (Deutsch)

Im Verlauf der letzten Jahrzehnte haben sich ''high-throughput'' Technologien im Bereich der biologischen und medizinischen Forschung etabliert. Diese Methoden haben zu einem Anstieg der Menge an rechnergestützten Methoden, um mit diesen Daten umzugehen, geführt.

Allgemeine verwendete Annahmen der statistischen Modellbildung sind für diese Daten oft nicht erfällt, Stichprobengrößen sehr klein verglichen mit der Anzahl der zu schatzenden Parameter, während die Beobachtungen meist stark schwanken und sich alles andere als normalverteilt verhalten. Diese Herausforderung wird im Rahmen dieser Dissertation aufgegriffen. Um mit den komplizierten Gegebenheiten der biologischen Daten umzugehen, insbesondere mit Microarraydaten, werden hierarchische Bayesmodelle konzipiert. Verschiedene Ansätze und Methoden der Robusten Bayes Statistik werden angewandt, um mit diesen Daten umzugehen. Ein hierarchischer Modellansatz hat auch den Vorteil, einen zusätzlichen Grad der Robustheit gegenüber der a-priori Verteilung und Wahl der Hyperparameter zu bieten. Um mit der Herausforderung the ''overdispersion'' umzugehen, werden Student t Verteilung und Mischverteilungen von t und Normalverteilungen in Betracht gezogen, um Robustheit in Bezug auf die Likelihood Funktion zu bekommen. Die Modelle werden als Markov Chain Monte Carlo Algorithmen implementiert und mit entsprechenden Methoden aus dem Gebiet auf Konvergenzverhalten geprüft. Die biologischen Ergebnisse, die mittels dieser komplexen Ansätze gewonnen werden, werden mit existierenden Methoden aus der Bioinformatik verglichen. Darüber hinaus gehende biologische Schlussfolgerungen und Interpretationen werden ebenfall im Bereich der Bioinformatik evaluiert und auf Sinnhaftigkeit geprüft.

Zusammenfassung (Englisch)

During the past decades high-throughput technologies have been established in biological and medical research. These methods have led to an increase in computatonal approaches to deal with their data. In addition, the data poses a challenge for data analysis. Assumptions made for general approaches in statistical modelling are often not fulfilled, sample sizes are very small compared to the number of variables to estimate, while the observations are overdispersed and the noise is behaving far from Gaussian. This challenge is met in this thesis. For dealing with the complicated situation of biological data, in particular coming from microarrays, hierarchical Bayesian models are designed. Various ideas and Methods of Bayesian Robustness are applied for dealing with the difficult situation at hand. The hierarchical model has the advantage of providing an additional degree of robustness regarding the choice of priors and model parameters.

For approaching the challenge posed by overdispersion, student's t distributions and mixtures of student's t and normal distributions are considered to gain robustness with respect to the likelihood. The models are implemented and tested as computationally intense Markov Chain Monte Carlo sampling algorithms which are sanity checked by appropriate methods from this field. The findings gained by these more sophisticated methods are compared with existing approaches in the field of bioinformatics. Sanity checks regarding biological conclusions and interpretation of the results are gained by applying bioinformatical methods.