Evolution@home (beendet)/Interview

Aus Rechenkraft
Wechseln zu: Navigation, Suche


Im Mai 2008 interviewte Rechenkraft (RKN) den Projektbetreiber von Evolution@home, Laurence Loewe (LL).
RKN:
Hallo Laurence, wann bist Du selbst zum ersten Mal mit dem Thema "distributed computing" in Berührung gekommen?
LL:
Im Jahr 1999, als ich einen Zeitungsartikel über GIMP las. Ich fand die Idee faszinierend, weil ich schon damals Rechenzeitprobleme hatte.
RKN:
Hast Du selbst vor Evolution@home auch für andere Projekte Rechenzeit zur Verfügung gestellt, indem Du einen Client auf deinen Rechner geladen hast? Wenn ja, für welches Projekt?
LL:
Ja, ich habe mal bei SETI@home Classic mitgerechnet, um zu sehen, wie das so ist. Ansonsten waren meine Rechner immer ganz gut mit meinen eigenen Problemen ausgelastet.
RKN:
Wann bist Du auf die Idee gekommen, ein eigenes DC-Projekt zu starten?
LL:
Um das Jahr 2000, als für mich abzusehen war, dass meine Rechenzeitprobleme nicht kleiner werden würden. Ich habe damals gemerkt, dass es wahrscheinlich immer Evolutionsmodelle geben wird, die ich interessant finde, und die mit den mir normalerweise zur Verfügung stehenden Rechenkapazitäten nicht bearbeitbar sind. Global computing erweitert hier einfach den Horizont der möglichen Fragestellungen.
RKN:
Wer hat dich dabei unterstützt und wie reagierten die anderen Wissenschaftler an Deinem Institut?
LL:
Ich hatte das Glück, jeweils Chefs gehabt zu haben, die mir viele Freiheiten gelassen haben. So konnte ich evolution@home starten und weiterentwickeln. Nach dem Start begann die Unterstützung durch Leute, die mitgerechnet haben, Rechenkraft.net eingeschlossen. Das hat meinen Kollegen gezeigt, dass das Prinzip funktioniert.
RKN:
Das Projekt evolution@home gibt es schon seit einigen Jahren, was genau wird denn da simuliert?
LL:
Im Allgemeinen geht es um die Simulation von Evolution und damit verwandte Fragestellungen. Diese Probleme eignen sich oft gut zum Parallelisieren. Da Probleme aus der Evolutionstheorie sehr unterschiedlich sind, wird jeweils eine Klasse von Problemen in einen Simulator gepackt, der dann global verteilt werden kann. Der momentan aktuelle "Simulator005" untersucht, was passiert, wenn Lebewesen über sehr lange Zeit ohne Rekombination auskommen müssen und dabei nachteiligen Mutationen ausgesetzt sind. Dieses Problem ist wichtig, um zu verstehen, wie wichtig Sex ist, denn aus evolutionsbiologischer Sicht ist Rekombination die Hauptfunktion von Sexualität. Eines der Modelle, welches hierzu interessant ist, wird "Muller's Ratsche" genannt. Wenn man dieses Modell versteht, dann kann man vorhersagen, wie schnell sich geringfügig nachteilige DNA Veränderungen ansammeln.
RKN:
Welche Ergebnisse hat es bisher gebracht?
LL:
Ergebnisse gibt es an mehreren Fronten. Zunächst einmal sind da die Aspekte aus der Informatik. Evolution@home begann als eines der einfachsten denkbaren global verteilten Rechensysteme und es war nicht klar, ob ein so einfach gestricktes System auch funktionieren würde. Das kann mittlerweile mit einem "Ja" beantwortet werden, wobei auch die Grenzen dieses Systems deutlich wurden. Diese Ergebnisse wurden veröffentlicht (link).

Wesentlich wichtiger sind jedoch die biologischen Ergebnisse. Hier hat sich evolution@home zur größten Datenbank von "Muller's Ratsche"-Simulationsergebnissen gemausert, die es momentan gibt. Auch wenn sie (noch) nicht öffentlich ist, so kann ich doch mit verhältnismäßig einfachen Mitteln einigermaßen komplexe biologische Fragen beantworten und so Vermutungen über Muller's Ratsche testen.

Zum Beispiel wurde vor einigen Jahren vermutet, dass die hohen Mutationsraten, die in menschlichen Mitochondrien beobachtet wurden, doch eigentlich zu hoch sein müssten, wenn man bedenkt, daß es in diesem genetischen System keine (beobachtbare) Rekombination gibt. Ich konnte mittels der evolution@home Ergebnisse nachweisen, dass dies in der Tat der Fall ist: Wenn man das momentane Lehrbuchwissen über menschliche Mitochondrien mit dem Standardmodell von Muller's Ratsche und beobachteten Mutationsraten kombiniert, dann würde man erwarten, dass die menschliche Abstammungslinie in den letzten 20 Millionen Jahre hätte aussterben sollen. Dies zeigt, dass das momentane Standardmodell verfeinert gehört und in der entsprechenden Veröffentlichung liste ich mehr als 10 spezifische Möglichkeiten dafür auf (PDF, 1.7MB).

RKN:
Werden diese Ergebnisse, die auf den PC normaler Internetnutzer in aller Welt berechnet wurden, in der Wissenschaft genau so ernst genommen, wie die, die unter "Standardbedingungen" mit gekaufter Rechenzeit auf Supercomputern zustande kommen? Wie ist das Feedback deiner Kollegen?
LL:
Die Ergebnisse werden genauso ernst genommen. Schließlich muss man in beiden Fällen glaubhaft machen, dass es sich bei den Ergebnissen um verlässliche Biologie handelt und nicht um Programmierfehler.
RKN:
Wird es weitere Veröffentlichungen geben?
LL:
Ja. Nachdem Muller's Ratsche in menschlichen Mitochondrien untersucht wurde, stehen eine Reihe anderer Organismen auf dem Programm, bei denen ebenfalls schon spekuliert wurde, daß Muller's Ratsche sie ins Aussterben getrieben haben sollte. Ich denke, dass es wichtig ist für diese Art von Forschung, nicht nur mit Worten zu spielen, sondern klar definierte Hypothesen zu getesten. Veröffentlichungen werden hier aufgelistet.
RKN:
Wie sieht die Zukunft von Evolution@home aus?
LL:
Neben einer Reihe weiterer Tests von den Effekten von Mullers Ratsche in verschiedenen asexuellen Arten, plane ich auch etwas komplexere Modelle zu analysieren, um so die Theorie zu Mullers Ratsche weiterzuentwickeln. AuÃ?erdem arbeite ich an dem nächsten Simulator, der eine etwas andere Fragestellung untersuchen wird. An einigen konkreten Beispielen wird er die Frage analysieren, wie viele vorteilhafte und nachteilige Mutationen in molekularen Systemen zu erwarten sind. Die Systeme die Simulator006 analysieren wird - sogenannte â??circadiane Uhrenâ?? - sind dafür verantwortlich, dass wir am Morgen wach und am Abend müde werden. Danach wird es weitere Simulatoren geben, die sich verschiedenen Fragen aus der Evolutionsbiologie widmen. Insgesamt gibt es da sehr viel zu tun.
RKN:
Was hat die Integration von evolution@home in BOINC bisher gebracht und was versprichst Du Dir in Zukunft davon?
LL:
In einem Wort: Rechenkraft. In den ersten 5 Monaten der Integration wurden > 120 CPU Jahre beigetragen und teilweise waren bis zu mehrere Hundert Rechner im Einsatz. Momentan bin ich dabei, meine Analyse-Algorithmen und meinen Workflow anzupassen, um da hinterher zu kommen. Die BOINC Anbindung dürfte viele entsprechende Forschungsarbeiten deutlich beschleunigen.
RKN:
Was für eine Serverhardware wird für das Projekt eingesetzt?
LL:
EvoHo Plone Server 500.JPG
EvoHo Data Storage 500.JPG
Momentan noch nichts Besonderes. Neben einem Plone Webserver für die Website ist hier vor allem eine Reihe von Festplatten gefragt, die alle entsprechenden Ergebnisse speichern, damit sie nicht durch Plattenausfälle verloren gehen.
RKN:
Wie viel Speicherplatz benötigt bisher das gesamte Projekt? Wie viel MB werden pro Woche erzeugt?
LL:
Das hängt sehr von der Zählweise ab, da die momentane Art Ergebnisse zu speichern sehr ineffizient ist. Das ist eines der Hauptprobleme welches es in nächster Zeit zu lösen gilt. Momentan belegen evolution@home Daten auf meinen Festplatten knapp 100 GB. Mit einer geeigneten Infrastruktur, die Redundanz vermeidet, lieÃ?e sich das aber deutlich reduzieren. Seit BOINC dabei ist, kommen im Schnitt etwa 50 MB komprimierte Daten pro Woche an, doch um damit etwas anfangen zu können, muss ich die momentan entpacken.
RKN:
Es geht bei Evolution@home (EAH) ja um menschliche, mitochondriale DNA und die Frage, ob das angebliche Fehlen von Rekombination und Reparatur zum Aussterben der Menschheit führen könnte und in welchem Zeitrahmen das nun passieren müsste. Nun hat Dein Projekt ja wohl schon ein Ergebnis vorzuweisen, welches besagt, dass auf Basis der bei EAH eingesetzten Annahmen der Mensch längst hätte ausgestorben sein müssen, da seine Mitochondrien durch Anhäufung von Mutationen inzwischen zerstört sein sollten. Kannst Du das einmal genauer skizzieren: Wie genau geht EAH vor, wie sicher sind die Annahmen, die das Programm voraussetzt, wie sieht der Algorithmus aus?
LL:
Bei evolution@home wird eine Vielzahl von Annahmen eingesetzt, die aber in der Hauptsache auf dem bisher vorhandenen Lehrbuchwissen und den bisher genauesten Beobachtungen zum Thema basieren. Man hat einfach noch keine mitochondriale DNA Rekombination in der menschlichen Keimbahn gesehen. Was man dagegen gesehen hat ist, dass mitochondriale DNA erstaunlich schnell mutiert. Ansonsten wird ein einfaches populationsgenetisches Modell eingesetzt (die Standardversion von â??Mullers Ratscheâ??), welches die sich daraus ergebende Anhäufung von geringfügig nachteiligen Mutationen vorhersagen kann. Alles in allem ziemlich normale, solide Modellbildung, die für dieses Gebiet übliche Vereinfachungen macht, um nicht in zu vielen Details unterzugehen. Eine dieser Vereinfachungen ist beispielsweise, dass Simulator005 keine Rückmutationen erlaubt. Dies könnte sich als kritisch herausstellen. Für eine genauere Beschreibung möchte ich gerne auf den wissenschaftlichen Artikel verweisen (PDF, 1.7MB).

Erstaunlicherweise liefert dieses Standardmodell jedoch alles andere als "Standardergebnisse": Aufgrund der Rechnungen würde man erwarten dass die menschliche Evolutionslinie innerhalb von 20 Millionen Jahren ausgestorben sein sollte, wenn nichts übersehen wurde und die heutigen Prozesse in der Vergangenheit genauso gewirkt haben. Letzteres ist natürlich schwer herauszufinden und bietet einige Möglichkeiten, um das Paradox wieder aufzulösen. Es geht hier zunächst allerdings nicht darum, das Paradox "Hauptsache irgendwie" aufzulösen, sondern darum, dies möglichst im Einklang mit der Wirklichkeit zu tun. In dem wissenschaftlichen Artikel, der die Ergebnisse vorstellt, beschäftige ich mich ausführlich mit den verschiedenen möglichen Lösungen, von denen manche mehr und manche weniger glaubwürdig sind. Ich bin auch nicht der erste, der auf ein solches Genomzerfallsparadox gestoÃ?en ist. Mein Artikel enthält die bislang vollständigste Liste von möglichen Lösungen für Genomzerfallsparadoxe, insgesamt 30, von denen 10 eine besondere Rolle in Mitochondrien spielen könnten.

Die nächste groÃ?e Herausforderung wird sein, festzustellen, welche dieser vielen Lösungsversuche etwas taugen und welche nicht. Dafür werden noch viele weitere Simulationen benötigt und auch noch einige neue Simulatoren.

RKN:
Inzwischen befaÃ?t sich EAH ja mit der Frage, warum wir noch da sind, obwohl das Mitochondrium doch eigentlich längst hätte "kaputtmutiert" sein sollen. Wie wird diese Frage konkret bei EAH angegangen? Ist es nicht möglich, dass es eben doch Rekombination und Reparatur mitochondrialer DNA gibt und wir die dazugehörigen Mechanismen schlicht noch nicht entdeckt haben?
LL:
Noch unentdeckte Rekombination ist freilich eine Möglichkeit und es hat in den letzten Jahren eine Debatte dazu gegeben, die momentan jedoch so aussieht, dass nach momentanem Stand des Wissens keine Rekombination in der menschlichen Keimbahn nachgewiesen werden konnte. Ich persönlich halte andere Lösungen momentan für wahrscheinlicher. Beispielsweise ignoriert die bisherige Analyse sämtliche Rückmutationen, vorteilhafte Mutationen und alle Mutationen, die Schäden von anderen Mutationen ausgleichen (sogenannte kompensatorische Mutationen). Es ist durchaus möglich, dass eine Miteinbeziehung dieser Prozesse das Paradox bereits auflösen. Sie tun es ganz sicher, wenn es genügend dieser vorteilhaften Mutationen gibt, doch ob das realistisch, muss erst noch geklärt werden. Ich habe in den letzten Jahren viel Zeit damit verbracht, die Frage nach der Verteilung der Mutationseffekte zu untersuchen. Das ist ein sehr herausforderndes Forschungsfeld. Der nächste Simulator (S006) wird sich ebenfalls dieser Frage widmen, wenn auch an einem anderen Beispielsystem. Die moderne molekulare Systembiologie könnte hier weiterhelfen.
RKN:
Ist es richtig, daÃ? Du bei Prof. Siegfried Scherer an der TU München promoviert hast? Nun ist Prof. Scherer in der Öffentlichkeit ja bekannt als jemand, der eher einer Schöpfungsanschauung zugetan ist. Er scheint nicht glauben zu können, dass all die hochkomplizierten molekularen Maschinen (gerne hat er das bakterielle Flagellum, also den bakteriellen GeiÃ?elapparat zur Fortbewegung, als Beispiel aufgegriffen) durch Evolution im Sinne Darwins entstanden sein können. Wie stehst Du zu dieser Thematik?
LL:
Während meiner Promotion bei Siegfried Scherer habe ich ihn Andersdenkenden gegenüber als sehr fair erlebt. Obwohl ich beträchtlich an seinen Theorien gekratzt habe, hat er mir bei meiner Promotion keine Steine in den Weg gelegt. Siegfried Scherer hat in den letzten Jahren auch einen erstaunlichen Positionswechsel vollzogen, so dass ich nicht einmal genau sagen kann, was er selbst momentan glaubt. Er scheint also lernfähig zu sein. Als Mikrobiologe stöÃ?t er jedoch bei populationsgenetischen Fragen schnell an die Grenzen seiner Möglichkeiten.

Die Argumente die ich von Siegfried Scherer zum Bakterienmotor bisher gesehen habe, finde ich nicht überzeugend. Momentan kenne ich keine wissenschaftliche Theorie, die den Ursprung des Bakterienmotors eleganter erklären könnte als die moderne Evolutionstheorie. Das gilt trotz mancher Fragen, die man an entsprechende Modelle stellen mag.

RKN: Vielen Dank für das Interview.
LL: Gerne geschehen.

Eigene Werkzeuge