Vorteil / Nachteil von Projekten

Grid-Computing, technische Entwicklung von Distributed Computing...
Nachricht
Autor
Benutzeravatar
Der Diplomat
Powerknopf-Verweigerer
Powerknopf-Verweigerer
Beiträge: 1470
Registriert: 21.07.2001 01:00
Wohnort: Landsberg

#1 Ungelesener Beitrag von Der Diplomat » 30.12.2001 15:28

Heute war ich auf der Suche nach sinnvollen Projekten, dabei viel mir auf, dass es tatsächlich solche gibt, sie aber immer irgendwo einen Haken haben.



So gefällt mir zum Beispiel sehr gut, wie mit den Ergebnissen von Folding@Home verfahren wird, dafür will das Ding im Netz nicht funktionieren.



Und das eine oder andere konnte man ja aus den Foren extrahieren. Könnt Ihr die Liste erweitern, verbessern?



Zusammenfassung:



ENTROPIA

Vorteil:

Man kann sich die Zweige der Forschung aussuchen, die man mit idle-cycles unterstützen will.

Nachteil:

Die Entropia3000 funktioniert nur sauber bei ständiger online Verbindung und durchlaufendem Rechner.

Klickt man den Pause-Button an, wird nach erneutem Start (Play) ein neues Assignment geladen.



SETI@HOME

Vorteil:

Sehr viele Tools.

Viele Teamseiten mit zahlreichen Foren und Statistiken.

Nachteil:

Kein optimierter Client, Verschwendung der vorhandenen Rechenkraft.



Folding@Home

Vorteil:

Die Ergebnisse werden wissenschaftlich ausgewertet und durch die wissenschaftlichen Publikationsorgane

(Nature, Science, etc.) der breiten wissenschaftlichen Öffentlichkeit zur Verfügung gestellt.

Nachteil:

Will nicht übers Netzwerk mit einem Java-Proxy (SohoConnection) laufen.



UnitedDevices

Vorteil:

Alles ist vorhanden (Forum, Statistiken, läuft übers Netzwerk)

Nachteil:

Die Ergebnisse werden nicht der breiten wissenschaftlichen Öffentlichkeit zur Verfügung

gestellt, sondern einer Firma zu kommerziellen Verwertung übergeben.



Distributed.net

Vorteil:

Der Client eignet sich hervorragend, als Krumen-Sammler. Er nutzt die Rest-Rechenkraft-Kapazität,

die andere Projekte nicht nutzen, bzw. wenn die anderen Clients gerade neue WUs abholen

oder Idle sind.

Nachteil:

Schlechte Öffentlichkeitsarbeit. Warum die OGR-24 Ergebnisse immer noch nicht vollständig sind,

ist offiziell nicht erklärt worden.



ECCp-109

Vorteil:

Siehe distributed.net

Nachteil:

Nicht gerade sehr nützlich, außer, dass die kommerziellen Verschlüsselungs-Technologie-Firmen wissen, dass wir x-Wochen brauchen, um einen Code zu knacken.

Benutzeravatar
vfrey
GPU-Einsetzer
GPU-Einsetzer
Beiträge: 2322
Registriert: 28.06.2001 01:00
Wohnort: Kirchseeon

#2 Ungelesener Beitrag von vfrey » 30.12.2001 18:28

Zu Folding@Home: bis heute habe ich noch keine Aussage dazu, ob die Ergebnisse des Projekts in absehbarer Zeit einen konkreten praktischen Nutzen haben könnten? Oder ist das alles vorerst nur wissenschaftliche Basisarbeit?



Zu Entropia: keine mir bekannte Aussage über Projektfortschritte vorhanden.



Weitere Projekte:



D2OL

Vorteile: neuer interessanter Client; extrem schnelle Erreichbarkeit der Entwickler; schnelles Eingehen auf Userwünsche. Fazit: da geht was voran.



Nachteile: Anthrax und Pocken sind m. E. nicht die wirklich wichtigsten Ziele in der medizinischen Forschung; wie Sengent-Leute im Forum erklärten, ist das D2OL-Projekt auch in erster Linie zur Demonstration der Leistungsfähigkeit ihrer Platform gedacht... <IMG SRC="/phpBB/images/smiles/uhoh.gif" alt="uh oh">



Evolution@Home

Bedeutung: da das Aussterben von Rassen m. E. durchaus Auswirkung auf das Ökosystem hat, wird unsere Rasse dadurch mittelbar auch betroffen.



Vorteile: schnelle Raktionszeiten des Betreibers auf e-mails; mir persönlich wirklich sympathisches Projekt (das zählt jetzt aber nicht als Vorteil, oder... <IMG SRC="/phpBB/images/smiles/icon_biggrin.gif" alt="Very Happy"> )



Nachteile: keine Statistiken; kein automatisierter Client; seltene Updates der Projektseite. <IMG SRC="/phpBB/images/smiles/crying.gif" alt="weinen">



So, das reicht jetzt aber erstmal...

Benutzeravatar
Der Diplomat
Powerknopf-Verweigerer
Powerknopf-Verweigerer
Beiträge: 1470
Registriert: 21.07.2001 01:00
Wohnort: Landsberg

#3 Ungelesener Beitrag von Der Diplomat » 30.12.2001 18:31

Zu folding@home:

I presented some of our Folding@Home results at a conference last weekend, and the response was great. I talked about our DNABindingMimick (zinc finger) results, which Chris is close to submitting (we're waiting for experimental confirmation of our results).

Also, the villin results are looking great. Bojan has done a great job with the analysis and will likely start writing up the results in early January, hopefully to submit it very soon ...



Außerdem:

Finally, Chris is pretty close to finishing his BBAW paper. We ran BBAW mainly on 1.x, and have A TON of data for it, which is really extroadinary.



Das hört sich doch nach wissenschaftlicher Arbeit an den Results an.



Michel

Benutzeravatar
Der Diplomat
Powerknopf-Verweigerer
Powerknopf-Verweigerer
Beiträge: 1470
Registriert: 21.07.2001 01:00
Wohnort: Landsberg

#4 Ungelesener Beitrag von Der Diplomat » 30.12.2001 18:32


Benutzeravatar
vfrey
GPU-Einsetzer
GPU-Einsetzer
Beiträge: 2322
Registriert: 28.06.2001 01:00
Wohnort: Kirchseeon

#5 Ungelesener Beitrag von vfrey » 30.12.2001 18:38

Hallo Michel,



ich kenne die Aussagen von Vijay Pande. Deswegen weiß ich immer noch nicht, ob das Projekt dazu führt in, sagen wir mal, 2 Jahren z. B. Alzheimer heilen zu können... <IMG SRC="/phpBB/images/smiles/icon_confused.gif" alt="Confused">



Die Fachleute wie Michael Weber vom Team Germany schauen leider nie auf Rechenkraft.de vorbei, um sowas zu erklären... <IMG SRC="/phpBB/images/smiles/icon_wink.gif" alt="Wink">

Benutzeravatar
LinuxFan
Vereinsmitglied
Vereinsmitglied
Beiträge: 1200
Registriert: 17.07.2001 01:00
Wohnort: Berlin

#6 Ungelesener Beitrag von LinuxFan » 30.12.2001 21:37

@Diplomat: Bei mir laufen Folding@Home und Genome@Home wunderbar im Netzwerk.

Dazu habe ich auf dem Rechner mit Internetanbindung Masquerading eingerichtet, und auf allen anderen Rechnern dessen IP als Standard-Gateway eingetragen.



Sowas müsste unter Windows auch möglich sein, nennt sich Network Address Translation (NAT)...



@vfrey: Soweit ich weiß sind Folding@Home und Genome@Home in erster Linie Grundlagenforschung, konkrete Medikamente kann man also nicht erwarten, was aber kein

Nachteil sein muss. (Grundlagenforschung muss ja auch gemacht werden...)



Ich werd' mal Michael bitten, bei Rechenkraft.de vorbeizuschauen. Dann kann er uns ja mal aufklären <IMG SRC="/phpBB/images/smiles/icon_wink.gif" alt="Wink">



Er profitiert übrigens auch direkt von Genome@Home, weil er Ergebnisse für seine Doktorarbeit an bacillus subtilis verwendet. Aber das kann er ja mal selbst erzählen <IMG SRC="/phpBB/images/smiles/icon_wink.gif" alt="Wink">

Gast

#7 Ungelesener Beitrag von Gast » 31.12.2001 15:45


Der Diplomat schrieb am 2001-12-30 18:32 :

Quelle: http://folding.stanford.edu/news.html


Moin zusammen! <IMG SRC="/phpBB/images/smiles/wavey.gif" alt="winken">

Gerade lese ich - zugegeben zum ersten Mal - eure Posts auf Rechenkraft.de. LinuxFan hatte mich schon vor einiger Zeit mal hierherverwiesen, aber ich habe bisher einfach die Zeit nicht gefunden... Ja, also erst einmal muß ich sagen, daß ich Folding@home & Genome@home trotz der sicherlich immer noch vielen Mängel MIT ABSTAND als "sinnvollste" dc-Projekte betrachte (einige Details vgl. unten). Ich bin auch total froh, daß wir in unserem Team (www.folding.de.tf - leider noch nicht voll funktionstüchtig wegen unseres kürzlich erzwungenen Umzugs auf unseren Uniserver) so kräftig dazu beitragen können, daß es (hoffentlich) ein Erfolg wird. Viele Leute haben ihre Kisten Tag und Nacht für das Projekt am Laufen - ohne Rücksicht auf "Verluste" - und ich hoffe, daß wir im neuen Jahr noch einmal anständig an Teilnehmern zulegen können. <IMG SRC="/phpBB/images/smiles/spinningsmiley.gif" alt="rolling"> Ich habe z.B. (eigentlich schon seit längerem) vor, einen kleinen Artikel zu beiden Projekten zu schreiben und einer der größeren Computerfachzeitschriften (= große Leserschaft) zur Veröffentlichung anzubieten - mit etwas mehr Hintergrund als bloß eine Beschreibung der Software/Gründer/Ziele, etc. Mal sehen, ob es klappt. Leider bin ich in letzter Zeit mit dem Schreiben meiner Dissertation etwas arg ausgelastet... daher auch all die Verzögerungen... sorry...



Vielleicht "ganz kurz" zu den Projekten FAH und GAH ein paar Infos für die, die davon noch nichts gehört haben und dann ein paar Anmerkungen dazu, in welchem Zeitrahmen man was erreichen kann - denn das scheint hier im Forum ja die Tenorfrage zu sein.



Bei FAH wird untersucht, wie Proteine sich Falten.

Proteine sind nichts anderes als eine Aneinanderkettung von Aminosäuren (kleine Moleküle). Es gibt insgesamt 20 Aminosäuren, die in beliebiger Kombination aneinandergekettet werden können und dann ein Protein ergeben. In lebenden Zellen werden Proteine von Ribosomen hergestellt - das sind riesige Maschinen (die übrigens selbst u.a. aus einer Zusammenlagerung von über 50 Proteinen bestehen), die ein Informationsmolekül namens RNA erkennen, binden und lesen können. Ribosomen lesen die RNA und übersetzen sie in eine Aminosäurekette Schritt für Schritt genau wie ein Computer ein Programm abarbeitet. Das Ribosom besitzt einen Tunnel aus dem die entstehende Aminosäurekette - also das Protein - während seiner Herstellung langsam herauswächst. Sobald diese Aminosäurekette Stück für Stück freigesetzt wird, beginnt sich das Protein zu falten. Das heißt, die aneinandergeketteten Aminosäuren bewegen sich mit einer bestimmten Geschwindigkeit (abhängig von der Temperatur) im Raum herum. Wenn sie in die Nähe eines Bindungspartners kommen, sodaß eine stabile Wechselwirkung auftreten kann (z.B. ein negativ geladener Bereich der einen Aminosäure gerät in die Nähe eines positiv geladenen Bereichs einer anderen Aminosäure), so bleiben diese beiden Bereiche u.U. zusammen. Das Protein faltet sich also. Genau diesen Prozeß versucht Vijay Pande's Gruppe in Stanford im Computer auf der Basis von recht komplizierten quantenmechanischen Berechnungen zu simulieren. Dabei ist klar: wenn man in der Lage ist, den Faltungsweg eines Proteins korrekt vorherzusagen, erhält man damit als Endergebnis auch die genaue Raumstruktur des Proteins. Kennt man die Struktur eines Proteins, kann man oft auf seine Funktion schließen, bzw. "eine Idee bekommen", wozu es wohl nützlich ist. Eine solche Idee muß man dann natürlich im Labor nachweisen. Normalerweise reicht eine solche "Idee" allerdings aus, um der Funktion eines Proteins auf die Spur zu kommen.

Klar ist auch, daß die Berechnung der Proteinfaltung umso komplizierter wird, je größer ein Protein ist (d.h. je mehr Aminosäuren aneinandergekettet sind). Genau hier liegt meines Erachtens der limitierende Faktor für F@H und auch G@H (siehe unten). Bislang wurden "nur" recht kleine Proteine gefaltet - allerdings erfolgreich, d.h. das was Vijays Programm am Ende ablieferte, stimmte mit einer zuvor experimentell ermittelten Struktur des Proteins überein (eine RIESENLEISTUNG für die heutigen Möglichkeiten!!!). Man muß allerdings zugeben, daß "der Fachmann" die bisher untersuchten Projektproteine kaum als Proteine bezeichnet, sondern eher als Peptide. Das ist die Bezeichung für KLEINE Proteine. Außerdem handelte es sich dabei entweder um künstliche Peptide, d.h. solche, die man sich zu Grundlagenforschungszwecken ausgedacht, hergestellt und strukturell bestimmt hat oder um Fragmente von real in Zellen auftretenden Proteinen. Diese Vereinfachungen sind allerdings zwingend notwendig, um erst einmal die Fähigkeiten des Denkansatzes zu prüfen, der sich in dem F@H/-Client manifestiert hat. Diese inzwischen publizierten Überprüfungen sehen SEHR positiv aus, d.h. man kann nun hoffen, daß sich dieser Ansatz auch für größere Proteine einsetzen läßt. In der Tat ist Vijay inzwischen auf größere Proteinfragmente umgestiegen. Er hat ja auch das Clientprogramm völlig umschreiben lassen, um einige der Limitationen der Vorgängerversion zu beheben und muß nun erneut prüfen, ob es den neuen Anforderungen gerecht wird. Daran arbeiten wir im Prinzip im Augenblick, wenn wir F@H auf unseren Rechenknechten laufen lassen. Was schön ist, ist die Tatsache, daß Vijay es versteht, diese "Testläufe" - die nun immerhin schon 1 Jahr andauern - mit der Erarbeitung wissenschaftlich sinnvoller Ergebnisse zu verknüpfen. Dennoch: ich bin überzeugt davon, daß der Algorithmus nicht ausreichen wird, um wirklich große Proteine zu simulieren. Ich muß allerdings zugeben, daß ich dies behaupte, ohne den Algorithmus je gesehen zu haben. Das ist einer der Gründe, weshalb ich schon seit geraumer Zeit versuche, Vijay davon zu überzeugen, den Quellcode für F@H & G@H freizugeben: damit andere Verbesserungsvorschläge machen können. Er hat dies auch für Ende Januar angekündigt - ich habe Zeit... Es gibt also noch Einschränkungen für die Anwendbarkeit des Projektes, aber man muß eines ganz klar sagen: dies ist das erste und bislang einzige Projekt, daß sich diesem Problem überhaupt widmet: es ist eine der größten Herausforderungen aller Zeiten, aus der simplen Aminosäuresequenz die Faltungsdynamik und die Proteinstruktur vorhersagen zu können!!! Und ich habe mir vorgenommen, an jedem Versuch teilzunehmen, der diese Fragestellung angeht. Die ollen Kisten stehen zuhause sonst eh nur blöde herum und lassen Textverarbeitungen laufen - manchmal vielleicht auch was Sinvolles, wie z.B. Quake, hehehehehe...

Nun gut, ich bin auch recht zufrieden, daß Vijay das Newsforum aufgeteilt hat in mehrere Themen. Dort gibt es jetzt das "science"-Forum, wo man all diese wissenschaftlichen Fragen stellen kann UND SOLL. Dort hockt der Eric aus Vijays Gruppe, der sich darum kümmert. Ich habe dort auch schon ein paar Verbesserungsvorschläge für F@H vorgestellt und die Jungs da drüben haben ähnliche Ideen, sodaß ich doch recht zuversichtlich bin, was die Zukunft des Projekts angeht!

So, nun zu G@H. Bei G@H wird versucht, alternative Aminosäuresequenzen für Proteine zu generieren, deren Struktur bereits experimentell ermittelt worden ist. Wie geht das Programm vor? Es gibt eine Datenbank, in der alle experimentell bestimmten Proteinstrukturen abgelegt sind (PDB Protein Data Bank). In einer solchen Proteindatei, sind die Raumkoordinaten jeden Atoms tabellarisch zusammengestellt. Übrigens benutzt F@H wie auch G@H als Ein- bzw. Ausgabedateien dasselbe Format (.pdb oder .ent files), sodaß man all diese Daten fein mit freien (oder kommerziellen) Ladeprogrammen ansehen kann (z.B. SwissPDB Viewer). Dort - in der PDB bank - holt G@H sich seine Datengrundlage. Es schnappt sich einen Strukturfile und entfernt all diejenigen Atome, die zu den Seitenketten der Aminosäuren gehören. Dazu muß man wissen, daß die Aneinanderkettung von Aminosäuren über ein immer wiederkehrendes Strukturelement erfolgt. So entsteht das sogenannte Rückgrat des Proteins - das ist die Peptidbindung. Die Aminosäuren selbst unterscheiden sich aber bloß in der Seitenkette (sagen wir einfach ein "Anhängsel" an das Rückgrat). Nun versucht G@H die alten, entferten Seitenketten durch neue zu ersetzen. Dabei setzt es allerdings als Randbedingung, daß die Proteinraumstruktur erhalten bleiben muß. Das bedeutet, daß eine Vielzahl von Veränderungen vorgenommen werden können, sodaß von G@H eine breite Vielfalt von Sequenzvarianten entsteht, die alle dieselbe Raumstruktur (und hoffentlich auch Funktion) haben sollten. In der theoretischen Analyse (die auf Laborergebnissen basierrt!) zeigt sich, daß solche "in silico" generierten Proteine teilweise sogar besser die Funktion des natürlich vorkommenden Proteins übernehmen können sollten - andere der generierten Sequenzen taugen hingegen nicht. Was bedeutet dies in der Praxis für den Anwender? Viele wichtige Substanzen werden heute in zunehmendem Maße über enzymatische Reaktionen (Enzym = Protein) großindustriell hergestellt. Kann man die Ausbeute eines solchen Prozesses mit einem besser optimierteren Enzym erhöhen (oder z.B. die Fermenterbetriebstemperatur ernidrigen), so erspart das enorme Kosten. Daher sind die Ergebnisse von G@H als direkt anwendbar einzustufen. Natürlich muß man die generierten Sequenzen zuvor in der Praxis testen, dann aus ihnen das optimale heraussuchen und dieses wird schließlich eingesetzt - aber für all diese Entscheidungen liefert G@H bereits sinnvolle Vorschläge. <IMG SRC="/phpBB/images/smiles/spiny.gif" alt="rotate">

Kurz: beide Projekt haben einen enormen Anspruch und basieren auf neusten wissenschaftlichen Erkenntnissen. Für F@H ist als Limitation die Rechenpower anzusehen, d.h. je mehr Leute mitmachen, bzw. je leistungsfähiger die Rechner werden, desto näher rücken wir dem Ziel. Auch dürfte selbst bei konstanter Rechenpower (wir gehen jedoch von einem Zuwachs an Interessenten aus - ist doch klar!) der Vorschlag von sinnvollen Algorithmusänderungen einiges bewirken (also endlich her mit dem Quellcode, hehehehe...). Es wird sicher nicht so sein, daß wenn wir alle fleissig F@H betreiben, in einem Jahr Alzheimer heilbar sein wird - das ist leider etwas unmögliches, aber Vijay hat die Alzheimer-relevanten Proteine auch unter die Lupe genommen und die sind gerade hinsichtlich ihrer Faltung von enormem Interesse. Man darf also auf einiges hoffen! Bei G@H sehe ich die momentane Lücke, daß man die generierten Proteine in der Praxis auch auf ihre Funktionstüchtigkeit testen muß. Da tritt zunächst das Problem auf, daß man die Aminosäuresequenz, die G@H letztlich auswirft, erst einmal in das DNA-Speichermolekül umwandeln muß. Dies wird umso aufwendiger, je länger die generierte Sequenz ist - ist aber machbar. Dann benötigt man ein experimentelles Testsystem. Wie LinuxFan schon angedeutet hat, habe ich mir aus den von G@H generierten Sequenzen diejenigen für ein für mich interessantes Protein herausgesucht und werde sie im kommenden Jahr im lebenden Bakterium anstelle des Originals setzen um so zu prüfen, wie gut die G@H-Ergebnisse wirklich sind. Meine vorläufigen Strukturberechnungen (auf Basis bekannter Kristallstrukturen) der neuen G@H-Sequenzen sehen jedoch sehr vielversprechend aus (ca. ein Drittel aller generierten und von mir getesteten Sequenzen scheinen auf Anhieb die korrekte Struktur zu ergeben, was bei der verwendeten Testmethode nicht ausschließt, daß die verbleibenden zwei Drittel dies ebenfalls tun).

Puhhhh - ich hoffe, ihr habt bis zum Schluß durchgehalten - ich hätte vielleicht besser Buchautor werden sollen, hehehehe... naja, man kann noch soviel dazu erzählen - ich finde das Peojekt einfach toll und hoffe, daß im kommenden Jahr auch noch mehr Leute es gutfinden werden.



Jetzt est mal einen guten Rutsch ins Neue! <IMG SRC="/phpBB/images/smiles/spinningsmiley.gif" alt="rolling">

Michael.



---

Folding@Home / Genome@Home Team Germany

email: weberm@mailer.uni-marburg.de

Benutzeravatar
Der Diplomat
Powerknopf-Verweigerer
Powerknopf-Verweigerer
Beiträge: 1470
Registriert: 21.07.2001 01:00
Wohnort: Landsberg

#8 Ungelesener Beitrag von Der Diplomat » 31.12.2001 17:00

Herzlichen Dank für diese ausführliche, aber sehr erhellende Antwort! Weiter so!



Mich würde es natürlich sehr freuen, wenn Du uns im Forum ab und an über neue Ergebnisse hinter den Kulissen informieren könntest.



Michel

Benutzeravatar
bluumi
Number-Cruncher
Number-Cruncher
Beiträge: 865
Registriert: 28.06.2001 01:00
Wohnort: Neuenhof

#9 Ungelesener Beitrag von bluumi » 01.01.2002 13:06

@michael from folding germany



Also den buchauthor nehme ich dir ab <IMG SRC="/phpBB/images/smiles/icon_wink.gif" alt="Wink">



Ich war ja bisher schon von der freien Idee fasziniert, aber Du klingst echt überzeugend. Auch wenn mir ganz schwindlig wurde <IMG SRC="/phpBB/images/smiles/icon_wink.gif" alt="Wink">



Gruss Bluumi

(SwissTeam.NET)

Gast

#10 Ungelesener Beitrag von Gast » 02.01.2002 11:17

Hehehehehe - ich schaue gelegentlich mal hier bei Rechenkraft.de vorbei.

Heute sollen ja angeblich die Statistiken von Genome@Home aktualisiert werden. Aufgrund der neunstündigen Zeitverschiebung rechne ich allerdings erst morgen damit. Ich bin mal gespannt. Unser Team hat - was man so hört - einiges an Ergebnissen abgeliefert...

Vielleicht noch eins zu G@H: man sollte sich durchaus darüber im klaren sein, daß ein Protein nicht bloß aufgrund nahezu identischer Faltung eine bestimmte Aufgabe übernimmt. Oft kommt es zusätzlich auf eine oder wenige Aminosäuren in der richtigen räumlichen Anordnung zueinander an, damit ein Protein funktionstüchtig ist. Wenn man das aber weiß - und G@H basiert ja nun ausschließlich auf bekannten Strukturen über die normalerweise auch hinsichtlich ihrer Funktion "alles" klar ist - dann kann man die betreffenden Seitenketten womöglich auch nachträglich an der richtigen Position in die G@H-Sequenz aufnehmen. Man muß die Ergebnisse also duchaus mit etwas Sachverstand einsetzen, dann kriegt man auch was dabei heraus. Ich denke, das ist ein weiterer Grund, mitzumachen.



Ciao,

Michael.



---

F@H / G@H Team Germany

Zurück zu „Hintergrundinfos zu Verteiltem Rechnen“