Intern: Neues Distributed Computing Team - SIMAP

pipin

Administrator
Teammitglied
Mitglied seit
16.10.2000
Beiträge
24.369
Renomée
9.694
Standort
East Fishkill, Minga, Xanten
  • SIMAP Race
  • QMC Race
  • RCN Russia
  • Spinhenge ESL
  • Docking@Home
  • BOINC Pentathlon 2019
  • SETI@Home Intel-Race II
  • THOR Challenge 2020
  • BOINC Pentathlon 2021
  • BOINC Pentathlon 2023
Mit einem neuen Distributed Computing Team wollen wir das SIMAP Projekt unterstützen, das ein Gemeinschaftsprojekt des GSF-Forschungszentrums für Gesundheit und Umwelt in Neuherberg bei München und der Technischen Universität München, Wissenschaftszentrum Weihenstephan ist.

Informationen zu SIMAP oder Similarity Matrix of Proteins:

<ul><i>
<b>Was ist SIMAP?</b>

SIMAP ist eine Datenbank, in der die Ähnlichkeiten aller derzeit bekannten Proteinsequenzen untereinander gespeichert sind. Man kann sich das als Matrix vorstellen, die quadratisch ist bei einer Kantenlänge von ca. 4 Mio Proteinsequenzen die wir momentan speichern. Der Inhalt der Matrix ist symmetrisch, das heißt wenn Protein 1 dem Protein 2 ähnlich ist, dann ist es umgekehrt genauso. SIMAP ist weltweit das einzige derartige Projekt, bei dem wirklich alle Proteine einbezogen werden. Das "Konkurrenzprojekt" clustr am European Bioinformatics Institute beschränkt sich derzeit auf ca. 1/5 unserer Datenmenge.

<b>Wem nutzt SIMAP?</b>

Proteinähnlichkeiten geben Hinweise auf die Verwandschaftsverhältnisse zwischen Proteinen. Verwandte Proteine haben oft gleiche oder ähnliche Eigenschaften und Funktionen im Organismus, da sie sich im Lauf der Evolution nur langsam verändern. Da man derzeit viel mehr Proteinsequenzen kennt als man eingehend in Labors untersuchen kann, werden die experimentellen Erkenntnisse über ein Protein auch auch dessen Verwandte übertragen. Ein gutes Beispiel dafür ist die intensive Untersuchung von Mausgenen und -proteinen, deren Ergebnisse oft auch für den Menschen gültig sind. Darüber hinaus gibt es noch viele weitere Methoden in der Bioinformatik, die auf Proteinähnlichkeiten basieren. Unsere Proteinähnlichkeitsdatenbank stellt all diesen Methoden die vorberechneten Ähnlichkeiten aller bekannten Proteine zur Verfügung. Dadurch eröffnen sich neuartige Möglichkeiten, denn bislang würden die Ähnlichkeiten immer und immer wieder neu berechnet. SIMAP wird regelmäßig aktualisiert und muss nur neu hinzukommende Sequenzen in die Matrix integrieren (sogenannte inkrementelle updates). SIMAP ist für Forschung und Lehre vollständig kostenlos verfügbar.

<b>BoincSIMAP:</b>

Da der Berechnungsaufwand für eine solche Matrix quadratisch mit der Größe der Matrix steigt, sind unsere internen Resourcen (gridengine-cluster unter Linux) schon lange nicht mehr ausreichend. Daher haben wir einen boinc-client implementiert, der auf den Quellen von FASTA aufbaut, eines heuristischen Programms zur Sequenzähnlichkeitssuche. Diesen client gibt es nun seit ca. einem Jahr, wir haben ihn bislang umfassenden Tests unterzogen. Anfang gab es verschiedene Probleme, die mit dem Boinc-Team um Dave Anderson behoben werden mussten. Momentan optimieren wir den client, da sich die Berechnungsprozedur etwas verändert hat und das Datentransfervolumen zu minimieren ist. Der boincsimap-Client ist momentan ein Minimal-Client ohne Screensaver-Grafik etc., da wir erstmal Wert auf die reine Funktionalität gelegt haben. </i></ul>

Wie ihr an SIMAP teilnehmen könnt und Diskussionen zu diesem Thema findet Ihr in unserem <a href="http://www.planet3dnow.de/vbulletin/forumdisplay.php?f=150">SIMAP-Forum</a>

<b>Links zum Thema:</b><ul><li> <a href="http://boinc.bio.wzw.tum.de/boincsimap/" target="b">Webseite SIMAP</a></li><li> <a href="http://boinc.bio.wzw.tum.de/boincsimap/team_display.php?teamid=783" target="b">Das P3D SIMAP-Team</a></li><li> <a href="http://boinc.bio.wzw.tum.de/boincsimap/forum/" target="b">SIMAP Projektforum</a></li></ul>
 
Kleine persönliche Ergänzung:

Mit meinem Opteron 146 berechnet man eine SIMAP Workunit in guten 70 Minuten, man hat also sehr schnell den Eindruck auch etwas geschafft zu bekommen. ;D
 
Geht das nicht ein bissl in die Richtung von Folding@Home? Da gings doch auch um Eiweiße oder?
 
Folding@Home untersucht die Faltung von Proteinen, SIMAP katalogisiert den Grad der Ähnlichkeit aller Proteine untereinander (soweit ich das verstanden habe). Also beide haben mit Proteinen zu tun, aber viel mehr haben sie wohl nicht gemeinsam.
 
Wer vergeudet seit es CnQ und Speedstep gibt denn noch Energie mit sowas ? :]
 
Wer vergeudet seit es CnQ und Speedstep gibt denn noch Energie mit sowas ? :]

mache Leute haben auch ein Herz für die Wissenschaft, wenn du der Meinung bis gut

aber poste sowas woanders, hier geht es um die Wissenschaft

und Leute die das infrage stellen gibt es auch

aber hier ging es um den Thread

und nicht was mache ich nicht etc, also bitte kein Flame etc...

Danke

mfg
Sir Ulli
 
Zurück
Oben Unten