Hauptseminar im WS1999/2000:
Algorithmen in der Bioinformatik
Zeit: Donnerstags 14 c.t., Raum S2229
Das Hauptseminar findet
donnerstags von 14:15 Uhr bis 15:45 Uhr im Raum S2229 statt.
Nicht zuletzt durch die Datenflut des Human Genome Projects findet in
der Biologie momentan ein Paradigmenwechsel statt.
Die bei der Genomsequenzierung anfallenden Daten sind so umfangreich,
daß bei ihrer Verarbeitung die Methoden der Informatik
unerläßlich sind.
Aus dieser Notwendigkeit heraus hat sich ein neues und aufregendes
Fachgebiet entwickelt: die Bioinformatik.
Dabei beschäftigt man sich zum einen mit Algorithmen die zur
Strukturaufklärung von DNS-Strängen (der sogenannten
Sequenzierung) aus den biotechnisch gewonnenen Daten beitragen,
und zum anderen mit Algorithmen, die die Interpretation der gewonnenen
Daten unterstützen.
Damit ist die Bioinformatik eine der sich am schnellsten entwickelnden
und wichtigsten interdisziplinären Anwendungen der Informatik
überhaupt.
Zu den folgenden Bereichen sollen im Hauptseminar die aktuellen
Forschungsergebnisse im Bereich der Algorithmik vorgestellt werden:
- Sequence Alignment
Das Sequence Alignment ist eines der fundamentalsten und ältesten
Probleme der Bioinformatik.
Hierbei soll für zwei gegebenen Zeichenreihen (interpretiert als
Abfolge von Nuklein- oder Aminosäuren) festgestellt werden, ob
sie ähnlich sind, und wenn ja, wie sie mit einer minimalen Anzahl
elementarer Operationen (Löschen, Einfügen, Substitution von
Zeichen) ineinander überführt werden können.
Werden zum Beispiel mehrere gleichen DNS-Sequenzen bzw. Proteine
sequenziert, so will man hiermit feststellen, ob bzw. inwieweit die
Ergebnisse dieselben sind.
Ein anderes Beispiel (in dem man eine Sequenz mit vielen anderen
vergleicht) ist die Suche in einer DNS- bzw. Protein-Datenbank, wobei
man feststellen möchte, ob die neue Sequenz schon bekannt ist
oder nicht.
- Fragment Assembly
Aus biotechnologischen Gründen können immer nur relativ
kurze Stücke eines DNS-Strangs sequenziert werden.
Für eine vollständige Strukturauflösung eines langen
DNS-Strangs muß dieser also in viele kurze aufgeteilt werden,
wobei in Wirklichkeit die Bruchstücke vieler identischer Kopien
dieses DNS-Strangs betrachtet werden.
Beim Fragment Assembly will man nun aus dieses Teilsequenzen wieder
die gesamte Sequenz des langen DNS-Strangs rekonstruieren.
- Physical Mapping
Hat man Bereiche von DNS-Strängen eines Chromosoms sequenziert,
so will man natürlich auch wissen, wo in diesem Chromosom ein
sequenzierter Teil vorkommt.
Biotechnisch können dabei bestimmte sehr kurze Teile des
Chromosoms markiert werden.
Diese Markierungen kann man auf den Bruchstücken des DNS-Strangs
wiederfinden.
Ziel ist es nun, die Bruchstücke so zusammenzusetzen, daß
die markierten Stellen auf dieser Zusammensetzung an denselben Stellen
sind wie im ursprünglichen Chromosom.
- Genome Rearrangement
Vergleicht man das gesamte Genom von verschiedenen Spezies, so
hätte man gerne einen Abstandsbegriff, der für ein Paar von
Spezies aussagt, wie verwandt sie miteinander sind.
Bei vielen Spezies unterscheiden sich das Erbgut oft nur durch eine
andere Anordnung der Gene innerhalb des Erbguts.
Daher definiert man den Abstandsbegriff durch die minimale Anzahl an
gewissen Elementaroperationen, die nötig sind, um die Genome der
Spezies ineinander zu überführen.
Dabei sind hier die elementaren Operationen (im Gegensatz zum Sequence
Alignment) globale Operationen.
Am häufigsten treten sogenannte Inversionen und Transpositionen
auf, bei denen entweder ein ganzer Abschnitt der DNS-Strangs umgedreht
wird oder zwei lange benachbarte Abschnitte miteinander vertauscht
werden.
- Protein Folding
Die Funktionalität eines Proteins wird im wesentlichen durch
seine räumliche Struktur bestimmt.
Leider sind physikalische Strukturaufklärungsverfahren im
Vergleich zur biologischen Sequenzierung sehr aufwendig.
Deshalb ist man an Algorithmen interessiert, die aus der
Aminosäuresequenz eines Proteins die räumliche Struktur des
Proteins vorhersagen oder die zu einer gegebenen räumlichen
Struktur eine geeignete Aminosäuresequenz angeben, die sich in
die vorgegebene Struktur faltet.
- Evolutionary Trees
Durch die Evolution haben sich die verschiedenen Spezies aus
gemeinsamen Vorfahren weiterentwickelt, die zum Teil schon lange
wieder ausgestorben sind.
Mit Hilfe eines phylogenetischen Baumes will man nun den Stammbaum
verschiedener Spezies rekonstruieren, wobei man nur die noch lebenden
Spezies kennt.
Diese lebenden Spezies bilden nun die Blätter des
phylogenetischen Baumes.
Ziel ist nun, die inneren Knoten des Baumes so zu konstruieren,
daß stark verwandte Spezies im Baum nah zusammen (durch einen
kürzeren Pfad verbunden) sind.
Zur Konstruktion phylogenetischer Bäume werden dabei
unterschiedliche Methoden zur Bestimmung des Verwandtschaftsgrades
verwendet.
Die detaillierte Themenliste mit Literaturangaben finden
Sie hier.
Weitere Auskünfte erteilen
Jens Ernst
und
Volker Heun.
Volker Heun, 1999-08-25