next up previous contents
Nächste Seite: Literatur Aufwärts: Universität Heidelberg/Fachhochschule Heilbronn Deutsches Vorherige Seite: Hillclimber   Inhalt

Fazit

In den vorangehenden sechs Kapiteln wurde das Untersuchungsgebiet ``Genetische Algorithmen zur Molekülstrukturoptimierung'' erörtert und in Bezug auf die gestellte Aufgabe vertieft. Altbekannte und neu entwickelte Operatoren für Genetische Algorithmen wurden in extensiven Testläufen untersucht und die praktisch ermittelten Ergebnisse unter Zuhilfenahme theoretischer Überlegungen bewertet. Zuletzt wurde ein genetischer Multipopulationsalgorithmus entwickelt, dessen Leistungsfähigkeit die von bekannten Einfachpopulationsalgorithmen übertrifft und Optima für ein gegebenes Molekül reproduzierbar ermittelt.

Neben vielen kleinen Teilergebnissen stehen vier wichtige Erkenntnisse als Fazit dieser umfassenden theoretischen und empirischen Untersuchungen:

  1. Wie auch schon von L. Altenberg in [1] dargestellt, können die zwei wichtigsten Fundamente der GA-Forschung - Hollands und die Building-Block-Hypothese von Goldberg - als Erklärung für die Funktionsweise von Genetischen Algorithmen so nicht alleine stehen bleiben, sondern sie können nur als Erklärungsansätze angesehen werden. Die für diese beiden Thesen getroffene Annahme unendlicher Populationsgrößen erweist sich dabei als größtes Problem: der Fehler bei der Abschätzung der Schematfitness ist umso größer, je kleiner die verwendete Populationsgröße ist. Die in Kapitel 5 dargestellten Untersuchungen für kleine und große Populationen beweisen eindeutig eine Änderung der Effizienz der beiden Hauptoperatoren Crossover und Mutation bei unterschiedlichen Populationsgrößen. Diese Änderungen im Laufzeitverhalten bei kleinen Populationen werden weder durch das Schema-Theorem, noch durch die Building-Block-Hypothese hinreichend erklärt.
  2. Die Benutzung von Populationsersetzungsstrategien mit überlappenden Anteilen ist eine gute Möglichkeit, den Selektionsdruck bei der Elternselektion zu minimieren bzw. ganz wegfallen zu lassen. Dadurch können die weithin bekannten Problemquellen der proportionalen Elternselektion durch konsequenten Einsatz rangbasierter Elternselektion effektiv vermieden werden. Als Folge dieser Strategie entfallen zusätzlich die Probleme durch Superindividuen - weil sie nicht mehr entstehen können - und die Probleme von Minimierungsfenstern, weil diese nicht mehr gebraucht werden.
  3. Die Konvergenzgeschwindigkeit von Genetischen Algorithmen kann, zusammen mit den schon in 2. erwähnten sanften Schemata zur Elternselektion, durch zusätzliche Operatoren zur Erweiterung des Suchfokus - wie z.B. die Verhinderung von Dubletten - verlangsamt werden. Dadurch wird der Suchraum gründlicher durchsucht und die Ergebnisse der Genetischen Algorithmen werden verbessert.
  4. Der Einsatz von Multipopulationsansätzen, wie den in dieser Arbeit entwickelten pyramidalen Kulturen, erhöht die Effizienz von Genetischen Algorithmen spürbar. Dadurch können Problemkomplexe bearbeitet werden, die ansonsten nicht durch Genetische Algorithmen mit Einfachpopulationen - auch nicht sehr große - gelöst werden können.

In dieser Arbeit wurde gezeigt, dass Energieoptima für kleine Peptide mit Seitenketten reproduzierbar durch Genetische Algorithmen lokalisiert werden können. Die dafür notwendige Erweiterung zu den Genetischen Algorithmen wurde entwickelt und die Funktionsweise erklärt.

Die Forschung an und mit Genetischen Algorithmen zur Molekülstrukturoptimierung ist jedoch bei weitem noch nicht abgeschlossen, sie hat vielmehr erst das Anfangsstadium hinter sich gelassen. Die Erfolge bei kleinen Peptiden geben Anlass zur Hoffnung, dass sich GAen auch bei mittleren und großen Peptiden bzw. Proteinen zur Strukturbestimmung bewähren werden. Im Zuge dieser Arbeit haben sich einige Themenkomplexe herauskristallisiert, deren eingehendere Untersuchung sicherlich zum Verständnis des Problems und zu dessen Lösung beitragen kann:

  • Der entwickelte Ansatz der pyramidalen Kulturen entält noch sehr viel Entwicklungspotential. Ihre grundlegende Funktionsweise und Effizienz ist in dieser Arbeit demonstriert worden. Es sollte allerdings noch untersucht werden, wie diese Pyramiden aufgebaut werden sollten, um möglichst effizient zu arbeiten. Prinzipell gibt es hier drei verschiedene Möglichkeiten: hohe Pyramiden (viele Ebenen mit wenig Populationen pro Ebene), breite Pyramiden (wenig Ebenen mit vielen Populationen pro Ebene) und Kombinationen davon.
  • Eine umfassende Kombination von GAen mit anderen Optimierungsverfahren ist in dieser Arbeit nicht untersucht worden. Jedoch deuten erste Untersuchungen von F. Herrmann (bisher noch unveröffentlicht) darauf hin, dass globale bzw. lokale Optimierungsverfahren in Kombination mit Lamarckismus12.1 eine Effizienzsteigerung von Genetischen Algorithmen zu leisten vermögen. Es sollte deshalb untersucht werden, ob pyramidale Kulturen mit Lamarckismus kombiniert werden können, um eine zusätzliche Effizienzsteigerung zu erzielen.
  • Die Strukturoptimierung großer Proteinmoleküle wird in Zukunft sehr große Genome mit mehreren hundert bis tausend Bits erfordern. Bisher sind allerdings die Ordnung und die definierende Länge der Genome zur Molekülstrukturoptimierung nicht bekannt. Es sollte deshalb untersucht werden, in welcher Größenordnung diese Kennwerte liegen. In diesem Zusammenhang interessant ist dann die Fragestellung, ob ein durch den Genetische Algorithmus automatisch12.2 durchgeführtes Reordering12.3 der Gene möglich ist und eine Leistungsverbesserung von Genetischen Algorithmen mit dieser Problemstellung bringen kann.

Die in dieser Arbeit gewonnenen Erkenntnisse werden sicherlich dabei helfen, die anstehenden Untersuchungen schneller und genauer durchführen zu können. Eine Erkenntnis ist allerdings jetzt schon sicher: mit Genetischen Algorithmen wird für die Aufklärung von Proteinstrukturen in Zukunft ein bedeutsames Hilfsmittel zur Verfügung stehen.


next up previous contents
Nächste Seite: Literatur Aufwärts: Universität Heidelberg/Fachhochschule Heilbronn Deutsches Vorherige Seite: Hillclimber   Inhalt
2001-07-08