In den vorangehenden sechs Kapiteln wurde das Untersuchungsgebiet
``Genetische Algorithmen zur Molekülstrukturoptimierung'' erörtert und
in Bezug auf die gestellte Aufgabe vertieft. Altbekannte und neu
entwickelte Operatoren für Genetische Algorithmen wurden in extensiven
Testläufen untersucht und die praktisch ermittelten Ergebnisse unter
Zuhilfenahme theoretischer Überlegungen bewertet. Zuletzt wurde ein
genetischer Multipopulationsalgorithmus entwickelt, dessen
Leistungsfähigkeit die von bekannten Einfachpopulationsalgorithmen
übertrifft und Optima für ein gegebenes Molekül reproduzierbar
ermittelt.
Neben vielen kleinen Teilergebnissen stehen vier wichtige Erkenntnisse
als Fazit dieser umfassenden theoretischen und empirischen
Untersuchungen:
- Wie auch schon von L. Altenberg in [1] dargestellt,
können die zwei wichtigsten Fundamente der GA-Forschung - Hollands
und die Building-Block-Hypothese von
Goldberg - als Erklärung für die Funktionsweise von Genetischen
Algorithmen so nicht alleine stehen bleiben, sondern sie können nur
als Erklärungsansätze angesehen werden. Die für diese beiden Thesen
getroffene Annahme unendlicher Populationsgrößen erweist sich dabei
als größtes Problem: der Fehler bei der Abschätzung der Schematfitness
ist umso größer, je kleiner die verwendete Populationsgröße ist. Die
in Kapitel 5 dargestellten Untersuchungen für kleine und große
Populationen beweisen eindeutig eine Änderung der Effizienz der beiden
Hauptoperatoren Crossover und Mutation bei unterschiedlichen
Populationsgrößen. Diese Änderungen im Laufzeitverhalten bei kleinen
Populationen werden weder durch das Schema-Theorem, noch durch die
Building-Block-Hypothese hinreichend erklärt.
- Die Benutzung von Populationsersetzungsstrategien mit
überlappenden Anteilen ist eine gute Möglichkeit, den Selektionsdruck
bei der Elternselektion zu minimieren bzw. ganz wegfallen zu
lassen. Dadurch können die weithin bekannten Problemquellen der
proportionalen Elternselektion durch konsequenten Einsatz rangbasierter
Elternselektion effektiv vermieden werden. Als Folge dieser Strategie
entfallen zusätzlich die Probleme durch Superindividuen - weil sie
nicht mehr entstehen können - und die Probleme von
Minimierungsfenstern, weil diese nicht mehr gebraucht werden.
- Die Konvergenzgeschwindigkeit von Genetischen
Algorithmen kann, zusammen mit den schon in 2. erwähnten sanften
Schemata zur Elternselektion, durch zusätzliche Operatoren zur
Erweiterung des Suchfokus - wie z.B. die Verhinderung von Dubletten
- verlangsamt werden. Dadurch wird der Suchraum gründlicher
durchsucht und die Ergebnisse der Genetischen Algorithmen werden
verbessert.
- Der Einsatz von Multipopulationsansätzen, wie den in dieser
Arbeit entwickelten pyramidalen Kulturen, erhöht die Effizienz
von Genetischen Algorithmen spürbar. Dadurch können Problemkomplexe
bearbeitet werden, die ansonsten nicht durch Genetische Algorithmen
mit Einfachpopulationen - auch nicht sehr große - gelöst werden
können.
In dieser Arbeit wurde gezeigt, dass Energieoptima für kleine Peptide
mit Seitenketten reproduzierbar durch Genetische Algorithmen
lokalisiert werden können. Die dafür notwendige Erweiterung zu den
Genetischen Algorithmen wurde entwickelt und die Funktionsweise
erklärt.
Die Forschung an und mit Genetischen Algorithmen zur
Molekülstrukturoptimierung ist jedoch bei weitem noch nicht
abgeschlossen, sie hat vielmehr erst das Anfangsstadium hinter sich
gelassen. Die Erfolge bei kleinen Peptiden geben Anlass zur Hoffnung,
dass sich GAen auch bei mittleren und großen Peptiden bzw. Proteinen
zur Strukturbestimmung bewähren werden. Im Zuge dieser Arbeit haben
sich einige Themenkomplexe herauskristallisiert, deren eingehendere
Untersuchung sicherlich zum Verständnis des Problems und zu dessen
Lösung beitragen kann:
- Der entwickelte Ansatz der pyramidalen Kulturen entält noch sehr
viel Entwicklungspotential. Ihre grundlegende Funktionsweise und
Effizienz ist in dieser Arbeit demonstriert worden. Es sollte
allerdings noch untersucht werden, wie diese Pyramiden aufgebaut
werden sollten, um möglichst effizient zu arbeiten. Prinzipell gibt es
hier drei verschiedene Möglichkeiten: hohe Pyramiden (viele Ebenen mit
wenig Populationen pro Ebene), breite Pyramiden (wenig Ebenen mit
vielen Populationen pro Ebene) und Kombinationen davon.
- Eine umfassende Kombination von GAen mit anderen
Optimierungsverfahren ist in dieser Arbeit nicht untersucht
worden. Jedoch deuten erste Untersuchungen von F. Herrmann (bisher
noch unveröffentlicht) darauf hin, dass globale bzw. lokale
Optimierungsverfahren in Kombination mit Lamarckismus12.1 eine Effizienzsteigerung von Genetischen Algorithmen zu
leisten vermögen. Es sollte deshalb untersucht werden, ob pyramidale
Kulturen mit Lamarckismus kombiniert werden können, um eine
zusätzliche Effizienzsteigerung zu erzielen.
- Die Strukturoptimierung großer Proteinmoleküle wird in Zukunft
sehr große Genome mit mehreren hundert bis tausend Bits
erfordern. Bisher sind allerdings die Ordnung und die definierende
Länge der Genome zur Molekülstrukturoptimierung nicht bekannt. Es
sollte deshalb untersucht werden, in welcher Größenordnung diese
Kennwerte liegen. In diesem Zusammenhang interessant ist dann die
Fragestellung, ob ein durch den Genetische Algorithmus
automatisch12.2 durchgeführtes Reordering12.3 der Gene möglich ist und eine
Leistungsverbesserung von Genetischen Algorithmen mit dieser
Problemstellung bringen kann.
Die in dieser Arbeit gewonnenen Erkenntnisse werden sicherlich dabei
helfen, die anstehenden Untersuchungen schneller und genauer
durchführen zu können. Eine Erkenntnis ist allerdings jetzt schon
sicher: mit Genetischen Algorithmen wird für die Aufklärung von
Proteinstrukturen in Zukunft ein bedeutsames Hilfsmittel zur Verfügung
stehen.
Nächste Seite: Literatur
Aufwärts: Universität Heidelberg/Fachhochschule Heilbronn Deutsches
Vorherige Seite: Hillclimber
  Inhalt
2001-07-08