next up previous contents
Nächste Seite: Individuum und Objective Score Aufwärts: Genom Vorherige Seite: Kodierung genetischer Information für   Inhalt

Genotyp und Phänotyp

Es wird in der Biologie streng unterschieden zwischen der Anordnung der Basen auf einem DNA bzw. RNA Strang - dem Genotyp - und dessen Merkmalsausprägung beim Lebewesen - dem Phänotyp. An einer Stelle im Genom $G$ könnte als Genotyp $g_i$ für ein Merkmal z.B. die Folge -ATTGCTAGTCAT- stehen. Der Phänotyp $v_i$ dieser Sequenz könnten dann womöglich braune Augen sein, oder grüne. Verschiedene Ausbildungsformen des gleichen Gens, die zu unterschiedlichen Phänotypen führen, werden allele Gene oder auch einfach Allele genannt.

Wie schon aus der Namensgebung ersichtlich, existiert in der Simulation kein Unterschied zwischen den Variablen der $Zielfunktion$ und den Phänotypen eines Genoms: sie sind identisch.

Jede dieser Variablen $v_i$ mit jeweils $j_i$ Bits kann demnach die Werte $\left\{ 0, \ldots, 2^{j_i}-1 \right\}$ annehmen. Für viele Probleme aus wissenschaftlichen Gebieten ist dies nicht adäquat. Dort werden reelle Werte, also Fließkommazahlen benötigt. Eine Lösung ist, die Anzahl der Bits pro Variable auf das Format einer benötigten Fließkommazahl zu erhöhen und die Variable von vornherein als ein solches Format zu behandeln. Neben dem Nachteil, dass dafür mindestens 32 Bits (üblicherweise jedoch 64 Bits) pro Variable gebraucht würden, bringt dieses Zahlenformat weitere Schwierigkeiten bzw. sub-optimale Ergebnisse3.7.

In vielen Fällen ist der Wertebereich $\mathbb{W}^{\in \mathbb{R}}$ einer Variablen $v_i$ zusammenhängend und kann diskretisiert werden. Man kodiert die Variable $v_i$ binär auf dem Genom als $g_{i}$ und rechnet bei Bedarf die Binärzahlen $g_i$ in Fließkommazahlen um, welche dann die Variable $v_i$ repräsentieren. Bei $j_i$ Bits für eine Variable $v_i$ und einem Wertebereich

\begin{displaymath}\mathbb{W}^{\in\mathbb{R}}: \{U_{min} - U_{max}\} \end{displaymath}

ergeben sich folgende Umrechnungsformeln:

\begin{displaymath}v_i = U_{min} + g_{i} \frac{U_{max}-U_{min}}{2^{j_i}} \end{displaymath}

und

\begin{displaymath}g_{i} = \left\lfloor (v_i - U_{min}) \frac{2^{j_i}}{U_{max}-U_{min}}\right\rfloor \end{displaymath}

Die Gesamtlänge $l$ des Genoms $G$ in Bits beträgt bei $n$ Variablen in jedem Fall

\begin{displaymath}l = \sum_{i=1}^n j_i \qquad \mbox{bei unterschiedlicher Anzahl $j_i$\ an Bits
pro Variable $v_i$} \end{displaymath}

bzw.

\begin{displaymath}l = n \cdot j \qquad \mbox{wenn $j_i$\ konstant ist.} \end{displaymath}

Die Transkription wird in den meisten Genetischen Algorithmen vernachlässigt. Der Nukleus einer Zelle stellt primär eine Schutzfunktion für die DNA dar, welche in einem Rechner unnötig ist. Im Gegensatz zur Zelle kann ein Computer deshalb direkt auf den Genstrang zur Informationsgewinnung zugreifen.


next up previous contents
Nächste Seite: Individuum und Objective Score Aufwärts: Genom Vorherige Seite: Kodierung genetischer Information für   Inhalt
2001-07-08