Die Q-Learning Methode

Es gibt jedoch auch andere Methoden, dessen Lernkurve und Ergebniss sich unterscheiden. Beispielsweise Q-Learning.
Q-Learning funktioniert indem die KI für "gute Taten" belohnt und für "schlechte Taten" bestraft wird. Die Belohnung/Bestrafung sind meist nur Zahlen. Nach dem trainieren erhält man eine KI die dann für eine bestimmte Funktion spezialisiert ist.

Ein gutes Beispiel dafür gibt auf dem Youtbe-Kanal Code Bullet, der eine Simulation erstellt hat indem eine KI trainiert wird so schnell wie möglich Runden in einem Autospiel zu fahren.

Quelle:YouTube




Nach Oben

Zurück

Nach Unten