Die Grenzen sprengen: KI-Evaluierung an komplexer Raumplanung
2. Ziel der Studie (Das ist KEIN SPIEL)
Das Ziel dieses Projekts war keineswegs die generische Entwicklung eines weiteren Indie-Spiels oder reines "Grafik-Spielzeug". Vielmehr ging es um das Lernen, Testen und Evaluieren: Kann eine Künstliche Intelligenz nicht nur Code schreiben, sondern auch als Architekt Häuser, komplexe Museumsgrundrisse und verschachtelte räumliche Zusammenhänge prozedural entwerfen? Wo liegen die harten kognitiven Limitationen der KI? Darüber hinaus sollte fundamental untersucht werden, wie man als Architekt konkret vorgeht, wenn die KI bei anspruchsvollen Problemstellungen iterativ nicht mehr weiterweiß. Das Projekt fokussiert sich auf die Problemlösungsthematik: Lassen sich auch diese extrem schwierigen Hürden überwinden und wie muss das Zusammenspiel zwischen menschlicher Steuerung und KI konzipiert sein, um neue Lösungswege erfolgreich zu erzwingen?
3. Die Evaluierungs-Kandidaten
Um die architektonischen Fähigkeiten der KI schonungslos zu prüfen, traten die fortschrittlichsten State-of-the-Art Modelle der Industrie an: Antigravity/Gemini 3.1, Claude Code Sonnet 4.6 / Opus 4.7 und das spezialisierte OpenAI Codex 4.3.
4. Menschliche Intelligenz vs. KI-Versagen
Das frappierende Ergebnis: Alle Modelle scheiterten fundamental. Die Modelle verstehen räumliche Geometrie oder abstrakte Kontexte nicht wirklich – sie handeln einfach nur auf Wahrscheinlichkeiten. Bei komplexen, ungesehenen Planungs-Herausforderungen fehlt ihnen die natürliche, menschliche Intelligenz zur Problemabstraktion. Das Projekt untersuchte explizit die Phase des Stillstands: Was passiert, wenn man mit der KI nicht mehr weiterkommt? Wie geht man vor? Ich musste hier über 100 Probleme evaluieren und selbst beheben, um zu zeigen, dass ich in der Lage bin, komplexe Probleme zu lösen, oft durch das Vorschlagen und Vorgeben komplett neuer Lösungswege, damit das Projekt überhaupt realisiert werden konnte.
5. Tech Stack
-
Godot 4 Engine Open-Source 3D/2D Game Engine für das visuelle Szenen-Management und die Rendering-Pipeline.
-
GDScript Die Python-ähnliche native Skriptsprache von Godot zur Steuerung der Spiellogik (Map-Generierung, KI-Navigationspunkte).
-
OpenXR (Virtual Reality) Framework-Einbindung für die PlayStation VR2 (PC), inklusive Controller-Tracking und stereoskopischem Rendering.
6. Die Stresstest-Szenarien für die KI
- Komplexe Prozedurale Generierung: Mathematischer, fehlerfreier Aufbau tausender Architekturelemente – anstatt isolierter Code-Snippets.
- Algorithmische Navigations-Effizienz: Implementierung von Vektorpfeil-Caching auf Grids, bei denen reguläre KI-Standardlösungen (A* Algorithmen) kläglich an Performance einbrachen.
- Hardware-Ressourcen-Management: Dynamisches Culling von MP4-Knoten in einer 3D-Welt. KIs generierten hier zunächst heillos ineffiziente Memory-Leaks.
- 3D- und VR-Abstraktion: Kamerakalibrierung für räumliche Interfaces, ein Paradigma, welches Sprachmodellen noch völlig wesensfremd ist.
7. UI Demonstation (Videos)
Schau dir das Projekt im Einsatz und exklusive Einblicke hinter die Kulissen der KI-Entwicklung an.
Gameplay Walkthrough
Behind the Code: Programmierung
Art Museum Preview
8. Eskalationsstufe: Architektonisches Museum
Nachdem die Labyrinth-Umgebung fundamentale Schwächen der Modelle offenbarte, verschärfte ich den Test: Die prozedurale Erschaffung eines stützenfreien, monumentalen High-End Virtual Art Museum (siehe drittes Video oben). In einer Umgebung, die luxuriöses Environment-Design mit komplexen Kuppelkonstruktionen kombiniert, produzierte die KI anfangs massiv defekte Ausgaben. Auch hier zeigte sich, dass die optisch makellos wirkende Demo nur das Resultat von ausdauernder Korrektur und menschlicher Konzeptführung ist.
-
Dynamisches Lighting System Mathematisch platzierte Ring-Spotlights, integrierte Floor-Wash Lichter an massiven Marmorsäulen und asymmetrische goldene Kronleuchter sorgen für eine hochrealistische Lichtstimmung bei monströsen Deckenhöhen von 7 Metern.
-
Live JWST & Hubble API Integration Das Museum ruht, völlig stützenfrei, unter einer massiven 360-Grad Sternenkuppel. Das System lädt über Schnittstellen live hochauflösende Aufnahmen des James-Webb-Weltraumteleskops als dynamische "Skybox" in die Engine – alles persistent gecached.
-
Next-Gen Engine Mastery Das Projekt verdeutlicht extrem schnelles Adaptieren modernster Rendering-Konzepte: Shader-Programmierung für Texturübergänge, Godot 4 API-Meisterschaft und komplexe Ressource-Laderoutinen, umgesetzt in wenigen Tagen anstatt Monaten.
9. Ungefilterte Realität: Krisenmanagement & Debugging
Die Videos oben präsentieren perfekte Demos, verbergen aber den enormen iterativen Aufwand, wenn die KI in den Streik tritt. Bei der Instanziierung komplexer Gebäude brach die Systemleistung massiv ein, das Speichermanagement versagte und logische Knotenpunkte wurden schlicht "halluziniert".
Essenziell für die Arbeit mit KI im Grenzbereich ist die Erkenntnis, dass die Systeme nicht das "Warum" hinter einem Fehler erkennen. Ein fehlerhaft encodiertes In-Game-Video wurde von der KI falsch in der Render-Schleife "korrigiert", bis ich das Problem im Asset-Encoding selbst analysierte und der KI beibrachte, welche Code-Konsequenzen das hat.
10. Architektonisches Scheitern in VR
Virtual Reality abstrahiert das Raumgefühl auf einem Level, mit dem die getesten Sprachmodelle heillos überfordert waren. Ein klassisches Beispiel: Die KI lieferte bei der Umstellung auf VR wiederholt Code, der Headset- und reguläre Joysticks-Drehbewegungen blind addierte. Das Ergebnis war ein völlig unspielbarer Aufbau.
Gleiches galt für die 2D-Benutzeroberflächen. Die künstliche Intelligenz beharrte darauf, HUDs flach auf den Bildschirm zu rendern – in VR ein absolutes No-Go. Erst durch meine Anweisung, die UI auf ein physisches 3D-Mesh im Raum zu projizieren (eine Lösung, auf die die KI selbst nie kam), wurde das Problem bewältigt.
11. Endgültiges Fazit der Evaluierung
Die Illusion der Autonomie: KI-Modelle sind extrem stark darin, uns repetitive Code-Fleißarbeit abzunehmen. Doch sie verfügen über keinen echten Intellekt bei der Analyse von unbekannten, tief vernetzten Problemen. Der wahre Wert eines Senior-Entwicklers bzw. Architekten liegt heute nicht in der reinen Code-Generierung, sondern im fundamentalen Evaluieren, Debuggen, Krisenmanagement und darin, eine irrende KI mit natürlicher Intelligenz und konkreten Lösungs-Hypothesen wieder auf den richtigen Kurs zu zwingen.