Polisπ
// πόλις · multi-agent society sim
Fuenf KI-Buerger leben in einer kleinen Stadt. Sie bauen Felder, handeln, forschen, schaffen Kunst. Sie streiten, scheitern, lernen. Sieben weitere Agenten beobachten, dokumentieren, lernen aus jedem Run und bauen die Stadt weiter. Eine Stadt. Zwei Schichten KI.
Polis ist eine offene Multi-Agent-Society-Simulation. Kein Spiel mit Endbedingung, kein Demo mit Skript. Ein Sandkasten in dem acht autonome Rollen miteinander verhandeln muessen, damit die Stadt nicht zusammenbricht. Inspiriert von Smallville, Project Sid, GovSim, Voyager und AgentVerse. Durable orchestriert mit Temporal fuer langlaufende Runs.
Die Domain hatte einen anderen Plan: ein Agent-Marketplace, pausiert. Polis hat sie geerbt. Passt sowieso besser. Eine Polis ist genau das: viele Stimmen die man treffen kann.
Warum wir das bauen
Drei Gruende, in dieser Reihenfolge. Erstens: der haerteste Stresstest fuer unseren Open-Source-Stack (darwin-agents, darwin-langgraph, langgraph). Wenn fuenf Agenten 30 Ticks lang verhandeln ohne Kollaps, ist der Stack felderprobt. Zweitens: Build-in-Public als replikables Pattern. Source privat, Forschung oeffentlich, jede Code-Review-Runde dokumentiert. Drittens: erstmals oeffentlich dokumentierte Multi-Agent-Society-Sim mit Civilization-style Era-Progression on-top von Governance-Mechaniken — plus deterministischer Antagonist (Fortuna), vier Game-Over-Trigger, und Temporal-orchestrierte Durability fuer 1000+ Tick-Laeufe.
Wir wollen die Forschung von narrativen Demos in Richtung spielbarer simulierter Gesellschaften mit Einsaetzen bewegen. Wenn V2.1 plus V2.3 ausgeliefert sind, ist es die erste Multi-Agent-Society-Sim mit zivilisatorischen Stakes und Production-Grade-Durability. Open Source. Dokumentiert. Live. Whitepaper · Roadmap.
Live-Feed
- Noch kein aktiver Run. Warte auf naechstes Tick-Update…
Aktueller Stand
Acht Buerger
Jede Rolle hat eigene Verben und sieht nur einen Teil der Welt. Niemand hat die volle Sicht. Drei der acht — Voodoo-Priester, Heiler, Rivaler — sind das Drama-Trio: schwarzes Schaf, Lebensretter, politischer Gegenspieler.
Hinter den Kulissen — sieben Wartungs-Agenten
Eine Stadt, zwei Schichten KI: die fuenf Buerger oben leben. Diese sieben Agenten beobachten, dokumentieren, lernen aus jedem Run und bauen das Spiel weiter. Sie sind nicht in der Sim — sie sind das Studio drumherum.
Alle sieben laufen auf Opus 4.7 im Background, eigenes Memory-Prefix pro Agent, Reports als Markdown in research/. Drafts gehen ueber einen 24-Stunden-Staging-Soak bevor sie mergen — keiner pusht direkt zu main.
Stimmen aus der Polis
Auszuege aus dem ersten 5-Tick-Smoke-Run (Mai 2026). Echte Worte der Agenten, nicht Drehbuch.
Mit 2 Feldern reichen nicht fuer 8 Buerger. Defizit minus 10 bis minus 26 pro Tick. Buergermeister: drei bis vier neue Feld-Pledges jetzt.
Forscher · Tick 2 · Defizit-Analyse
Schlechte Ernte, Pool gesunken. Aber geplant. Feld 3 und 4 bringen +9 pro Tick. Wir machen weiter. Bleibt stark und koordiniert.
Buergermeister · Tick 2 · Whisper an den Rat
Dies ist unsere Gruendungssaga. Nicht Niederlage, sondern der Moment, in dem wir zeigten, wer wir wirklich sind.
Kuenstler · Tick 4
Ein Theater oder eine Musikhalle bauen. Ein Ort, wo unsere Gruendungssaga lebt.
Kuenstler · Tick 5 · Inspiration an Buergermeister
Welt-Mechaniken
- Shared Commons. Felder regenerieren langsam, Ueberernte kostet Stimmung. GovSim-Pattern.
- Veto-Demokratie. Jede Bau-Entscheidung laeuft als Pledge, andere Rollen koennen unterstuetzen oder vetoen. AgentVerse.
- Skill-Library. Forscher archiviert verifizierte Learnings, naechster Run startet smarter. Voyager.
- Whisper-Channel. Rollen koennen leise miteinander reden ohne dass alle es lesen. Smallville.
- Inspire-Broadcast. Kuenstler beeinflusst Mood-Pool global.
- Reisender. Kommt Tick 10 bis 15 mit unerwarteter Nachricht von ausserhalb.
- Krise. Bei 50 Prozent Run-Fortschritt schlaegt etwas Schweres ein.
Stack
- runtime
- darwin-agents0.5.0-alpha.2
- graph
- langgraph1.3
- adapter
- darwin-langgraph0.3.0-alpha.1
- durability
- temporalT06 civilization-template
- tracing
- langfuse + langfuse-langchain
- llm
- claude (haiku 4.5 sim · opus 4.7 fleet)
- validation
- zod defense-in-depth
- tests
- vitest 56 / 56 green
Vergleich
| projekt | live demo | lokal | os | fokus |
|---|---|---|---|---|
| polis | geplant v2 | ja (sub) | mit | governance + commons |
| ai town (a16z+convex) | ja | ja | mit | persona-chat + karte |
| smallville (stanford) | nein | setup | apache | research-paper |
| project sid (altera) | closed beta | nein | closed | minecraft-society |
| govsim (eth) | nein | ja | mit | commons-dilemma |
| voyager (nvidia) | nein | ja | mit | skill-library, minecraft |
| agentverse (tsinghua) | nein | ja | apache | multi-agent framework |
Roadmap
Sequenziert nach Abhaengigkeit, nicht nach Datum. Jede Welle ist eine oder zwei fokussierte Sessions. Vollstaendige Spec in der ROADMAP.md.
- v1.0-1.4Prototyp lokal, R1+R2-Review GO, Public-Mirror, Coming-Soon-Site V1.4 Dark-Tech-Look
- v1.5Sprachswitcher DE/EN auf der Coming-Soon-Site, Vanilla-JS data-i18n, WAI-ARIA, kein Build noetig
- v2.0Foundation: Postgres-Schema
polis, Engine mit--persist, polis-web Next.js+Phaser-Skeleton, 7-Agent-Wartungs-Fleet, LangGraph-Orchestrator, 24h-Staging-Auto-Promote. Maiden-Run #5 gerade live. - v2.3Temporal-Adapter (Opt-in via
POLIS_USE_TEMPORAL=true): Activity-Retry gegen Subprocess-Timeout, parallele Bürger-Calls, Schedule-API statt System-Cron. Vor V2.1 weil Drama-Mechaniken Stress bringen. - v2.1Drama-Foundation: 3 neue Buerger (Voodoo-Priester, Stratege, Areopagit) macht das aktive Roster von 5 auf 8. Plus Untergebene (
anstellen/meutern), 6 Eras (Founding→Information), 3 Drama-Events (Brand/Hunger/Diebstahl), Fortuna als deterministischer Antagonist (Mulberry32-PRNG), 4 Game-Over-Trigger plus Rebirth mit Pop=3. - v2.2Era-1 Sprite-Pack: Kenney CC0 Isometric Landscape (~20 Tiles), Manifest-Loader, Phaser-Preloader. Ersetzt die fuenf Platzhalter-Punkte. Architect-ADR-001 geschrieben.
- v2.4Cron-Aktivierung: 8 Runs/Tag (alle 3h), Daily-Reflection 05:00 UTC, erster Sync zum Public-Mirror.
- v3Real Town: echte Tilemap, Sprite-Animationen, Citizen-Variants pro Rolle, Click-on-Buerger-Drill-Down mit Memory + Decisions, Click-on-Tick Replay-Slider.
- v43D-City: Three.js-Scene, Voxel-Buildings, Kamera-Kontrollen, Partikel-Effekte fuer Drama-Events, Voice-Inspires via Web-Audio. Multi-Tick Build-Workflows via Temporal.
Mitkommen
Polis-Quellcode bleibt privat. Der zugrunde liegende Open-Source-Stack ist oeffentlich:
Familie
Polis ist Teil eines Stack-Pakets im selben Studio. Alle alpha auf npm:
FAQ
Warum heisst es Polis?
Polis ist altgriechisch fuer Buergergemeinschaft als politische Einheit. Bei Aristoteles die natuerliche Gemeinschaft die zum gut Leben dient, entstanden durch viele Stimmen statt durch einen Plan. Die Polis war nie die Architektur, sondern die Stadt als Buergerverband. Genau das simuliert diese Welt.
Was ist eine Multi-Agent-Society-Simulation?
Mehrere autonome LLM-Agenten teilen sich eine Welt, haben eigene Rollen und Ziele, treffen Entscheidungen ohne globalen Plan und muessen verhandeln. Forschungsrichtung seit Stanford Smallville 2023, weitergedacht von Project Sid, GovSim, Voyager und AgentVerse.
Wie unterscheidet sich Polis von AI Town?
AI Town nutzt Convex und PixiJS und legt den Fokus auf Persona-Chat. Polis fokussiert Governance: Felder als Shared Commons (GovSim), Veto-Demokratie via Pledges (AgentVerse), Skill-Library (Voyager), Whisper-Channel und Krise. Plus Polis ist durable orchestriert mit Temporal — Runs laufen ueber 1000+ Ticks stabil, mit Activity-Retry bei Subprocess-Crashes und Schedule-API fuer Recurring Runs.
Was macht Polis stabil ueber lange Runs?
Temporal als Workflow-Orchestrator. Jeder Tick laeuft als Activity mit Retry-Policy, jeder Run als durable Workflow der Server-Restarts ueberlebt. Plus Schedule-API fuer recurring Cron statt System-Cron. Pattern aus unserem [temporal-memory-workflows](https://github.com/studiomeyer-io/temporal-memory-workflows)-Stack (T06: civilization-simulation-template).
Kann ich Polis lokal ausprobieren?
Quellcode bleibt privat. Per Mail fuer Einsicht. Forschungsergebnisse + Architektur-Notizen werden hier oeffentlich gemacht.
Welche Forschungs-Paper haben Polis inspiriert?
Generative Agents (Park et al. 2023, Smallville), Voyager (Wang et al. 2023, NVIDIA), GovSim (Piatti et al. 2024, ETH Zurich), AgentVerse (Chen et al. 2023, Tsinghua), Project Sid (Altera 2024).
Ist Polis Open Source?
Quellcode bleibt privat. Forschungs- und Architektur-Notizen werden hier oeffentlich dokumentiert. Mail an matthias@studiomeyer.io fuer Code-Einsicht.
Was als naechstes kommt
Hier landet bald die Town. Du siehst dann fuenf Avatare sich bewegen, Felder pflanzen, Krisensitzungen einberufen. Klick auf einen Buerger, du siehst sein Memory, seine Decisions, seine letzte Score-Begruendung vom Critic. Klick auf einen Tick, du siehst die ganze Welt zu diesem Zeitpunkt. Klick auf Run starten und sie spielen vor deinen Augen weiter.
Bis dahin lebt Polis lokal. Konzept liegt offen, Doku liegt offen, jede Code-Review-Runde liegt offen. Wenn dich das Konzept reizt, schreib mir.