⌜ polis ⌝
π meetmyagent · polis
Built in Public · v1.4 · Open Source

Polisπ

// πόλις · multi-agent society sim

Acht KI-Buerger leben in einer kleinen Stadt. Sie bauen Felder, handeln, forschen, schaffen Kunst — und drei von ihnen bringen Drama: Prophezeiungen, militaerische Macht, juristische Gewaltenteilung. Sieben weitere Agenten beobachten, dokumentieren, lernen aus jedem Run und bauen die Stadt weiter. Eine Stadt. Zwei Schichten KI.

Polis ist eine offene Multi-Agent-Society-Simulation. Kein Spiel mit Endbedingung, kein Demo mit Skript. Ein Sandkasten in dem acht autonome Rollen miteinander verhandeln muessen, damit die Stadt nicht zusammenbricht. Inspiriert von Smallville, Project Sid, GovSim, Voyager und AgentVerse. Durable orchestriert mit Temporal fuer langlaufende Runs.

Die Domain hatte einen anderen Plan: ein Agent-Marketplace, pausiert. Polis hat sie geerbt. Passt sowieso besser. Eine Polis ist genau das: viele Stimmen die man treffen kann.

Warum wir das bauen

Drei Gruende, in dieser Reihenfolge. Erstens: der haerteste Stresstest fuer unseren Open-Source-Stack (darwin-agents, darwin-langgraph, langgraph). Wenn acht Agenten 30 Ticks lang verhandeln ohne Kollaps, ist der Stack felderprobt. Zweitens: Build-in-Public als replikables Pattern. Source privat, Forschung oeffentlich, jede Code-Review-Runde dokumentiert. Drittens: erstmals oeffentlich dokumentierte Multi-Agent-Society-Sim mit Civilization-style Era-Progression on-top von Governance-Mechaniken — plus deterministischer Antagonist (Fortuna), vier Game-Over-Trigger, und Temporal-orchestrierte Durability fuer 1000+ Tick-Laeufe.

Wir wollen die Forschung von narrativen Demos in Richtung spielbarer simulierter Gesellschaften mit Einsaetzen bewegen. Wenn V2.1 plus V2.3 ausgeliefert sind, ist es die erste Multi-Agent-Society-Sim mit zivilisatorischen Stakes und Production-Grade-Durability. Open Source. Dokumentiert. Live. Whitepaper · Roadmap.

Live-Feed

// letzte Aktionen der Buerger live
  • Noch kein aktiver Run. Warte auf naechstes Tick-Update…

Aktueller Stand

// run · last-known-state Tick · live
8
Bevoelkerung
24
Vorrat
6/10
Stimmung
3
Felder

Acht Buerger

Jede Rolle sieht nur einen Teil der Stadt — niemand hat den vollen Ueberblick. Die ersten fuenf bauen die Stadt auf. Die letzten drei bringen Drama: der Aussenseiter mit seinen Prophezeiungen, der Krieger mit seiner Macht, der Richter mit seinen Gesetzen.

π
Buergermeister
Beruft Versammlungen ein, schlichtet Streit, startet gemeinsame Bauten und haelt Reden wenn die Stadt in der Krise steckt.
Haendler
Tauscht Korn gegen Muenzen, verteilt Vorraete und spuert wo gerade Knappheit oder Ueberschuss herrscht.
Bauer
Bestellt die Felder, bringt die Ernte ein, warnt vor Hunger und fischt wenn die Felder einmal leer sind.
Forscher
Stellt Theorien auf, rechnet Versorgungs-Luecken durch und legt sein Wissen in einer Bibliothek der Stadt ab.
Kuenstler
Hebt die Stimmung mit Musik und Theater, schreibt die Gruendungssaga und gibt der Polis ihren Charakter.
Voodoo-Priester
Der Aussenseiter. Sagt Krisen voraus, weiht Bauten, verflucht Hybris. Drei Fehlprophezeiungen kosten ihn den Posten.
Stratege
Der Krieger. Bewacht die Stadt, hebt Truppen aus. Verlaesst sie wenn die Stimmung sinkt — oder putscht selbst.
Areopagit
Der Richter. Spricht das letzte Wort, verbannt Gesetzesbrecher, erlaesst Gesetze. Faellt oft mit dem Buergermeister aneinander.

Hinter den Kulissen — sieben Wartungs-Agenten

Eine Stadt, zwei Schichten KI: die acht Buerger oben leben. Diese sieben Agenten beobachten, dokumentieren, lernen aus jedem Run und bauen das Spiel weiter. Sie sind nicht in der Sim — sie sind das Studio drumherum.

polis-ceo
Orchestrator. Sammelt die Worker-Reports der anderen sechs, synthetisiert zu Telegram-Brief, eskaliert bei kritischen Findings.
Opus 4.7 · Memory
polis-cto
Code-Review-Auge, strict read-only. Liest jeden Diff via Graph-Tools, jagt Drift, prueft Sicherheits-Regressions vor dem Promote.
Opus 4.7 · Memory · Codebase-Graph · Codegraph · Archtracker
polis-architect
Welt-Planer. Schreibt ADRs ueber neue Eras, Buildings, Verben, Sprites. Research-First-Disziplin: 5 Quellen parallel, jede Entscheidung mit Citation-Trail.
Opus 4.7 · Memory · Tavily · Brave · Exa · Anthropic Search · context7 · mcp-media
§
polis-storyteller
Chronist mit Drama-Disziplin. Dreiakt-Struktur, Konflikt-Hunting in den Run-Daten, banned Log-Dumps. Schreibt die Stadt-Saga.
Opus 4.7 · Memory · Bash
polis-research
Scout fuer Multi-Agent-Sim-Forschung. Liest Papers (Smallville, GovSim, Voyager, AgentVerse, Project Sid), benchmarkt gegen Civ/Banished/Dwarf Fortress.
Opus 4.7 · Memory · Tavily · Brave · Exa · Anthropic Search · context7
polis-analytics
DB-Aggregator. Zaehlt Runs, Scores, Verb-Verteilung, Skip-Raten. Markiert Anomalien (z.B. Haendler 100% Skip = Prompt-Problem).
Opus 4.7 · Memory · Bash · Analytics-MCP
polis-visibility
Watcher fuer KI-Auffindbarkeit. Prueft ob ChatGPT, Claude, Perplexity, Gemini Polis kennen. Pingt IndexNow, sucht Citations.
Opus 4.7 · Memory · Brave · Exa · Research

Alle sieben laufen auf Opus 4.7 im Background, eigenes Memory-Prefix pro Agent, Reports als Markdown in research/. Drafts gehen ueber einen 24-Stunden-Staging-Soak bevor sie mergen — keiner pusht direkt zu main.

Stimmen aus der Polis

Auszuege aus dem ersten 5-Tick-Smoke-Run (Mai 2026). Echte Worte der Agenten, nicht Drehbuch.

Mit 2 Feldern reichen nicht fuer 8 Buerger. Defizit minus 10 bis minus 26 pro Tick. Buergermeister: drei bis vier neue Feld-Pledges jetzt.

Forscher · Tick 2 · Defizit-Analyse

Schlechte Ernte, Pool gesunken. Aber geplant. Feld 3 und 4 bringen +9 pro Tick. Wir machen weiter. Bleibt stark und koordiniert.

Buergermeister · Tick 2 · Whisper an den Rat

Dies ist unsere Gruendungssaga. Nicht Niederlage, sondern der Moment, in dem wir zeigten, wer wir wirklich sind.

Kuenstler · Tick 4

Ein Theater oder eine Musikhalle bauen. Ein Ort, wo unsere Gruendungssaga lebt.

Kuenstler · Tick 5 · Inspiration an Buergermeister

Welt-Mechaniken

Stack

runtime
darwin-agents0.5.0-alpha.2
graph
langgraph1.3
adapter
darwin-langgraph0.3.0-alpha.1
durability
temporalT06 civilization-template
tracing
langfuse + langfuse-langchain
llm
claude (haiku 4.5 sim · opus 4.7 fleet)
validation
zod defense-in-depth
tests
vitest 56 / 56 green

Vergleich

projekt live demo lokal os fokus
polisgeplant v2ja (sub)mitgovernance + commons
ai town (a16z+convex)jajamitpersona-chat + karte
smallville (stanford)neinsetupapacheresearch-paper
project sid (altera)closed betaneinclosedminecraft-society
govsim (eth)neinjamitcommons-dilemma
voyager (nvidia)neinjamitskill-library, minecraft
agentverse (tsinghua)neinjaapachemulti-agent framework

Roadmap

Sequenziert nach Abhaengigkeit, nicht nach Datum. Vollstaendige Spec in der ROADMAP.md.

Mitkommen

Polis-Quellcode bleibt privat. Der zugrunde liegende Open-Source-Stack ist oeffentlich:

Familie

Polis ist Teil eines Stack-Pakets im selben Studio. Alle alpha auf npm:

FAQ

Warum heisst es Polis?

Polis ist altgriechisch fuer Buergergemeinschaft als politische Einheit. Bei Aristoteles die natuerliche Gemeinschaft die zum gut Leben dient, entstanden durch viele Stimmen statt durch einen Plan. Die Polis war nie die Architektur, sondern die Stadt als Buergerverband. Genau das simuliert diese Welt.

Was ist eine Multi-Agent-Society-Simulation?

Mehrere autonome LLM-Agenten teilen sich eine Welt, haben eigene Rollen und Ziele, treffen Entscheidungen ohne globalen Plan und muessen verhandeln. Forschungsrichtung seit Stanford Smallville 2023, weitergedacht von Project Sid, GovSim, Voyager und AgentVerse.

Wie unterscheidet sich Polis von AI Town?

AI Town nutzt Convex und PixiJS und legt den Fokus auf Persona-Chat. Polis fokussiert Governance: Felder als Shared Commons (GovSim), Veto-Demokratie via Pledges (AgentVerse), Skill-Library (Voyager), Whisper-Channel und Krise. Plus Polis ist durable orchestriert mit Temporal — Runs laufen ueber 1000+ Ticks stabil, mit Activity-Retry bei Subprocess-Crashes und Schedule-API fuer Recurring Runs.

Was macht Polis stabil ueber lange Runs?

Temporal als Workflow-Orchestrator. Jeder Tick laeuft als Activity mit Retry-Policy, jeder Run als durable Workflow der Server-Restarts ueberlebt. Plus Schedule-API fuer recurring Cron statt System-Cron. Pattern aus unserem [temporal-memory-workflows](https://github.com/studiomeyer-io/temporal-memory-workflows)-Stack (T06: civilization-simulation-template).

Kann ich Polis lokal ausprobieren?

Quellcode bleibt privat. Per Mail fuer Einsicht. Forschungsergebnisse + Architektur-Notizen werden hier oeffentlich gemacht.

Welche Forschungs-Paper haben Polis inspiriert?

Generative Agents (Park et al. 2023, Smallville), Voyager (Wang et al. 2023, NVIDIA), GovSim (Piatti et al. 2024, ETH Zurich), AgentVerse (Chen et al. 2023, Tsinghua), Project Sid (Altera 2024).

Ist Polis Open Source?

Quellcode bleibt privat. Forschungs- und Architektur-Notizen werden hier oeffentlich dokumentiert. Mail an matthias@studiomeyer.io fuer Code-Einsicht.

Was als naechstes kommt

Hier landet bald die Town. Du siehst dann acht Avatare sich bewegen, Felder pflanzen, Krisensitzungen einberufen. Klick auf einen Buerger, du siehst sein Memory, seine Decisions, seine letzte Score-Begruendung vom Critic. Klick auf einen Tick, du siehst die ganze Welt zu diesem Zeitpunkt. Klick auf Run starten und sie spielen vor deinen Augen weiter.

Bis dahin lebt Polis lokal. Konzept liegt offen, Doku liegt offen, jede Code-Review-Runde liegt offen. Wenn dich das Konzept reizt, schreib mir.