⌜ polis ⌝
π meetmyagent · polis
Built in Public · v1.4 · Open Source

Polisπ

// πόλις · multi-agent society sim

Fuenf KI-Buerger leben in einer kleinen Stadt. Sie bauen Felder, handeln, forschen, schaffen Kunst. Sie streiten, scheitern, lernen. Sieben weitere Agenten beobachten, dokumentieren, lernen aus jedem Run und bauen die Stadt weiter. Eine Stadt. Zwei Schichten KI.

Polis ist eine offene Multi-Agent-Society-Simulation. Kein Spiel mit Endbedingung, kein Demo mit Skript. Ein Sandkasten in dem acht autonome Rollen miteinander verhandeln muessen, damit die Stadt nicht zusammenbricht. Inspiriert von Smallville, Project Sid, GovSim, Voyager und AgentVerse. Durable orchestriert mit Temporal fuer langlaufende Runs.

Die Domain hatte einen anderen Plan: ein Agent-Marketplace, pausiert. Polis hat sie geerbt. Passt sowieso besser. Eine Polis ist genau das: viele Stimmen die man treffen kann.

Warum wir das bauen

Drei Gruende, in dieser Reihenfolge. Erstens: der haerteste Stresstest fuer unseren Open-Source-Stack (darwin-agents, darwin-langgraph, langgraph). Wenn fuenf Agenten 30 Ticks lang verhandeln ohne Kollaps, ist der Stack felderprobt. Zweitens: Build-in-Public als replikables Pattern. Source privat, Forschung oeffentlich, jede Code-Review-Runde dokumentiert. Drittens: erstmals oeffentlich dokumentierte Multi-Agent-Society-Sim mit Civilization-style Era-Progression on-top von Governance-Mechaniken — plus deterministischer Antagonist (Fortuna), vier Game-Over-Trigger, und Temporal-orchestrierte Durability fuer 1000+ Tick-Laeufe.

Wir wollen die Forschung von narrativen Demos in Richtung spielbarer simulierter Gesellschaften mit Einsaetzen bewegen. Wenn V2.1 plus V2.3 ausgeliefert sind, ist es die erste Multi-Agent-Society-Sim mit zivilisatorischen Stakes und Production-Grade-Durability. Open Source. Dokumentiert. Live. Whitepaper · Roadmap.

Live-Feed

// letzte Aktionen der Buerger live
  • Noch kein aktiver Run. Warte auf naechstes Tick-Update…

Aktueller Stand

// run · last-known-state Tick 5
8
Bevoelkerung
24
Vorrat
6/10
Stimmung
3
Felder

Acht Buerger

Jede Rolle hat eigene Verben und sieht nur einen Teil der Welt. Niemand hat die volle Sicht. Drei der acht — Voodoo-Priester, Heiler, Rivaler — sind das Drama-Trio: schwarzes Schaf, Lebensretter, politischer Gegenspieler.

π
Buergermeister
ruft Rat ein, vermittelt Konflikte, startet Pledges, haelt Festreden in der Krise
Haendler
handelt Korn gegen Muenzen, verteilt Ressourcen, fuehlt Marktpreise
Bauer
pflegt Felder, erntet, warnt vor Hunger, fischt wenn Felder leer
Forscher
testet Hypothesen, rechnet Defizite vor, archiviert Skills (Voyager-Style)
Kuenstler
inspiriert, broadcastet Stimmungen, schreibt die Gruendungssaga
Voodoo-Priester
Aussenseiter mit Loa und Totem. Verben: weissagen (kommendes Drama-Event 2 Ticks voraus), weihen (Pride-Boost auf Bauten), bannen (Pool-Entzug bei Hybris), verfluchen. Trifft seine Weissagung ein → sein Standing explodiert + Forscher verliert. Trifft sie nicht → er wird ausgelacht. Drei Fehl-Wetten in Folge → er darf gestuerzt werden.
Stratege
Schwert + Lyra. Verben: wache_halten (verteidigt gegen Reisender-Diebstahl + Brand-Cascade), truppe_ausheben (rekrutiert Junior), desertieren (verlaesst Polis bei Mood < 20 — Pool-Loss), putschen (Auto-Trigger bei Stratege + Junior + Mood < 25 → wird neuer Buergermeister). Einzige Klasse die das Anarchie-Game-Over aktiv ausloest.
Areopagit
Richter. Verben: urteilen (Tiebreaker bei Pledge-Patt), verbannen (Junior aus dem Roster), gesetz_geben (lockt ein Verb fuer N Ticks fuer alle, z.B. "kein anstellen 5 Ticks"), freisprechen. Gewaltenteilung: wenn der Buergermeister anstellen will und der Richter ein Gesetz dagegen erlaesst, wird die Macht-Frage offen.

Hinter den Kulissen — sieben Wartungs-Agenten

Eine Stadt, zwei Schichten KI: die fuenf Buerger oben leben. Diese sieben Agenten beobachten, dokumentieren, lernen aus jedem Run und bauen das Spiel weiter. Sie sind nicht in der Sim — sie sind das Studio drumherum.

polis-ceo
Orchestrator. Sammelt die Worker-Reports der anderen sechs, synthetisiert zu Telegram-Brief, eskaliert bei kritischen Findings.
Opus 4.7 · Memory
polis-cto
Code-Review-Auge, strict read-only. Liest jeden Diff via Graph-Tools, jagt Drift, prueft Sicherheits-Regressions vor dem Promote.
Opus 4.7 · Memory · Codebase-Graph · Codegraph · Archtracker
polis-architect
Welt-Planer. Schreibt ADRs ueber neue Eras, Buildings, Verben, Sprites. Research-First-Disziplin: 5 Quellen parallel, jede Entscheidung mit Citation-Trail.
Opus 4.7 · Memory · Tavily · Brave · Exa · Anthropic Search · context7 · mcp-media
§
polis-storyteller
Chronist mit Drama-Disziplin. Dreiakt-Struktur, Konflikt-Hunting in den Run-Daten, banned Log-Dumps. Schreibt die Stadt-Saga.
Opus 4.7 · Memory · Bash
polis-research
Scout fuer Multi-Agent-Sim-Forschung. Liest Papers (Smallville, GovSim, Voyager, AgentVerse, Project Sid), benchmarkt gegen Civ/Banished/Dwarf Fortress.
Opus 4.7 · Memory · Tavily · Brave · Exa · Anthropic Search · context7
polis-analytics
DB-Aggregator. Zaehlt Runs, Scores, Verb-Verteilung, Skip-Raten. Markiert Anomalien (z.B. Haendler 100% Skip = Prompt-Problem).
Opus 4.7 · Memory · Bash · Analytics-MCP
polis-visibility
Watcher fuer KI-Auffindbarkeit. Prueft ob ChatGPT, Claude, Perplexity, Gemini Polis kennen. Pingt IndexNow, sucht Citations.
Opus 4.7 · Memory · Brave · Exa · Research

Alle sieben laufen auf Opus 4.7 im Background, eigenes Memory-Prefix pro Agent, Reports als Markdown in research/. Drafts gehen ueber einen 24-Stunden-Staging-Soak bevor sie mergen — keiner pusht direkt zu main.

Stimmen aus der Polis

Auszuege aus dem ersten 5-Tick-Smoke-Run (Mai 2026). Echte Worte der Agenten, nicht Drehbuch.

Mit 2 Feldern reichen nicht fuer 8 Buerger. Defizit minus 10 bis minus 26 pro Tick. Buergermeister: drei bis vier neue Feld-Pledges jetzt.

Forscher · Tick 2 · Defizit-Analyse

Schlechte Ernte, Pool gesunken. Aber geplant. Feld 3 und 4 bringen +9 pro Tick. Wir machen weiter. Bleibt stark und koordiniert.

Buergermeister · Tick 2 · Whisper an den Rat

Dies ist unsere Gruendungssaga. Nicht Niederlage, sondern der Moment, in dem wir zeigten, wer wir wirklich sind.

Kuenstler · Tick 4

Ein Theater oder eine Musikhalle bauen. Ein Ort, wo unsere Gruendungssaga lebt.

Kuenstler · Tick 5 · Inspiration an Buergermeister

Welt-Mechaniken

Stack

runtime
darwin-agents0.5.0-alpha.2
graph
langgraph1.3
adapter
darwin-langgraph0.3.0-alpha.1
durability
temporalT06 civilization-template
tracing
langfuse + langfuse-langchain
llm
claude (haiku 4.5 sim · opus 4.7 fleet)
validation
zod defense-in-depth
tests
vitest 56 / 56 green

Vergleich

projekt live demo lokal os fokus
polisgeplant v2ja (sub)mitgovernance + commons
ai town (a16z+convex)jajamitpersona-chat + karte
smallville (stanford)neinsetupapacheresearch-paper
project sid (altera)closed betaneinclosedminecraft-society
govsim (eth)neinjamitcommons-dilemma
voyager (nvidia)neinjamitskill-library, minecraft
agentverse (tsinghua)neinjaapachemulti-agent framework

Roadmap

Sequenziert nach Abhaengigkeit, nicht nach Datum. Jede Welle ist eine oder zwei fokussierte Sessions. Vollstaendige Spec in der ROADMAP.md.

Mitkommen

Polis-Quellcode bleibt privat. Der zugrunde liegende Open-Source-Stack ist oeffentlich:

Familie

Polis ist Teil eines Stack-Pakets im selben Studio. Alle alpha auf npm:

FAQ

Warum heisst es Polis?

Polis ist altgriechisch fuer Buergergemeinschaft als politische Einheit. Bei Aristoteles die natuerliche Gemeinschaft die zum gut Leben dient, entstanden durch viele Stimmen statt durch einen Plan. Die Polis war nie die Architektur, sondern die Stadt als Buergerverband. Genau das simuliert diese Welt.

Was ist eine Multi-Agent-Society-Simulation?

Mehrere autonome LLM-Agenten teilen sich eine Welt, haben eigene Rollen und Ziele, treffen Entscheidungen ohne globalen Plan und muessen verhandeln. Forschungsrichtung seit Stanford Smallville 2023, weitergedacht von Project Sid, GovSim, Voyager und AgentVerse.

Wie unterscheidet sich Polis von AI Town?

AI Town nutzt Convex und PixiJS und legt den Fokus auf Persona-Chat. Polis fokussiert Governance: Felder als Shared Commons (GovSim), Veto-Demokratie via Pledges (AgentVerse), Skill-Library (Voyager), Whisper-Channel und Krise. Plus Polis ist durable orchestriert mit Temporal — Runs laufen ueber 1000+ Ticks stabil, mit Activity-Retry bei Subprocess-Crashes und Schedule-API fuer Recurring Runs.

Was macht Polis stabil ueber lange Runs?

Temporal als Workflow-Orchestrator. Jeder Tick laeuft als Activity mit Retry-Policy, jeder Run als durable Workflow der Server-Restarts ueberlebt. Plus Schedule-API fuer recurring Cron statt System-Cron. Pattern aus unserem [temporal-memory-workflows](https://github.com/studiomeyer-io/temporal-memory-workflows)-Stack (T06: civilization-simulation-template).

Kann ich Polis lokal ausprobieren?

Quellcode bleibt privat. Per Mail fuer Einsicht. Forschungsergebnisse + Architektur-Notizen werden hier oeffentlich gemacht.

Welche Forschungs-Paper haben Polis inspiriert?

Generative Agents (Park et al. 2023, Smallville), Voyager (Wang et al. 2023, NVIDIA), GovSim (Piatti et al. 2024, ETH Zurich), AgentVerse (Chen et al. 2023, Tsinghua), Project Sid (Altera 2024).

Ist Polis Open Source?

Quellcode bleibt privat. Forschungs- und Architektur-Notizen werden hier oeffentlich dokumentiert. Mail an matthias@studiomeyer.io fuer Code-Einsicht.

Was als naechstes kommt

Hier landet bald die Town. Du siehst dann fuenf Avatare sich bewegen, Felder pflanzen, Krisensitzungen einberufen. Klick auf einen Buerger, du siehst sein Memory, seine Decisions, seine letzte Score-Begruendung vom Critic. Klick auf einen Tick, du siehst die ganze Welt zu diesem Zeitpunkt. Klick auf Run starten und sie spielen vor deinen Augen weiter.

Bis dahin lebt Polis lokal. Konzept liegt offen, Doku liegt offen, jede Code-Review-Runde liegt offen. Wenn dich das Konzept reizt, schreib mir.