"Lage der Gesetze": Gesetzesänderungen als Pull Requests sichtbar machen

Die letzte Folge zum Wehrdienst-Modernisierungsgesetz hat bei mir einen Gedanken ausgelöst, der hier im Forum schon mehrfach aufkam:

Warum behandeln wir Gesetzesänderungen eigentlich nicht wie Codeänderungen?

In der Folge wurde diskutiert, dass freiheitseinschränkende Aspekte des Gesetzes selbst Fraktionen, die für solche Fragen sonst sehr sensibel sind (Grüne, Linke), und auch euch in der Lage erst spät richtig aufgefallen sind. Ein zentraler Punkt dabei war: Es fehlte eine wirklich verständliche, öffentlich nachvollziehbare Synopse zwischen geltendem Recht und Entwurf.

Ich saß beim Hören da und dachte: Das kann doch in Zeiten von Git und leistungsfähiger KI nicht ernsthaft immer noch so laufen.

Die Idee

Ich würde gerne ein offenes Projekt starten — als Arbeitstitel Lage der Gesetze (oder vielleicht Gesetzes-Lage, bin da nicht festgelegt): ein Tool, das öffentliche Gesetzesvorlagen automatisch als Git-Diffs und Pull Requests sichtbar macht.

Aktuelle Gesetze liegen in einem Git-Repository. Wenn ein neuer Referentenentwurf, Gesetzentwurf, Änderungsantrag oder eine Beschlussempfehlung öffentlich wird, holt ein Service das Dokument ab und versucht, die darin enthaltenen Änderungsbefehle auf den aktuellen Gesetzestext anzuwenden. Das Ergebnis ist ein Pull Request, der wie eine Synopse zeigt, welche Normen, Paragraphen oder Sätze geändert werden, wie der Gesetzestext nach Anwendung des Entwurfs aussehen würde, und wo die Vorlage unklar oder mehrdeutig ist.

Aus diesem Repository können dann recht einfach etliche andere Darstellungen abgeleitet werden, etwa eine Webseite, eine App, oder auch eine PDF zum Download.

Warum Git und warum KI?

Git ist genau für solche Probleme gebaut. Bei Software ist das selbstverständlich — bei Gesetzen, die unser aller Leben betreffen, leider nicht. Ein Git-Diff ersetzt natürlich keine juristische Prüfung, aber er kann sehr schnell sichtbar machen, was tatsächlich geändert werden soll.

Die Idee bei der KI ist: Ein moderner Coding-Agent (etwa Claude Code, Codex oder ein vergleichbarer Harness) bekommt den aktuellen Gesetzesbestand, die Vorlage, spezialisierte Skills, Tests und ein strukturiertes Datenmodell. Dann wendet er die Änderungsbefehle an und erzeugt einen überprüfbaren PR. Wenn ein State-of-the-Art-Modell mit Skills daran scheitert, ist die Vorlage selbst unverständlich oder missverständlich — und genau das wäre dann auch eine Story wert.

Volle Transparenz statt Black Box. Für jeden Agentenlauf wird dokumentiert: Modell, Prompt, Quelle, Zwischenschritte, was menschlich geprüft wurde. Gerade weil KI beteiligt ist, darf das keine Black Box sein.

Diff zum Diff. Erscheint eine neue Fassung, ein Änderungsantrag oder eine Beschlussempfehlung, erzeugt das System zusätzlich einen PR gegen den bisherigen Entwurfsbranch und einen aktualisierten Gesamt-PR gegen den aktuellen Gesetzesstand. So sieht man nicht nur, was ein Entwurf am geltenden Recht ändern würde, sondern auch, wie er sich im Verfahren selbst verändert.

Für wen, und Klon-Einladung

Ein journalistisches und zivilgesellschaftliches Transparenzwerkzeug — keine amtliche Rechtsfassung — ausdrücklich auch zum Klonen für Parteien, Fraktionen, Ausschüsse oder Verwaltungen, mit Anleitung für lokale KI bei internen Entwürfen.

Wie ich starten würde

Ich bin App-Entwickler, sehr versiert mit aktuellen KI-Coding-Agenten und agentenbasierten Workflows, und hätte Lust, einen ersten Entwurf vorzulegen und nebenher daran weiterzuarbeiten. Als ersten Testfall würde ich genau das Wehrdienst-Modernisierungsgesetz nehmen: Ab wann hätte ein automatisches System die Änderung erkennen können, hätte ein Diff die problematische Stelle sichtbar gemacht — und wo wäre der Agent gescheitert?

Aus Erfahrung weiß ich: Solche Projekte werden viel besser, wenn man sie nicht alleine baut. Deshalb würde ich mich über zwei Arten von Unterstützung freuen.

1. Interessierte Laien. Menschen, die Lust haben, sich Zwischenergebnisse anzuschauen und Feedback zu geben: Ist der Diff verständlich? Welche Information fehlt? Wo verliert man den Überblick? Kein juristisches oder technisches Fachwissen nötig — im Gegenteil, gerade Feedback von Menschen, die nicht täglich mit Git oder Gesetzen arbeiten, wäre sehr wertvoll.

2. Fachkundige Mitdenker und Reviewer. Menschen mit Erfahrung in Recht, Verwaltung, Journalismus, Open Data, Legal Tech, Parlamentsdokumentation oder KI. Ihr müsst nicht selbst Code schreiben — wichtiger wäre, meine Prompts, Skills und Datenmodelle kritisch zu prüfen: Werden Änderungsbefehle korrekt interpretiert? Sind Unsicherheiten sinnvoll markiert? Wo besteht die Gefahr, dass das System falsche Sicherheit vermittelt?


Ich glaube, alles, was fehlt, ist, dass jemand einfach mal anfängt. Das würde ich gerne tun — und ihr seid herzlich eingeladen, mitzumachen.

Was haltet ihr davon? Hat jemand Lust mitzudenken oder zu reviewen und welche Aspekte habe ich vielleicht übersehen?

20 „Gefällt mir“

Bin da ganz bei dir. Im Bundestag gab es da wohl auch mal einen Ansatz, ist aber vor Jahren wieder eingeschlafen: GitHub - bundestag/gesetze: Bundesgesetze und -verordnungen · GitHub

Ob man am Ende KI da drauf setzt oder nicht ist für mich gar nicht das entscheidende, und ich würde das auch strikt trennen. Denn alleine eine saubere Dokumentation von Änderungen wäre schon sehr viel Wert.

Mich würde da besonders die Position von Juristen interessieren, ein Git/Merge-Request Workflow klingt für mich sehr sinnvoll, auf jeden Fall besser als Word mit Änderungsverfolgung. Und einen sauberen Workflow braucht es ja nicht nur für Gesetze, sondern auch für alle anderen schriftlichen Produkte von Juristen.

6 „Gefällt mir“

Man kann natürlich immer versuchen, auch ohne KI alles besser zu machen, worauf ich nur hinaus will ist dass man eigentlich mit dem was schon da ist dank KI schon sehr viel mehr erreichen kann an Transparenz und Klarheit, ohne dass noch zusätzlich irgendwer extra Arbeit leisten muss. Die ist natürlich trotzdem sehr willkommen und du hast völlig Recht.

Aber in der letzten Lage ging es insbesondere auch um Selbstwirksamkeit, und darum geht es mir hier. Wie kann ich dazu beitragen, dass es voran geht, ohne nur zu hoffen oder zu wünschen, dass andere es besser machen. Und ich glaube, da geht schon ziemlich viel!

2 „Gefällt mir“

Hört sich für mich nach einer extrem guten Idee an. Könnte mir da auch vorstellen, zu unterstützen - nur noch nicht genau wo und wie :smiley:

Gerne einfach mal anfangen - das wird sicherlich in eine sehr sinnvolle und hilfreiche Richtung laufen!

4 „Gefällt mir“

So ein ähnliches Projekt gibt es ja schon, im Rahmen der Parlamentsrevue entstanden. Vielleicht können sich ja hier Gewillte dort beteiligen.

6 „Gefällt mir“

Cooles Projekt! Ich denke Sabrina werde ich auf jeden Fall kontaktieren und sie fragen, wie sie es genau umgesetzt hat und ob wir es nicht direkt mit integrieren können. Aber von einem Diff ist ihre Seite noch weit entfernt und eine Transparenz wie/wo/wann genau die KI im Spiel war gibt es leider auch nicht. Es gibt aber sicher einiges, was man aus dem Projekt lernen kann, und ich bin sicher, sie freut sich wenn sie nicht mehr länger auf den API-Kosten sitzt! :blush: Danke für den Link.

4 „Gefällt mir“

Es wurde in einer der Podcastfolgen ganz gut erklärt. Ich glaube in dieser:

4 „Gefällt mir“

Danke für den Link. Ich werde mir die Episode anhören, und auch bei Logbuch Netzpolitik wurde sie schon interviewt, wie es aussieht, auch das gönne ich mir.

Das ändert aber alles nichts daran, dass die Seite selbst nicht ausführlich dokumentiert für jede einzelne Zusammenfassung, wie sie genau entstanden ist.

Außerdem wurde das alles wohl entwickelt, bevor die ersten KI-Agenten erschienen sind (ChatGPT ist ein KI-Chatbot, kein Agent!). Claude Code erschien als erster solcher Agent erst im April 2025, seitdem ist deutlich mehr möglich und sehr viele Dinge können automatisiert werden, wozu vorher Schnittstellen notwendig waren. Allein in den letzten 12 Monaten hat sich da extrem viel getan!

Danke @Jeehut! Ich finde das sehr spannend.

Aus meiner Sicht wäre der erst und wichtigste Use Case: einen Agenten so zu trainieren, dass er sich die kryptischen Änderungsbefehle in einem Gesetzentwurf schnappt, sie auf den bisherigen Gesetzestext anwendet und dann eine Synopse generiert. Damit wäre der Wissensvorsprung zwischen Ministerium / Bundesregierung und Parlament mitigiert.

Das müsste dann im zweiten Schritt auch für die Änderungen im Ausschuss klappen, die ja quasi die zweite Ableitung des geltenden Gesetzes sind: Sie enthalten Änderungen der Änderungsbefehle … der Agent muss also die Änderungen in das ändernde Gesetz einpflegen und dieses dann auf das geltende Gesetz anwenden.

Vermutlich lässt sich das alles ziemlich gut als git commit umsetzen, ja - aber ich fände es auch wertvoll, wenn da PDFs mit Synopsen rausfallen würden.

2 „Gefällt mir“

@vieuxrenard Du hast den Kern meiner Idee perfekt wiedergegeben (ich hab es wohl nicht so gut auf den Punkt gebracht)! Genau darum geht es. Der Agent soll eben diese mechanische Nachschauen-und-Anwenden-Arbeit übernehmen (und das können LLMs mit den richtigen Anweisungen heutzutage erstaunlich zuverlässig), damit wir Menschen dann eine übersichtliche Darstellung bekommen – inklusive Änderungen der Änderungen!

Und als UI stelle ich mir eine Webseite (und als App-Entwickler vermutlich auch ne App) vor. Gerne kann ich da auch noch ein PDF-Download mit einbauen. Solange wir alles in maschinenlesbarer Form (JSON + Markdown) vorliegen haben, ist es einfach, aus diesen andere Formate zu generieren.

2 „Gefällt mir“

Ich hab noch nicht wirklich verstanden, warum es dazu eine trainierte KI braucht bzw. warum sie für diesen Anwendungsfall sinnvolle sein soll.

Die Änderungsbefehle mögen kryptisch sein, aber sollten sie nicht deterministisch umsetzbar sein? Selbst wenn die Änderungsbefehle nicht immer 100% gleich formuliert sind, hört sich das für mich nach einem Problem an, das durch klassische Programmierung gelöst werden könnte.

Auf der anderen Seite: WENN es dafür wirklich einer KI bedarf - wie soll ich dann mit überschaubarem Aufwand prüfen, ob meine Synopse korrekt erstellt wurde?

3 „Gefällt mir“

sollte man denken, aber frühere deterministische Projekte sind leider (soweit ich sehe) nicht dauerhaft erfolgreich gewesen / irgendwann eingeschlafen. Vermutlich braucht es genau die Portion Unschärfe, die eine probabilistische KI einbringen kann.

Mit einer anderen KI: Beispielsweise könnte man die auffordern, aus der Synopse wieder Änderungsbefehle zu generieren, und vergleicht sie mit dem Ausgangsgesetzentwurf. Oder man lässt zwei KIs die Synopse basteln und difft dann. Dass zwei unterschiedliche KIs zufällig zum selben falschen Ergebnis kommen ist doch sehr unwahrscheinlich und bewegt sich sehr wahrscheinlich unter der Fehlerquote, die menschliche Editoren hätten.

3 „Gefällt mir“

Es muss ja nicht 100% korrekt sein, Menschen machen schließlich auch Fehler bei der Erstellung von Synopsen.

Aber das Learning ist relativ gut machbar.
Gesetzesänderungen sind mW öffentlich also kann man die Erstellung der Synopse mit bekannten Daten trainieren.

Aus der (LLM-generierten) Synopse einer unbekannten Gesetzesänderung lässt sich dann nach festen Regeln die Änderung erstellen. Die kann man mit dem ursprünglichen Text vergleichen.

Absolute Korrektheit sehe ich auch nicht so kritisch. Es wäre doch schon ausreichend überhaupt zu verstehen, dass hier ggf. eine kritische Änderung vorliegt. Da würde man bevor man daraus Schlüsse zieht, sowieso nochmal drübergehen, und könnte dann Fehler dementsprechend erkennen.

@Jeehut Ich hätte auch Interesse da mitzuhelfen, bin Softwareentwickler und habe auch schon viel mit KI experimentiert.

5 „Gefällt mir“

Auf Gesetze-im-internet.de vom Justizministerium sind die Gesetzestexte u.a. als XML verfügbar (XML Table of Contents), es gibt auch eine kompatible python library via pip.

Es gibt außerdem noch die Bundestag-API im Deutschland Open-Data repo: (GitHub - bundesAPI/deutschland: Die wichtigsten APIs Deutschlands in einem Python Paket. · GitHub).
Im Idealfall haben die Maintainer vom Bundestagszusammenfasser darauf aufbauend aber schon viel strukturiert und implementiert, was man nicht nochmal neu erfinden muss (wo bekommt man welchen Entwurf her etc)

Hast du Lust ein github repo für das Projekt einzurichten?

1 „Gefällt mir“

Es wäre ja auch denkbar, dass die KI keine kritischen Veränderungen erkennt, es liegen aber in Wirklichkeit welche vor. Ich halte die Korrektheit daher schon für wichtig. Gerade weil ohne weiteres ja schwer zu sagen ist, wie gravierend die gemachten Fehler sind.

Da die resultierende Synopse aber ja eindeutig sein sollte, gibt es in der Tat gute Methoden das zu überprüfen.

2 „Gefällt mir“

Moin, ich bin selbst Entwickler und hatte vor ein paar Jahren mal von der Problematik der “Gesetz-Diffs” gehört. Hatte damals dieselbe Idee für ein Projekt, aber das war “vor KI” und wäre damit sehr aufwändig gewesen.

Ich hätte auf jeden Fall Lust, mich zu beteiligen, wenn es Bedarf gibt :victory_hand:

3 „Gefällt mir“

Vielen Dank an alle, die sich gemeldet haben! Ich werde auf jeden Fall ein GitHub-Repository aufsetzen und das mit euch hier teilen sobald ich angefangen habe und erste Ergebnisse zum Zeigen habe. Ihr habt mich alle sehr motiviert! :fire:

Realistisch gesehen melde ich mich aber erst im Juni, da ich gerade noch andere Projekte fertig machen muss und danach dann im Urlaub bin. Aber ich werd‘s nicht vergessen und melde mich dann hier wieder!

In der Zwischenzeit freue ich mich natürlich über weitere Meldungen und Hinweise, ich werde sie dann alle durchackern, um nichts unbeachtet zu lassen. :raising_hands:

7 „Gefällt mir“

Klingt gut! Ich könnte evtl. direkt dieses Wochenende auch ein paar Experimente starten, da habe ich ungewohnterweise etwas Zeit :wink: Aus meiner Sicht ist die spannendste Frage, wie gut (oder nicht) ein LLM es schafft, die Änderungshinweise korrekt zu interpretieren und einzufügen. Falls ich etwas herausfinde, teile ich es gerne hier.

3 „Gefällt mir“

Perfekt, vielen Dank allen Engagierten hier! Würde mich sehr freuen, wenn da ein Tool herauskommt, das es zB der Opposition erlauben würde, Gesetzentwürfe genau so gut nachzuvollziehen wie die jeweilige Regierung …

6 „Gefällt mir“