Beitragsbild: Graphify im Praxistest: Wissensgraph statt grep-Orgie

Zurück zur Blog-Übersicht

Graphify im Praxistest: Wissensgraph statt grep-Orgie

Ich habe Graphify in einem meiner Projekte getestet – und ja, ausnahmsweise ist „begeistert“ nicht nur das übliche Tech-Wort für „hat mich drei Stunden Debugging gekostet, aber am Ende ging es irgendwie“. Das Tool nimmt ein Repository, zieht Code, Doku und auf Wunsch sogar PDFs, Office-Dateien, Bilder oder Videos zusammen und baut daraus einen abfragbaren Wissensgraphen. Statt sich also mit grep, Tabs und einem leicht nervösen Blick durch ein Projekt zu hangeln, bekommt man eine Karte des Systems.[1][2]

Was ist Graphify überhaupt?

Laut Repo genügt im Kern schon ein einziger Befehl:

/graphify .

Damit erzeugt Graphify drei zentrale Ausgaben in graphify-out/:

  • graph.html als klickbare Visualisierung im Browser,
  • GRAPH_REPORT.md mit Highlights, Verbindungen und Fragen,
  • graph.json als maschinenlesbare Grundlage für weitere Abfragen.[2]

Die Idee dahinter ist erstaunlich pragmatisch: Ein Projekt wird nicht nur als Sammlung einzelner Dateien betrachtet, sondern als Netz aus Beziehungen. Funktionen, Module, Dokumentation, Architekturhinweise und sogar erklärende Kommentare werden zusammengeführt. Das ist gerade bei gewachsenen Codebasen hilfreich – also dort, wo „historisch gewachsen“ meistens bedeutet, dass schon lange niemand mehr weiß, warum etwas so ist, wie es ist.[2]

Ein paar harte Fakten zum Repository

Das Repository safishamsi/graphify ist öffentlich, steht unter der MIT-Lizenz und war zum Zeitpunkt meiner Recherche mit 55.5k Stars, 5.8k Forks, 117 Releases und einer aktuellen Version v0.8.22 versehen. Als Hauptsprache weist GitHub Python aus.[1]

Dazu kommt: Das Projekt wirkt nicht wie ein hübsches Wochenende mit viel README und wenig Substanz. Die Repository-Ansicht zeigt mehrere zentrale Verzeichnisse wie graphify, tests, docs und worked sowie Hunderte Commits. Das spricht für ein Tool, das aktiv weiterentwickelt wird – nicht nur für ein Repo, das einmal kurz viral ging und dann im digitalen Geräteschuppen geparkt wurde.[1]

Warum das Tool im Alltag so nützlich ist

Graphify positioniert sich nicht als klassischer Code-Indexer, sondern als Brücke zwischen Struktur und Bedeutung. Im Repo wird beschrieben, dass Code lokal per AST und tree-sitter verarbeitet wird, während andere Inhalte wie Dokumente, PDFs oder Bilder semantisch extrahiert werden.[2] Dadurch entsteht ein Modell, das eben nicht nur weiß, dass zwei Dinge existieren, sondern auch, wie sie zusammenhängen könnten.

Besonders spannend finde ich vier Aspekte:

1. Mehr als nur Code

Graphify kann nicht nur Quellcode, sondern auch Markdown, HTML, YAML, PDFs, Office-Dateien, Bilder, Audio- und Videodateien einbeziehen. Unterstützt werden außerdem viele Programmiersprachen sowie zusätzliche Formate über optionale Extras wie pdf, office, video, sql, svg, neo4j, ollama oder openai.[2]

Das ist in der Praxis Gold wert, weil Projekte selten nur aus sauber sortierten .py-Dateien bestehen. Meist liegen Architekturentscheidungen irgendwo in Markdown, Prozesse in einem PDF und die Wahrheit über das System in einem Kommentar, den niemand löschen will, weil alle Angst haben, dass dann die Produktion weint.

2. Query-first statt Datei-Hopping

Statt blind Dateien zu öffnen, propagiert Graphify einen query-first Ansatz. Es finden sich Befehle wie graphify query, graphify path oder graphify explain. Genau das ist der Charme: Man fragt nicht mehr nur „Wo steht das?“, sondern „Wie hängt X mit Y zusammen?“.[2]

Bei komplexeren Projekten ist das ein echter Unterschied. Klassische Suche beantwortet oft nur Fundstellen. Graphify versucht dagegen, Zusammenhänge zu beantworten – also die Fragen, die bei Onboarding, Refactoring oder Architekturverständnis wirklich zählen.

3. Visualisierung und Architekturansicht

Neben dem Graphen selbst kann Graphify mit graphify export callflow-html auch eine lesbare Architekturansicht mit Mermaid-Call-Flow-Diagrammen ausgeben.[2] Das ist kein bloßes Nice-to-have. Gerade wenn man einem Team oder Stakeholdern erklären will, wie ein System arbeitet, ist eine visuelle Darstellung oft deutlich nützlicher als die sehr mutige Aussage: „Ist eigentlich alles logisch, wenn man die acht Kernmodule einmal verstanden hat.“

4. Datenschutz mit nachvollziehbarer Aufteilung

Ein starkes Signal ist die klare Trennung bei der Verarbeitung: Code und Video-/Audio-Transkription werden lokal verarbeitet; für Docs, PDFs und Bilder wird semantische Extraktion über das Modell bzw. die jeweilige API genutzt. Außerdem wirbt das Projekt ausdrücklich mit „No telemetry, no usage tracking, no analytics“.[2]

Das ist relevant, weil viele AI-Tools beim Thema Datenschutz ungefähr so transparent sind wie eine Betonwand. Hier ist zumindest dokumentiert, was lokal bleibt und was nicht.

Was mir an Graphify besonders gefällt

Mich überzeugt an Graphify vor allem, dass das Tool ein reales Problem adressiert: Codebasen werden immer multimodaler und kontextreicher, während unsere Werkzeuge oft noch so tun, als ließe sich alles mit Dateibaum plus Textsuche erschlagen. Das funktioniert bei kleinen Projekten ordentlich. Bei größeren Systemen ist es ungefähr so effizient wie ein Stadtplan aus dem Jahr 1998 für heutige Baustellen.

Graphify denkt das Problem deshalb anders:

  • nicht nur Dateien, sondern Beziehungen,
  • nicht nur Fundstellen, sondern Erklärbarkeit,
  • nicht nur Code, sondern Projektwissen.

Gerade in Verbindung mit AI-Coding-Tools ist das stark. Das Repository listet Unterstützung für zahlreiche Assistenten auf, darunter Claude Code, Codex, Cursor, Gemini CLI, GitHub Copilot CLI, VS Code Copilot Chat und weitere Plattformen.[2] Damit ist Graphify kein Inselwerkzeug, sondern eher eine Art Wissensschicht für den bestehenden Workflow.

Gibt es auch Grenzen?

Natürlich. Ein Wissensgraph ist nur so gut wie seine Extraktion, die zugrunde liegenden Dateien und die Qualität der semantischen Verknüpfungen. Wer chaotische Projekte hat, bekommt damit keine plötzliche Erlösung in YAML-Form. Aber: Man bekommt ein deutlich besseres Werkzeug, um dieses Chaos systematisch zu navigieren.

Außerdem wird offen gezeigt, wo Zusatzpakete oder bestimmte Setups nötig sind – etwa für Office-Dateien, Google Workspace, Videoverarbeitung, Neo4j oder lokale Inferenz mit Ollama.[2] Das wirkt angenehm ehrlich und nicht wie die übliche Produktseite, die einem erst im Kleingedruckten verrät, dass „funktioniert sofort“ in Wahrheit „nach drei Extras und einem halben Nachmittag“ bedeutet.

Mein Fazit

Wenn man mit größeren Repositories, AI-Coding-Assistenten oder dokumentationslastigen Projekten arbeitet, ist Graphify ein bemerkenswert spannender Ansatz. Das Tool kombiniert Indexierung, semantische Extraktion, Visualisierung und Assistenz-Integration zu einem Paket, das im Alltag tatsächlich Mehrwert liefern kann.[1][2]

Mein Eindruck nach dem Test: Graphify ist nicht einfach ein weiteres Repo im großen Meer aus „developer tools for the AI era“, die auf Social Media sehr revolutionär aussehen und danach still verenden. Es ist ein Werkzeug mit klarer Idee, sichtbarer Weiterentwicklung und praktischem Nutzen – besonders dann, wenn ein Projekt mehr ist als nur ein paar Dateien und optimistische Hoffnungen.

Wer regelmäßig versucht, komplexe Codebasen zu verstehen, sollte sich das Repo definitiv ansehen. Denn manchmal ist die bessere Frage eben nicht mehr „In welcher Datei steckt das?“, sondern „Welche Geschichte erzählt mir das System als Ganzes?“ – und genau dort wird es plötzlich interessant.

Quellen

Quellen

  1. Repository-Übersicht mit Kennzahlen, Lizenz, Releases und Sprachstatistik: github.com/safishamsi/graphify 2 3 4

  2. README des Projekts mit Funktionsumfang, Installationshinweisen, unterstützten Plattformen, Privacy-Angaben und Befehlen: README.md auf GitHub 2 3 4 5 6 7 8 9 10 11