Sehen, was KI kostet —
und was sie leistet.
KI ohne Cockpit ist eine Blackbox auf der Rechnung. Nexograph macht jeden Euro, jeden Workflow und jede Aktion sichtbar: Kosten pro Modell, Abteilung und Operation, Agenten-Workflows aus vorgefertigten Prompts und ein lückenloser Audit-Trail — vom Budget bis zum einzelnen Modell-Aufruf.
Jeder Euro hat eine Adresse.
Das Nutzungs-Cockpit bricht jede KI-Ausgabe auf — nach Modell, Abteilung und Operation, über 7, 30 oder 90 Tage. Kein „die KI war teuer", sondern: welche KI, für wen, in welchem Prozess.
Top nach Token-Volumen — pro Modell
| Modell | Events | Input | Output | Gesamt | Kosten |
|---|---|---|---|---|---|
| GPT-4o-mini | 71.240 | 20,1 M | 2,3 M | 22,4 M | € 312 |
| Claude Sonnet 4.5 | 22.880 | 11,9 M | 2,3 M | 14,2 M | € 1.044 |
| GPT-4o | 14.110 | 7,2 M | 1,4 M | 8,6 M | € 921 |
| Llama 3.1 70B (Private) | 12.640 | 3,6 M | 0,5 M | 4,1 M | € 0 |
| embedding-3-large | 6.310 | 1,3 M | — | 1,3 M | € 41 |
| Claude Haiku | 1.250 | 0,2 M | 0,1 M | 0,3 M | € 529 |
| Gesamt | 128.430 | 41,8 M | 9,1 M | 50,9 M | € 2.847 |
Top nach Token-Volumen — pro Abteilung
| Workspace | Aktivität | Events | Gesamt | Kosten |
|---|---|---|---|---|
| Sales-Workspace | Angebote, CRM-Recherche, Cross-Selling | 46.120 | 18,1 M | € 988 |
| Service | Support-Auskünfte aus Wissensbasis | 33.480 | 12,9 M | € 612 |
| Compliance | Belegprüfung, Quellen-Checks | 21.900 | 9,4 M | € 701 |
| Controlling | Auswertungen, Report-Entwürfe | 16.740 | 6,6 M | € 358 |
| Einkauf | Ausschreibungen, Vertragsanalyse | 10.190 | 3,9 M | € 188 |
| Gesamt | 128.430 | 50,9 M | € 2.847 |
Top nach Token-Volumen — pro Operation
| Operation | Events | Input | Output | Gesamt | Kosten |
|---|---|---|---|---|---|
| graphrag:query | 52.300 | 16,4 M | 3,4 M | 19,8 M | € 1.121 |
| chat | 38.910 | 9,3 M | 2,1 M | 11,4 M | € 486 |
| agent-mode:query | 9.640 | 7,1 M | 1,6 M | 8,7 M | € 798 |
| document:ingest | 14.880 | 5,5 M | 0,3 M | 5,8 M | € 211 |
| summarize | 6.090 | 3,2 M | 0,7 M | 3,9 M | € 190 |
| embedding | 6.610 | 1,3 M | — | 1,3 M | € 41 |
| Gesamt | 128.430 | 41,8 M | 9,1 M | 50,9 M | € 2.847 |
Limit pro Anfrage & Workspace
Jeder logische Request hat ein Token-/Kostenbudget — inklusive aller Wiederholungen. Läuft ein Workspace heiß, greift das Limit, bevor die Rechnung es tut.
Günstigstes passendes Modell
Der Multi-LLM-Router schickt einfache Aufgaben an kleine Modelle und sensible Daten ins Private LLM. Im Beispiel: 18 % weniger Kosten bei gleicher Qualität.
Kostenstellen-Zuordnung
Jedes Event trägt Abteilung, Projekt und Operation. Die Auswertung lässt sich exportieren — als Grundlage für interne Verrechnung und ROI-Nachweis.
Vom vorgefertigten Prompt
zum orchestrierten Workflow.
Niemand muss Agenten programmieren. Geprüfte Prompt-Vorlagen beschreiben die Aufgabe in Klartext — Nexograph macht daraus einen Agenten, verbindet mehrere zu einem Workflow und führt sie nachvollziehbar Schritt für Schritt aus.
- Aus Klartext, nicht aus Code: geprüfte Prompt-Vorlagen je Use Case — anpassbar, versioniert, wiederverwendbar.
- Kontrolliert verbunden: Supervisor, Agent-as-Tool, parallele und bedingte Pfade — mit Freigabe-Schritten an kritischen Stellen.
- Nichts läuft im Verborgenen: jeder Reasoning- und Tool-Schritt mit Ein-/Ausgabe, Dauer und Tokenkosten einsehbar.
Nichts passiert ohne Spur.
Jede sicherheitsrelevante Aktion schreibt ein unveränderliches Audit-Event — wer, was, wann, mit welchem Modell. Vom Aktivieren des Agent-Modus bis zum einzelnen Tool-Aufruf bleibt alles nachvollziehbar und prüfbar.
Authentifizierter Nutzer oder Agent — jede Zeile trägt den verantwortlichen Actor.
Die konkrete Aktion — Zugriff, Lauf, Tool-Aufruf, Freigabe, Konfigurationsänderung.
Zeitstempel plus Modell, Datenraum und Kosten des Vorgangs.
Jede KI-Antwort führt ihre Quellen mit — prüfbar bis zum Dokument.
Append-only
Events werden nur angehängt, nie überschrieben — Manipulation fällt auf.
Für Audits & Aufsicht
Vollständiger Verlauf je Tenant — als Nachweis für DSGVO, Revision und Wirtschaftsprüfung.
Telemetrie inklusive
Spans und Metriken je Lauf — Auffälligkeiten wie Rate-Limits oder abgewiesene Tools sichtbar.