Suchen ist die unspektakulärste, aber teuerste Tätigkeit in modernen Wissensorganisationen. Verschiedene Studien (McKinsey, IDC) beziffern die tägliche Suchzeit pro Mitarbeitenden auf 1 bis 2 Stunden — oft auf der Suche nach etwas, das ein Kollege irgendwann schon einmal beantwortet hat. Dieser Beitrag erklärt, wie ein interner KI-Assistent das massiv reduziert, ohne klassisches Wissensmanagement zu ersetzen.
1. Das Problem: 1–2 Stunden Suchzeit pro Tag
In einem Unternehmen mit 100 Wissensmitarbeitenden bei 50 Euro Stundensatz und 1,5 Stunden Suchzeit pro Tag ergibt sich eine Bruttolast von rund 1,5 Millionen Euro pro Jahr — allein für Suchen. Dazu kommen indirekte Effekte: gestörter Flow, wiederholte Fragen an Kollegen, Entscheidungsverzögerung, frustrierte Mitarbeitende.
Genau dieses Problem löst ein interner KI-Assistent — oder besser: er reduziert es um typische 40–60%.
2. Die Grundidee in einem Satz
Ein interner KI-Assistent ist ein RAG-System, das über Ihren bestehenden Wissensquellen (Wiki, SharePoint, Helpdesk, Mailverläufe, Tickets) liegt und auf natürliche Fragen Antworten mit Quellenangabe liefert. Der Assistent antwortet nicht aus dem Bauch, sondern stützt sich auf Ihre Dokumente — und gibt im Idealfall den Pfad zur Quelle mit, damit der Mensch verifizieren kann.
3. Vier konkrete Anwendungsfälle
Die häufigsten Use Cases, die wir 2026 sehen:
- Onboarding-Assistent — Neue Mitarbeitende stellen Fragen 24/7. „Wie buche ich Urlaub?” „Wo finde ich die Reisekostenrichtlinie?” Entlastet HR und erfahrene Kollegen.
- Support-internes Wissen — Support-Mitarbeitende finden ähnliche frühere Tickets, frühere Lösungen, Produktdokumentation in einem Tool.
- Vertriebsassistent — Sales-Mitarbeitende fragen nach Produktdetails, Pricing, früheren Angeboten, Wettbewerbsinfos.
- Compliance-Lookup — „Was sagt unsere Richtlinie zu X?” — direkte Antwort mit Quelle, statt 20 Minuten Confluence-Suche.
4. Architektur eines internen Assistenten
Ein moderner interner Assistent hat fünf Schichten:
- Konnektoren zu den Quellsystemen — Confluence, SharePoint, Jira, Mail, HR, ggf. ERP. Mit Berechtigungs-Sync.
- Indexierung — Inhalte werden zerlegt (Chunking), eingebettet (Embeddings), in eine Vector-Datenbank geschrieben.
- Such-Pipeline — Hybrid-Search (BM25 + Vektor), Re-Ranking, Metadaten-Filter.
- Sprachmodell — generiert die Antwort. Idealerweise privat gehostet, siehe ChatGPT mit eigenen Daten.
- Frontend — Chat-Interface, idealerweise dort, wo die Mitarbeitenden ohnehin arbeiten (Slack, Teams, internes Portal).
Optional: ein Audit-Log für jeden Aufruf — wichtig für DSGVO und EU AI Act.
5. Zugriffsrechte und Berechtigungen
Die häufigste Frage von IT-Sicherheit: „Wird der Assistent allen alles zeigen?” Die Antwort sollte eindeutig nein sein. Drei Implementierungsmuster:
- Impersonierte Suche — der Assistent fragt das Quellsystem mit den Credentials des Endnutzers; das System filtert nach Berechtigung.
- ACL-gefilterter Index — beim Indexieren werden Berechtigungs-Tags mitgespeichert; die Suche filtert vor der LLM-Übergabe.
- Separate Indizes pro Vertraulichkeitsstufe — z. B. „öffentlich intern” vs. „nur HR” vs. „nur Geschäftsführung”.
Welches Muster passt, hängt von Ihrer bestehenden Berechtigungsstruktur ab.
6. Datenpflege — der unsichtbare Erfolgsfaktor
Ein interner Assistent ist nur so gut wie seine Quellen. Wenn das Confluence-Wiki seit drei Jahren nicht gepflegt wurde, holt der Assistent veraltete Informationen heraus. Wir sehen das in jedem zweiten Projekt: die KI ist die Lupe auf ein bestehendes Wissensproblem.
Pragmatischer Umgang: Mit den 20% wichtigsten Inhalten starten, klar als „kuratiert” markieren, alte Inhalte mit Datums-Filter aussortieren. Parallel: Verantwortliche für Wissenspflege benennen.
7. Aufwand und realistischer Zeitplan
Erfahrungswerte für 2026:
- Pilot mit einer Quelle (Wiki oder SharePoint): 6–10 Wochen, 25.000–50.000 Euro Projektkosten.
- Roll-out auf 3–4 Quellen + Berechtigungen: 3–4 Monate, 50.000–100.000 Euro zusätzlich.
- Laufende Kosten: 300–1.500 Euro/Monat (Hosting, LLM, Maintenance) abhängig vom Volumen und der Modellwahl.
ROI tritt typischerweise nach 6–9 Monaten ein. Bei einem Mittelständler mit 100 Wissensmitarbeitenden ist die Amortisation in der Regel klar gegeben — wenn das System genutzt wird. Genau hier scheitern Implementierungen oft, siehe Warum viele KI-Projekte scheitern.
Häufige Fragen.
/ 01Was unterscheidet einen internen KI-Assistenten von einem klassischen Wissensmanagement-System?
Ein klassisches WMS speichert und organisiert Inhalte. Ein interner KI-Assistent synthetisiert Antworten aus mehreren Quellen — und das in natürlicher Sprache. Statt 'Sucheingabe → Trefferliste → Lesen' wird daraus 'Frage → Antwort mit Quelle'. Beide ergänzen sich: das WMS bleibt die Wahrheit, der Assistent macht sie zugänglich.
/ 02Wie geht ein interner KI-Assistent mit Zugriffsrechten um?
Saubere Implementierungen respektieren die bestehenden Berechtigungen der Quellsysteme — der Assistent zeigt nur das, was der anfragende Nutzer auch direkt sehen dürfte. Technisch über impersonierte Suche oder ACL-gefilterte Indizes. Wer das ignoriert, baut ein Datenschutz-Problem.
/ 03Welche Wissensquellen lassen sich anbinden?
Praktisch alle: Confluence, SharePoint, Notion, Google Drive, Jira, Zendesk, GitLab/GitHub, E-Mail-Archive, Tickets, Dateifreigaben, ERP-Reporte. Wichtig: Konnektoren mit Berechtigungs-Synchronisation, keine 'alle dürfen alles sehen'-Architekturen.
/ 04Wie genau sind die Antworten eines internen KI-Assistenten?
Mit sauberer RAG-Architektur und gepflegten Quellen: 85–95% korrekte Treffer für gut abgegrenzte Themen. Wichtig: Quellenangaben einblenden, damit Nutzer verifizieren können. Wer Faithfulness-Eval einbaut, hält die Qualität dauerhaft hoch.
/ 05Was kostet ein interner KI-Assistent?
Einstieg mit einer Quelle und einem Anwendungsfall: 25.000–60.000 Euro Projektkosten plus laufende Kosten (LLM, Hosting, Maintenance) von typisch 300–1.500 Euro pro Monat. Mit jeder weiteren Quelle steigt der Wert überproportional — der Assistent wird umso wertvoller, je mehr er weiß.
/ 06Wie lange dauert der Aufbau?
Erster produktiver Pilot mit einer Quelle: 6–10 Wochen. Roll-out auf weitere Quellen und Abteilungen: 3–6 Monate. Ein in einer Woche fertig versprochener 'KI-Assistent' ist meist ein Template, kein echter, auf Ihre Quellen abgestimmter Assistent.