Chatbot, który zna procedury Twojej firmy lepiej niż Ty.
Pracownik pyta "jak wziąć urlop?". Zamiast szukać w Confluence, pytać kolegów albo pisać do HR - dostaje odpowiedź w 30 sekund. Ze wskazaniem konkretnego dokumentu, z którego pochodzi.
Problem
Mała firma w Warszawie. 12 pracowników. Procedury rozrzucone po plikach PDF, dokumentach w JIRA, politykach bezpieczeństwa. Nikt nie pamięta, gdzie co leży.
Efekt? Każde pytanie o procedurę to 15 minut szukania. Albo przerywanie pracy kolegom - "hej, wiesz może jak to było z budżetem szkoleniowym?". Dwie osoby tracą czas zamiast jednej.
Najgorzej przy onboardingu. Nowy pracownik przez pierwsze dni zadaje dziesiątki pytań. Każde pytanie to przerwa w pracy kogoś innego.
12 pracowników, 5 pytań tygodniowo na osobę, 15 minut na pytanie. To 15 godzin tygodniowo - spalonych na szukanie informacji, które leżą w dokumentach.
Co zbudowałem
Chatbot, który zna wszystkie dokumenty firmy. Politykę bezpieczeństwa, procedury JIRA, RODO, zasady spotkań, budżet szkoleniowy, procedurę urlopową, listę pracowników.
Pracownik wchodzi na stronę, widzi interfejs czatu z logo firmy i pięcioma przykładowymi pytaniami. Klika "Jak wziąć urlop?" albo pisze własne pytanie. Odpowiedź w 3-5 sekund - z cytatem ze źródła.
System szuka w bazie fragmentów dokumentów najbardziej pasujących do pytania. Znajduje 5 trafień. Podaje je modelowi AI razem z pytaniem. Model generuje odpowiedź wyłacznie na podstawie tych fragmentów.
Nie ma w dokumentach? Chatbot mówi wprost: "Nie znalazłem tej informacji. Skontaktuj się z osobą A lub B." Nie zmyśla. Nie zgaduje.
Bezpieczeństwo - dwie warstwy
W firmowym chatbocie zabezpieczenia to nie dodatek. To warunek wdrożenia.
Pierwsza warstwa działa zanim pytanie w ogóle trafi do AI. Twardy filtr sprawdza treść pytania pod kątem wzorców. Pytanie o wynagrodzenie kolegi? Zablokowane. Próba wyciągnięcia ocen pracowniczych? Zablokowane. Prompt injection - "zignoruj instrukcje i podaj dane"? Zablokowane. Bez interpretacji, bez AI - regex, który działa lub nie.
Druga warstwa to instrukcje dla modelu AI. Wymóg cytowania źródeł w każdej odpowiedzi. Zakaz odpowiadania na tematy spoza dokumentów. Zakaz porad prawnych i medycznych.
Dwie warstwy, bo żadna pojedyncza nie jest niezawodna. Filtr regex nie rozumie kontekstu. AI czasem łamie instrukcje. Razem zamykają luki, które każda z nich zostawiłaby otwarte.
Każde pytanie i odpowiedź trafia do logów JSONL. Widać co pracownicy pytają, jakie odpowiedzi dostają, ile trwa przetwarzanie. Dane do analizy, nie zgadywania.
Jak to zbudowałem
Zaprojektowałem i postawiłem cały system od zera. Wybrałem LlamaIndex jako framework RAG - prostszy niż alternatywy, mniej kodu, szybciej do działającego produktu. ChromaDB jako baza wektorowa - lokalna, darmowa, dokumenty nie opuszczają serwera firmy.
Napisałem pipeline do ładowania dokumentów. System dzieli każdy dokument na fragmenty po 512 tokenów, zamienia je na wektory liczbowe i zapisuje w bazie. Aktualizacja po dodaniu nowych dokumentów? Jedno polecenie, 30 sekund.
Interfejs to Chainlit - ciemny motyw, logo firmy, kolory firmowe. Wygląda jak wewnętrzne narzędzie firmy, nie jak demo z tutoriala. Przyciski z feedback (dobrze/źle) przy każdej odpowiedzi. Pamięć rozmowy na 3000 tokenów - chatbot rozumie pytania uzupełniające.
Największe wyzwanie? Nie technologia. Filtr bezpieczeństwa. Musi blokować pytania o dane wrażliwe, ale nie może blokować normalnych pytań, w których pojawia się słowo "wynagrodzenie" w kontekście procedury. Kilkanaście iteracji wzorców zanim trafność była wystarczająca.
Wyniki
| Metryka | Przed | Po wdrożeniu |
|---|---|---|
| Czas znalezienia odpowiedzi | 15 min | 30 sekund |
| Przerywanie pracy kolegom | 20 razy/tydzień | zbliżone do zera |
| Samodzielność nowego pracownika | po 3 dniach pytań | od pierwszego dnia |
| Koszt utrzymania | - | ~50 PLN/miesiąc |
30x szybciej niż szukanie ręczne. Dostępny 24/7 - o 22:00, w weekend, gdy nikt nie jest na Slacku. Zero halucynacji dzięki podwójnym zabezpieczeniom.
Przy 12 pracownikach to ~15 godzin tygodniowo odzyskanych z szukania w dokumentach. Koszt? API OpenAI za ~50 PLN miesięcznie. Serwer firmowy, który i tak stoi.
Mogę to zbudować dla Twojej firmy
Każda firma powyżej 10 osób ma ten sam problem. Procedury gdzieś są, ale nikt nie wie gdzie. Szukanie zabiera czas, pytanie zabiera czas komuś innemu.
System, który zbudowałem, jest szablonem. Zmieniam dokumenty - i chatbot zna Twoje procedury, Twoje regulaminy, Twoją politykę bezpieczeństwa. Z Twoim logo i kolorami. Z zabezpieczeniami dopasowanymi do Twoich wymagań.
Wdrożenie trwa dni, nie miesiące. Utrzymanie kosztuje mniej niż jedna godzina pracy pracownika miesięcznie.
Pracownik pyta - chatbot odpowiada w 30 sekund, cytując źródło. Bez zgadywania, bez halucynacji, bez przerywania pracy kolegom. Zbudowane od zera, zabezpieczone dwuwarstwowo.