RAG (Retrieval-Augmented Generation) jako koncepcja jest prosta: zamiast model odpowiada tylko z wiedzy treningowej, model dostaje kontekst z zewnętrznych dokumentów. W środowisku enterprise ta prosta koncepcja trafia na złożoność jakiej nie ma przy budowaniu chatbota na własnej stronie.
Dane są poufne. Różni pracownicy mają dostęp do różnych dokumentów. Ten sam agent obsługuje tysiące użytkowników jednocześnie. Dokumenty są w dziesiątkach formatów i systemów. Prawo wymaga audytu co agent powiedział i na jakiej podstawie.
Enterprise RAG to RAG zbudowany na tę złożoność.
Czym jest Enterprise RAG
Enterprise RAG to implementacja Retrieval-Augmented Generation dostosowana do wymagań środowiska korporacyjnego — z kontrolą dostępu na poziomie dokumentu (agent widzi tylko dokumenty do których użytkownik ma uprawnienia), obsługą wielu formatów i źródeł (SharePoint, Confluence, SAP, Salesforce, email), audytem retrieval (co agent pobrał jako kontekst dla danej odpowiedzi) i skalą (tysiące zapytań jednocześnie bez degradacji jakości).
Kluczowa różnica: permission-aware retrieval
W standardowym RAG — wszystkie dokumenty są dostępne dla wszystkich. W enterprise — pracownik działu HR nie powinien mieć dostępu przez agenta do dokumentów finansowych, do których nie ma dostępu bezpośrednio.
Permission-aware retrieval oznacza że każde zapytanie do vector database jest filtrowane przez uprawnienia użytkownika — agent pobiera tylko dokumenty do których ten konkretny użytkownik ma dostęp w systemie źródłowym (SharePoint, Confluence, itp.). To wymaga synchronizacji uprawnień między systemem źródłowym a bazą wektorową — co jest nietrywialnym problemem inżynierskim.
Azure AI Search i Microsoft Graph obsługują permission-aware retrieval natywnie dla ekosystemu Microsoft — agent nie widzi dokumentów do których użytkownik nie ma dostępu w SharePoint.
Multi-source retrieval
Enterprise wiedza jest rozproszona: SharePoint, Confluence, Jira, Salesforce, SAP, maile, tickety helpdesk. Enterprise RAG musi agregować retrieval z wielu źródeł jednocześnie, de-duplikować wyniki i rankować według relevancji.
Każde źródło ma własne API i format danych. Każde wymaga osobnego konektora. Każde ma własne uprawnienia do synchronizacji. Integracja jest złożona — ale firmy które ją przeprowadzają zyskują agenta który „wie” o firmie to co jest w jej systemach.
Audit i compliance
Dla regulowanych branż: agent który udziela porady musi być audytowalny. Co zapytał użytkownik? Jakie dokumenty agent pobrał jako kontekst? Jaką odpowiedź wygenerował? Kiedy? Kto pytał?
Azure AI Foundry dostarcza logging każdego kroku retrieval. To jest wymóg compliance dla firm w branżach regulowanych — bank który używa agenta do udzielania porad kredytowych musi być w stanie odtworzyć każdą rozmowę i każdy retrieval.