Wat is een Retrieval Augmented Generation (RAG)?

Published in

Brthrs Agency

4 min readApr 20, 2024

Retrieval augmented generation (RAG) is een techniek in natuurlijke taalverwerking (NLP) die de krachten van opvragingsgebaseerde en generatieve kunstmatige intelligentie (AI) modellen combineert. RAG AI kan nauwkeurige resultaten leveren die optimaal gebruik maken van bestaande kennis en kan deze kennis ook verwerken en consolideren om unieke, contextbewuste antwoorden, instructies of uitleg in menselijke taal te creëren, in plaats van enkel de opgehaalde gegevens samen te vatten. RAG AI verschilt van generatieve AI doordat het een superset is van generatieve AI, waarbij het de sterke punten van zowel generatieve als opvragings-AI combineert. RAG onderscheidt zich ook van cognitieve AI, die de werking van het menselijk brein nabootst om resultaten te verkrijgen.

Hoe werkt retrieval augmented generation (RAG)?

RAG integreert opvragingsgebaseerde technieken met generatieve AI-modellen. Opvragingsgebaseerde modellen zijn uitstekend in het extraheren van informatie uit bestaande online bronnen zoals krantenartikelen, databases, blogs en andere kennisrepositories zoals Wikipedia of zelfs interne databases. Echter, deze modellen kunnen geen originele of unieke reacties produceren. Daarentegen kunnen generatieve modellen originele reacties genereren die passend zijn binnen de context van de gestelde vraag, maar het kan moeilijk zijn om strikte nauwkeurigheid te handhaven. Om deze relatieve zwaktes in bestaande modellen te overwinnen, werd RAG ontwikkeld om hun respectieve sterke punten te combineren en hun nadelen te minimaliseren. In een RAG-gebaseerd AI-systeem wordt een opvragingsmodel gebruikt om relevante informatie uit bestaande bronnen te vinden, terwijl het generatieve model de opgehaalde informatie neemt, alle gegevens synthetiseert, en deze vormt tot een samenhangende en contextueel passende reactie.

Wat zijn de voordelen van retrieval augmented generation?

Door opvragings- en generatieve AI-modellen te integreren, levert RAG reacties die nauwkeuriger, relevanter en origineler zijn, terwijl ze ook klinken alsof ze door mensen zijn gegeven. Dit komt omdat RAG-modellen de context van vragen kunnen begrijpen en verse, unieke antwoorden kunnen genereren door het beste van beide modellen te combineren. RAG-modellen zijn:

Nauwkeuriger — Door eerst een opvragingsmodel te gebruiken om relevante informatie uit bestaande kennisbronnen te identificeren, zijn de vervolgens gegenereerde menselijke reacties gebaseerd op meer relevante en actuele informatie dan een puur generatief model.
Beter in het synthetiseren van informatie — Door opvragings- en generatieve modellen te combineren, kan RAG informatie uit talrijke bronnen synthetiseren en verse reacties genereren op een menselijke manier. Dit is bijzonder nuttig voor complexere vragen die integratie van informatie uit meerdere bronnen vereisen.
Vaardig in het plaatsen van informatie in context — In tegenstelling tot eenvoudige opvragingsmodellen, kan RAG reacties genereren die zich bewust zijn van de context van een gesprek, en zijn daardoor relevanter.
Gemakkelijker te trainen — Het trainen van een NLP-gebaseerd groot taalmodel (LLM) om een generatief AI-model te bouwen vereist een enorme hoeveelheid data. Daarentegen gebruiken RAG-modellen bestaande en vooraf opgehaalde kennisbronnen, wat de noodzaak vermindert om enorme hoeveelheden trainingsdata te vinden en te verwerken.
Efficiënter — RAG-modellen kunnen efficiënter zijn dan grootschalige generatieve modellen, aangezien de initiële opvragingsfase de context verkleint en dus het volume aan gegevens dat verwerkt moet worden in de generatiefase beperkt.

Hoe wordt retrieval augmented generation vandaag gebruikt?

Hier zijn enkele voorbeelden van hoe RAG-modellen vandaag worden gebruikt:

Verbetering van klantenondersteuning — RAG kan worden gebruikt om geavanceerde chatbots of virtuele assistenten te bouwen die nauwkeurigere en persoonlijkere antwoorden geven op klantvragen. Dit kan leiden tot snellere reacties, verhoogde operationele efficiëntie en uiteindelijk grotere klanttevredenheid met ondersteuningservaringen.
Contentgeneratie — RAG kan bedrijven helpen bij het produceren van blogposts, artikelen, productcatalogi of andere content door zijn generatieve capaciteiten te combineren met het ophalen van informatie uit betrouwbare bronnen, zowel extern als intern.
Marktonderzoek — Door inzichten te verzamelen uit de enorme hoeveelheden data beschikbaar op het internet, zoals nieuwsberichten, onderzoeksrapporten van de industrie, zelfs sociale mediaposts, kan RAG bedrijven op de hoogte houden van markttrends en zelfs de activiteiten van concurrenten analyseren, wat bedrijven helpt betere beslissingen te nemen. Ondersteuning van verkoop — RAG kan dienen als een virtuele verkoopassistent, antwoorden op vragen van klanten over items in voorraad, productspecificaties ophalen, bedieningsinstructies uitleggen en over het algemeen assisteren in de aankoopcyclus. Door zijn generatieve mogelijkheden te combineren met productcatalogi, prijsinformatie en andere gegevens — zelfs klantbeoordelingen op sociale media — kan RAG gepersonaliseerde aanbevelingen bieden, zorgen van klanten aanpakken en winkelervaringen verbeteren.
Verbetering van de ervaring van medewerkers — RAG kan medewerkers helpen bij het creëren en delen van een gecentraliseerde repository van expertkennis. Door integratie met interne databases en documenten, kan RAG medewerkers nauwkeurige antwoorden geven op vragen over bedrijfsvoering, voordelen, processen, cultuur, organisatiestructuur en meer. Cohesity en AI Cohesity staat voorop in het aanbrekende tijdperk van AI omdat het Cohesity-platform ‘AI Ready’ is voor RAG-gebaseerde grote taalmodellen (LLM). De baanbrekende aanpak van Cohesity biedt robuuste en domeinspecifieke context aan RAG-gedreven AI-systemen door gebruik te maken van het robuuste bestandssysteem van de gepatenteerde SnapTree- en SpanFS-architecturen van Cohesity. Om dit te bereiken, zal een on-demand index van inbeddingen op tijd worden verstrekt aan de AI-toepassing die de gegevens aanvraagt. Daarnaast worden de gegevens beveiligd door Cohesity’s rolgebaseerde toegangscontrolemodellen (RBAC).

Bij Brthrs Agency zetten we ons in voor de ontwikkeling van geavanceerde technologieën zoals retrieval augmented generation (RAG) en ons eigen platform “Talk With Your Data” (TWYD). Dankzij onze diepgaande kennis van RAG zijn we in staat om geavanceerde, contextbewuste AI-systemen te ontwikkelen die nauw aansluiten bij de specifieke behoeften van onze klanten.

Daarnaast hebben we TWYD ontwikkeld, een baanbrekend AI-chatplatform dat organisaties de mogelijkheid biedt om op een veilige en privacygerichte manier met hun gegevens om te gaan. Dit platform integreert soepel met verschillende AI-taalmodellen en biedt een vertrouwde, beveiligde omgeving voor het maken van doeltreffende data-gestuurde beslissingen.

Bij Brthrs Agency streven we voortdurend naar innovatie om de meest effectieve en relevante technologische oplossingen te leveren, gericht op het verbeteren van de interactie tussen mensen en data.

Wat is een Retrieval Augmented Generation (RAG)?

Hoe werkt retrieval augmented generation (RAG)?

Wat zijn de voordelen van retrieval augmented generation?

Hoe wordt retrieval augmented generation vandaag gebruikt?

Written by Robert Keus