Dit hebben we geleerd van het ontwikkelen van onze eigen AI applicatie HemingwayGPT

Jan-Maarten Schot
September
Published in
7 min readMar 23, 2023

Een nieuwe technologie is altijd een fijn speelveld. Het brengt je terug naar momenten dat je voor het eerste iets nieuws in handen had waarvan je wel weet hoe het ongeveer werkt, maar door ermee te spelen pas écht ervaarde hoe het in elkaar steekt.

Denk bijvoorbeeld eens terug aan de keer dat je voor het eerste een Nintendo controller in je handen had, het leren programmeren van spelletjes op je Texas Instruments rekenmachine of het ontdekken van alle features op je vers uitgepakte soundbar.

Er zit iets magisch in nieuwe technologie ontdekken.

Foto door Lander Denys op Unsplash.

Tegelijkertijd is het belangrijk om kritisch te blijven

Ondanks alle enthousiasme is het tegelijkertijd belangrijk om kritisch te blijven kijken naar nieuwe ontwikkelingen. Want hoe lekker het ook glimt, het is altijd verstandig — zeker vanuit onze rol als digital agency — om óók met een scheut realisme naar nieuwe techniek te kijken. Is het wel écht zo waanzinnig goed? En waar loopt het spaak? En waar gaat het ons leven echt beter of makkelijker maken?

Gartner (een bekend onderzoeks- en adviesbureau) gebruikt voor nieuwe technologie de Hype Cycle. Het laat zien waar de adoptie van nieuwe technologie grofweg is binnen de assen van zichtbaarheid en tijd. Wat daarin opvalt, is dat we vaak reuze enthousiast zijn over technologie (en er veel tijd en aandacht aan besteden) voordat er praktische implementaties zijn waar de echte waarde naar voren komt. Denk aan NFT’s of AR/VR — er wordt meer over gesproken dan praktisch toegepast. En dat is helemaal okee.

Want na het dal van realisme (of de Trough of Disillusionment) volgen hopelijk de praktische toepassingen waaruit blijkt dat al het enthousiasme niet voor niets was. Of de technologie verdwijnt langzaam uit beeld. Mogelijk omdat het niet te vermarkten is naar logische toepassingen, of omdat het simpelweg te vroeg in de tijd ontwikkeld is (👋 hopelijk tot ooit, Metaverse).

Zo zou je kunnen zeggen dat het succes van een technologie kan blijken uit hoe lang het blijft hangen in bijvoorbeeld de dip.

Gartner Hype Cycle.

De verborgen valkuil van ChatGPT en text-based AI toepassingen

ChatGPT (of eigenlijk, AI) lijkt wel de hype cycle als ware achtbaan te gebruiken. Sommige mensen-die-er-iets-over-mogen-zeggen, zoals Bill Gates, vergelijken AI met de opkomst van smartphones. GPT-3.5 (de motor waarop ChatGPT is doorontwikkeld, onlangs ging GPT-4 live) was al ruim eerder ontwikkeld, en ChatGPT geeft de technologie vleugels met een gemakkelijke interface om snel in populariteit te winnen.

Veel praktische toepassingen zien het levenslicht. In Notion schrijf je met AI je notities in turbovaart uit, Microsoft integreert GPT in Office, Salesforce heeft een integratie om je data vlot te analyseren en we hebben zelfs een Carnaval hitjesmaker voorbij zien komen op basis van GPT.

Hoe blijf je kritisch op toepassingen met AI?

Bij September ontwikkelden we HemingwayGPT. De AI versie van Ernest Hemingway die marketeers helpt om digitaal het juiste verhaal te vertellen. Op basis van een aantal simpele ingrediënten wordt de copy geschreven, voorzien van de juiste tone of voice. We gebruikten onze eigen ervaring met meer dan 100 websites om de beste output te genereren.

Los van hoe wij als team natuurlijk veel bezig zijn met en lezen over dit soort nieuwe technologie — als vakidioten én professionals — is deze praktische toepassing als tool voor ons heel inzichtelijk geweest. We nemen je mee in drie hele praktische inzichten.

1. De uitkomst is vaak generiek, met ingebouwde willekeur voor ‘menselijkheid’.

AI is geen black box met een vleugje magie. Sterker nog, alles wat uit ChatGPT komt wordt gemaakt op basis van wat erin is gestopt. Er wordt gebruik gemaakt van een taalmodel getraind met een dataset (of eigenlijk: een supervised & reinforced fine-tuned LLM 🤯) van een niet-te-behappen formaat met een verbluffende rekensnelheid.

Stel je voor dat je een Excel zou hebben met álle data van de hele wereld. Stel je voor dat je een zwarte band hebt in het schrijven van zoekopdrachten om die Excel uit te pluizen. En stel je voor dat je de informatie die je terugkrijgt, zó weet te verpakken dat er een logisch antwoord staat. Magisch toch?

Toch is de output niet echt uniek. ChatGPT produceert output op basis van kansberekeningen letterlijk per opvolgend karakter. Je kan ervan uitgaan dat de totale output, een remix of herschreven versie is van iets dat al bestaat. ChatGPT ‘denkt’ (gevaarlijk woord in deze context) niet zelf na, maar produceert op basis van bestaande voorbeelden.

Dat houdt in dat je niet snel een goede niet-eerder-vertelde woordgrap als uitkomst gaat krijgen. Of een tekst geschreven met gevoel en ritme wat nergens anders is te vinden. Of een combinatie van woordgebruik waar je kippenvel van krijgt, zó goed. Sterker nog: ChatGPT bouwt bewust een bepaalde willekeur in om te zorgen dat de output ‘menselijker’ kán voelen. En ook: stel ChatGPT maar eens een paar keer dezelfde vraag.

Dat is niet erg, maar zorgt er wel voor dat de teksten van ChatGPT een beetje… beige voelen. Er zit wel een kleurtje aan, maar echt heel bijzonder is ‘t niet. En hoe meer GPT gebruikt gaat worden, hoe meer het internet op elkaar gaan lijken. Goed om rekening mee te houden!

2. Weet op basis waarvan AI wordt getraind: dat is werk van anderen, én niet per se de waarheid.

Het feit dat ChatGPT put uit een bestaande bron, betekent niet dat je altijd de waarheid terug krijgt. Als ChatGPT maar vaak genoeg tegenkomt dat de wereld stiekem geleid wordt door reptielen is dat iets dat mogelijk een keer terug gaat komen. Het heeft geen voorkeur. Het heeft geen mening. En het heeft geen smaak.

De uitkomst is gebaseerd op teksten (uit de trainingsdata) die het meest vaak gevonden wordt óf als beste is geclassificeerd in het leertraject.

Wees je daarom bewust van het feit dat de terugkoppeling van tekst niet per sé waarheidsgetrouw hoeft te zijn. En sta erbij stil dat de huidige vorm van GPT getraind is op een dataset die gaat tot 2021 (de cutoff date).

Ook goed om je te beseffen is het op het werk van anderen gedeelte. Daarover is nog eigenlijk helemaal geen jurisprudentie beschikbaar: we staan aan het begin van de discussie rondom intellectueel eigendom. Wat ons betreft blijf je daar vooral zelf goed nadenken voorlopig.

3. Ga niet te hard mee in de hype.

Kijk, wij hebben er ook veel mee gespeeld. We hebben spreadsheets aangevuld met wanneer we welke groenten konden zaaien. Of dummy data aangemaakt. Gevraagd naar de 10 beste blogpost-titels zodat September in de hele wereld bekend kon worden.

Maar alle nieuwe mogelijkheden zijn nog niet per se een reden om van elke zoekbalk een AI-powered variant te maken. Of bij elke klantenservice een ‘chatbot’ te introduceren om zodoende echt menselijk contact nog verder weg te halen.

Als we eerlijk zijn: ergens vinden we het ook wel spannend dat OpenAI, ooit opgericht om de ethiek en richtlijnen achter AI te ontdekken en openbaar te delen, deze ambitie iets achtergelaten lijkt te hebben om tóch maar zo snel mogelijk commerciële toepassingen te vinden. En daarmee ook het eerdere open source karakter verlaat voor minder transparantie communicatie over de inzet van de technologie.

Hoe gebruik je de data vanuit AI wél goed?

Natuurlijk hebben we een paar kanttekeningen bij nieuwe technologie. Maar we zijn nog wel fan — gelukkig maar. Zéker wanneer je het for good kan gebruiken. Waar onze programmeurs nu al de eerste hints hebben gekregen van een persoonlijke hulp bij programmeren (GitHubs Copilot, nog niet zonder fouten overigens), kan je je alleen maar voorstellen hoe het straks is als bijvoorbeeld medisch professionals of leraren deze hulp krijgen. We houden echter de inzet voorlopig goed in te gaten: zeker als het gaat van ‘wow vet handig’ naar ‘we laten een AI de beste sollicitant kiezen’.

De tips die we nu willen meegeven: experimenteer met AI, maar blijf altijd kritisch op de uitkomst en controleer goed wat er wordt geschreven. We gaan in de toekomst veel teksten tegenkomen die klakkeloos zijn gekopieerd en er ook als dusdanig uitzien: zorg ervoor dat jij niet degene bent die dat doet. Gebruik de output altijd als eerste input. De wonderen uit dit soort middelen zijn eerder een uitgangspunt of vertrekpunt dan een definitieve versie.

En zorg ervoor dat je goed wordt in het schrijven van prompts. Want hoe beter de input, hoe sterker de output.

Hoe wij het verder gaan inzetten bij September? We blijven experimenteren met AI en passen het intern al toe waar mogelijk. Zo gebruiken we AI als startpunt voor creatieve brainstorms of wanneer we heel erg veel repetitief werk moeten doen, en ontdekken we hoe we pitches kunnen verhelderen met Midjourney visuals. Het zijn in ieder geval spannende én boeiende tijden!

Bij het schrijven van dit artikel is geen enkele vorm van AI gebruikt 🤖

Wil je je verder verdiepen?

--

--