
Tijdens de zomer nodigen we u uit om artikelen te vinden die dit jaar op de site zijn verspreid. Vandaag een artikel oorspronkelijk gepubliceerd op 16/01/2023.
La release van ChatGPT op 30 november markeerde een nieuwe fase in de ontwikkeling van taalverwerkingstechnologieën. Het is in ieder geval voor het eerst dat een AI-systeem, rechtstreeks voortgekomen uit onderzoek, zoveel enthousiasme opwekt: er zijn tal van artikelen verschenen in de gespecialiseerde maar ook algemene pers. ChatGPT (of OpenAI, het bedrijf dat ChatGPT ontwikkelt, of beide) zijn zelfs vandaag nog steeds trending op Twitter.
Waarom zo'n echo? Zijn de mogelijkheden van ChatGPT een afwijking van eerdere technologieën die tekst kunnen genereren?
ChatGPT kan chatten
Het is duidelijk dat ChatGPT een kwalitatieve sprong heeft gemaakt: het is in staat om op een vaak relevante manier bijna elk verzoek in natuurlijke taal te beantwoorden. GPT2, daarna GPT3 – de eerdere taalmodellen ontwikkeld door OpenAI – waren al erg goed in het genereren van tekst uit een paar woorden of zinsdelen die als prompts werden gegeven (wat "prompt" wordt genoemd): we spraken vaak over "papegaaien" (stochastische papegaaien), Zoals voorgesteld Emily Benders, en vele anderen onderzoekers critici van deze technieken. Je zou inderdaad kunnen zeggen dat deze systemen tekst produceerden uit stukjes van zinnen die waren ontleend aan de immense corpora die tot hun beschikking stonden ... zelfs als dit beeld van de papegaai moet worden gekwalificeerd: de systemen herhalen fragmenten niet woord voor woord, maar produceren in het algemeen een originele tekst door elementen uit verschillende corpora op te nemen, te parafraseren en te combineren.
ChatGPT neemt deze kenmerken over, maar het "chat"-gedeelte (dialoog) voegt er een heel andere dimensie aan toe, en vaak ogenschijnlijk verbluffend.
Het systeem produceert niet langer slechts een alinea uit een zin die als invoer wordt opgegeven. Hij kan nu zowel eenvoudige als complexe vragen correct beantwoorden, hij kan onder meer redeneerelementen aandragen, verschillende talen spreken, computercode analyseren of produceren.
Als bijvoorbeeld wordt gevraagd of twee karakters elkaar hebben kunnen ontmoeten, kan het systeem de datums bepalen die overeenkomen met hun bestaan, vergelijk deze data en leid een antwoord af. Dit is triviaal voor een mens, maar geen enkel systeem tot nu toe kon dit soort vragen zo nauwkeurig beantwoorden zonder zeer gespecialiseerd te zijn. Naast de taal kan ChatGPT ook bieden elementen van wiskundig redeneren (maar hij heeft het vaak mis) En computercode analyseren in het bijzonder.
Vanuit dit oogpunt is ChatGPT zijn concurrenten een stap voor.
ChatGPT, een gesloten systeem
Over de werking van het systeem valt moeilijk meer te zeggen, omdat OpenAI ondanks zijn naam gesloten systemen ontwikkelt. Dat wil zeggen, de gebruikte computercode (broncode) is niet beschikbaar en het onderzoek met betrekking tot ChatGPT blijft voorlopig grotendeels een handelsgeheim – ook al is het duidelijk dat vanandere ploegen zijn aan het werk vergelijkbare systemen, ook gebaseerd op diep leren. We hebben dus een idee van wat OpenAI gebruikt.
Andere bedrijven hebben een meer open model gehouden, bijvoorbeeld Meta met de werkzaamheden op FAIR, meestal open en gepubliceerd op grote conferenties in het veld. Maar meer in het algemeen zien we steeds vaker dat onderzoek wordt afgesloten. Terwijl Apple bijvoorbeeld altijd al een ontwikkelmodel heeft gehad privé en zeer geheim, Deepmind had een open model en is dat waarschijnlijk iets minder, nu het bedrijf onder controle staat van Google.
Het ChatGPT-systeem zelf zou commercieel kunnen worden: OpenAI wordt gefinancierd door Microsoft die op een dag zou kunnen besluiten om de toegang tot het systeem af te sluiten, als het in zijn belang is.
Door ChatGPT te testen, draag je (gratis) bij om het te verbeteren
Ondertussen profiteert OpenAI van de enorme publiciteit die zijn tool met zich meebrengt, en ook van alle gebruikersinteracties ermee. Als een gebruiker meldt dat een antwoord niet goed is, of de tool vraagt zijn antwoord te herformuleren rekening houdend met een extra element, is dit zoveel informatie als het systeem opslaat en kan hergebruiken om het antwoord de volgende keer te verfijnen, op het gevraagde verzoek of op een soortgelijk verzoek. Door ChatGPT te testen, wij werken gratis voor OpenAI !
Om terug te komen op het systeem zelf, het dialooggedeelte is daarom wat de kracht en bijzonderheid van ChatGPT maakt (vergeleken met bijvoorbeeld GPT3). Het is niet langer een "eenvoudig" taalmodel dat tekst "per kilometer" kan genereren, maar een echt dialoogsysteem. Deze heeft waarschijnlijk geprofiteerd van miljoenen of miljarden voorbeelden beoordeeld door mensen, en de huidige fase – waarin honderdduizenden gebruikers bijna gratis met het systeem “spelen” – maakt het nog steeds mogelijk om het systeem continu te verbeteren, aangezien alle interacties uiteraard worden geregistreerd en hiervoor worden gebruikt.
Het is nu vrij eenvoudig om toegang te krijgen tot corpora van miljarden woorden om een taalmodel van het type "GPT" te ontwikkelen, althans voor talen die wijdverspreid zijn op internet.
Maar de gegevens die de ontwikkeling van ChatGPT mogelijk maakten (dialogen, interacties met mensen) zijn niet openbaar, en dit geeft OpenAI een aanzienlijk voordeel ten opzichte van de concurrentie.
Google heeft bijvoorbeeld andere data, maar ongetwijfeld ook bruikbaar voor dit type systeem - vooral omdat Google al enkele jaren bezig is met het ontwikkelen van een kennis grafiek wat antwoorden zou kunnen genereren met een betere betrouwbaarheid dan ChatGPT. Met name de analyse van de reeksen zoekopdrachten van de zoekmachine van Google zou waardevolle informatie kunnen opleveren om de interactie met de gebruiker te begeleiden... Maar in de tussentijd is het OpenAI die ChatGPT heeft, en niet Google: OpenAi heeft het voordeel.
Naast ChatGPT, welke toepassingen in de toekomst?
In feite, hoewel het mogelijk is ChatGPT-limieten omzeilen, weigert het systeem uit te leggen hoe een bom moet worden gemaakt, erotische verhalen te produceren of haar gevoelens te geven (ChatGPT antwoordt vaak dat ze een machine is, datze heeft geen gevoelens of persoonlijkheid). OpenAI heeft uiteraard voor zijn communicatie gezorgd. Het bedrijf heeft ook uiterste zorg besteed aan het "bewapenen" van het systeem, zodat het de meeste valkuilen kan dwarsbomen die dit type applicatie in een paar uur kunnen ruïneren, zoals vaak gebeurt bij systemen die voor het grote publiek toegankelijk zijn.
We kunnen bijvoorbeeld Meta noemen, dat afgelopen november moest trekt zijn systeem genaamd "Galactica" twee dagen nadat het online is gezet. Galactica was opgeleid op wetenschappelijk gebied en ontworpen om diensten aan te bieden aan onderzoekers. Hij werd voor het eerst geïntroduceerd als in staat om automatisch wetenschappelijke artikelen te schrijven vanaf een prompt… voordat het bedrijf verduidelijkte dat het duidelijk slechts een redactioneel hulpmiddel was. Maar deze ongelukkige communicatiestrategie leidde tot een controverse die Meta dwong de Galactica snel los te koppelen.
Omgekeerd is ChatGPT nog steeds online, en wekt nog steeds evenveel passie op bij een groot publiek. Er blijven echter vragen: welke impact heeft ChatGPT? Welke toepassingen zullen ervan worden afgeleid? En naar welk economisch model streeft het OpenAI-bedrijf (en Microsoft, zijn belangrijkste investeerder)?
Thierry Poibeau, DR CNRS, École normale supérieure (ENS) - PSL
Dit artikel is opnieuw gepubliceerd vanaf The Conversation onder Creative Commons-licentie. Lees deorigineel artikel.