Chatbot hacken? Zo werkt het - DGF Techbrief #54

Elke maandag het laatste nieuws over Google, andere Big Tech bedrijven en de belangrijkste ontwikkelingen rondom technologie en AI.

Mar 11, 2024

Welkom bij de 54ste DGF Techbrief waarin je leest hoe AI chatbots zoals Gemini, ChatGPT, Claude en Le Chat heel gemakkelijk om de tuin geleid kunnen worden.

Een taalmodel zit vol zogeheten ‘guardrails’, regels die intreden wanneer een gebruiker prompts invoert met woorden waar de chatbot zich om diverse redenen niet aan wil wagen. Onderzoekers verbonden aan de Amerikaanse Cornell University hebben uitgezocht hoe bekende chatbots als ChatGPT, Gemini en Claude toch op artistieke wijze om de tuin geleid kunnen worden.

In het artikel ArtPrompt: ASCII Art-based Jailbreak Attacks against Aligned LLMs laten de onderzoekers zien hoe ze chatbots met behulp van zogeheten ASCII-Art-prompts ertoe kunnen aanzetten te reageren op vragen die ze op basis van hun guardrails moeten negeren. Het is een eenvoudige en effectieve hack. In het artikel staan voorbeelden van chatbots die adviseren over het bouwen van bommen en het maken van vals geld. Het is trouwens wel iets meer werk dan een online ASCII-artgenerator opzoeken en dan copy-pasten in het chatvenster.

GEVOELIG - InflectionAI heeft afgelopen week Inflection 2.5 gelanceerd, dit taalmodel stuurt de ‘gevoelige’ chatbot Pi aan. Nadat de focus van het bedrijf dat is opgericht door Mustafa Suleyman (eerder mede-oprichter van Google’s AI-divisie Deepmind) en Reid Hoffman (PayPal Mafia-lid en LinkedIn-oprichter) eerder vooral lag op AI met empathie, veiligheid en personalisatie wordt nu ook gefocust op prestaties; Pi 2.5 vertoont aanzienlijke verbeteringen en benadert OpenAI’s GPT-4. Wiskunde, redeneren en code schrijven. GPT-4 wint het allemaal nog steeds glansrijk, maar wel een stuk minder effectief. Voor dezelfde taken heeft Pi slechts 40% van de FLOPS (Floating Point Operations Per Second), oftewel een stuk minder rekenkracht nodig.

Bron: Alpha Signal AI

Inflection-2.5 heeft realtime toegang tot het internet en is beschikbaar via pi.ai, op iOS, Android en als desktop-app.

ZWAAR WEER - TikTok heeft het niet gemakkelijk in de VS nu steeds meer politici ertoe oproepen het gebruik van de Chinese social media app te verbieden. Het is niet de eerste keer dat deze geluiden klinken. Het afgelopen jaar hebben wetgevers in zowel de Verenigde Staten als Europa aangegeven dat de app grote veiligheidsrisico’s met betrekking tot privacy van de gebruikers met zich meedraagt. Moederbedrijf Bytedance zou gegevens delen met de Chinese overheid. Nederlandse politici gebruiken al een jaar geen TikTok meer op hun diensttelefoons. De VS willen nu dat Bytedance alle banden met China verbreekt.

Bovenop alle reuring stagneren de gebruikerscijfers serieus. Concurrent Instagram, eigendom van het Amerikaanse Meta, waartoe ook Facebook en Whatsapp behoren, heeft voor het eerst in tijden wereldwijd meer downloads geregistreerd dan TikTok, aldus de Financial Times. Ook de groei in het aantal actieve gebruikers vlakt af.

SPIONAGE - Op 5 maart werd voormalig Google-medewerker Linwei (of Leon) Ding gearresteerd in Newark, Californië. Dat blijkt uit een persbericht van het Amerikaanse ministerie van Justitie. Ding, die de Chinese nationaliteit bezit, wordt ervan beschuldigd meer dan 500 gevoelige bestanden met betrekking tot kunstmatige intelligentie te hebben gestolen om (mogelijk) te delen met Chinese bedrijven.

Volgens de aanklacht nam Ding in 2019 een baan bij Google en was hij betrokken bij de ontwikkeling van software voor supercomputerdatacenters. Zo kreeg hij toegang tot vertrouwelijke informatie, zoals de infrastructuur, maar ook AI-modellen. Van mei 2022 tot mei 2023 zou de ex-Googler geheime informatie van het Google-netwerk naar zijn privéaccount hebben overgebracht. Bij veroordeling riskeert Ding een gevangenisstraf van maximaal veertig jaar en een boete van maximaal $ 1 miljoen.

Mijn naam is Bob Hardus. Ik ben journalist en zoekmachine (SEO) specialist.

In het online doolhof zijn bedrijven allemaal op zoek naar de toverformule; bovenaan in Google, want dat staat gelijk aan kwaliteit, betrouwbaarheid en winstmaximalisatie. Maar hoe werkt de zoekmachine eigenlijk? En wat gebeurt er nu Google al zijn diensten en al onze gebruikersdata verbindt met de nieuwste AI?

📗 Antwoorden op die vragen krijg je in mijn boek De Google formule (2023). De derde druk ligt nu in de winkels.

🎙️ En in de BNR Podcast "De Technoloog" waar ik op 3 mei 2023 te gast was om te praten over de toekomst van "Search" met de komst van AI. Beluister hier.

📻 Naar aanleiding van Google’s 25ste verjaardag op 4 september 2023 was ik te gast in NPO Radio 1 programma Vroeg! om te praten over de macht van Big Tech. Terugluisteren kan hier.

Geïnteresseerd in een workshop, masterclass of samenwerking? Kijk hier.

De Google Formule Nieuwsbrief

Discussion about this post