Skrattar, chattar, sjunger, GPT-4o är AI nära människan, men se upp: det är verkligen inte mänskligt | Chris Stokel-Walker
AArtificiell intelligens förändrar saker i svindlande hastighet. För cirka 18 månader sedan släppte teknikföretaget OpenAI sin AI-chatbot, ChatGPT. Inom ett par månader, 100 miljoner användare använde verktyget regelbundet, vilket gör det till den snabbast växande konsumentappen i historien. Även om tekniska bubblor alltid är lätta att glida in i, hävdar många att världen kan delas upp i en värld före och efter ChatGPT.
Det intresset var inte ett svep. Den här veckan tillkännagav webbtrafikanalytikerna Similarweb ChatGPT:s webbplatsträff nya rekordnivåer av intresse, med 83,5 miljoner besök på en enda dag i maj. Premissen och titeln på min bok släpptes förra veckan, Hur AI åt världen, verkar vara sant. AI är nu i princip ofrånkomlig.
Ändå turnerar jag runt i landet för att prata om det, jag möter fortfarande hållouts; människor som inte vill vara en del av AI-revolutionen, eller som ännu inte har sett behovet av att interagera med en textbaserad chatbot. Ett besked på måndag av OpenAI av en ny modell inom tekniknyheter, GPT-4o, kan ändra på det.
För den tekniskt sinnade är GPT-4o en betydande förändring. Men för allmänheten är den viktiga skillnaden hur lätt det är att interagera med. Före GPT-4o, det primära sättet att interagera med ChatGPT var att skriva textbaserade frågor och vänta på textbaserade svar. Ett röstgränssnitt var tillgängligt, men det var klumpigt och långsamt. Jag har under de senaste månaderna försökt få ChatGPT att hjälpa mig att lära mig tyska – för att bättre interagera med min partners österrikiska familj – men de plågsamma förseningarna mellan att jag ställer frågor och att ChatGPT formulerar ett svar och sedan syntetiskt vokaliserar tyska ord, ofta på obegripliga och amerikansk engelska utan accentuering, gjorde det nästan värdelöst.
De tekniska demos som visades av OpenAI tidigare i veckan ändrar det. I en del av lanseringseventet agerade ChatGPT som en realtidstolk för ett samtal mellan engelska och italienska. I en annan, det skrattade som svar på ett “pappaskämt på toppnivå”. Och i ett annat bytte det från att läsa en godnattsaga utan att läsa till en dramatisk läsning som även Brian Blessed skulle blanchera på, innan han avslutade med en låt.
Enligt OpenAI, detta är det nya normala: en AI-modell som kan “resonera över ljud, bild och text i realtid”. Det verkar vid första anblicken vara ytterligare ett viktigt steg mot att förvandla science fiction till science fact. Den alltid hjälpsamma, alltid på, människoliknande robotbutlern som vi har sett och läst om i decennier närmar sig, föreslår OpenAI. Och den imponerande smidigheten i interaktionen kan skjuta några tjatande hållouts mot att bli AI-användare. Att göra det gratis, som OpenAI har gjort, kommer också att hjälpa.
Men det är värt att komma ihåg AI:s arvsynd, med anor från 1956: dess namngivning. “Artificiell intelligens” är förvisso artificiell, men den är ännu inte intelligent – och kommer förmodligen aldrig att bli det. Ju mer som ChatGPT och andra verktyg som det härmar mänsklig interaktion, och lär sig att agera som kvicka, kloka racontörer som kan gnälla och svimma, desto mer sannolikt är det att vi glömmer den “konstgjorda” biten av termen.
Den smidiga interaktiviteten som OpenAI har ansträngt sig hårt för att göra det bra att papper över sprickorna i den underliggande tekniken. När ChatGPT först armbågade sig högljutt in i våra liv i november 2022, påpekade de som hade följt tekniken i decennier att AI i sin nuvarande form inte var mer än snygg mönstermatchningsteknik – men de dränktes av de upphetsade massorna . Nästa steg mot mänsklig interaktion kommer bara att förstärka larmet.
Det är goda nyheter för OpenAI, som redan är ett företag värderas till mer än 80 miljarder dollar, och med investeringar från sådana som Microsoft. Dess VD, Sam Altman, twittrade förra veckan att GPT-4o “känns som magi för mig”. Det är också goda nyheter för andra i AI-utrymmet, som drar nytta av teknikens överflöd och lägger in den i alla aspekter av våra liv. Microsoft Word och PowerPoint kommer nu med generativa AI-verktyg infällda i dem. Meta, moderbolaget till Facebook och Instagram, är sätta sin AI chatbot-assistent i sina appar i många länder, till vissa användares förtret.
Men det är mindre bra för vanliga användare. Mindre friktion mellan att be ett AI-system att göra något och att det faktiskt slutför uppgiften är bra för användarvänligheten, men det hjälper oss också att glömma att vi inte interagerar med kännande varelser. Vi måste komma ihåg det, eftersom AI inte är ofelbar; det följer med fördomar och miljöfrågor, och speglar tillverkarnas intressen. Dessa angelägna frågor utforskas i min bok, och experterna jag pratade med berättar att de representerar betydande oro för framtiden.
Så prova ChatGPT med alla medel och lek med röst- och videointeraktioner. Men tänk på dess begränsningar och att den här saken inte är intelligent, men den är verkligen konstgjord, oavsett hur mycket den låtsas inte vara det.