Seuraava artikkeli auttaa sinua: Miksi GPT4 saattaa tuottaa sinulle pettymyksen
Hype voi olla vaarallinen asia. Liian paljon sitä voi tankata osakkeesi, tappaa tuotelanseerauksen tehokkaasti ja kääntää jännityksen päälaelleen. Generatiivisen tekoälyn ympärillä oleva jännitysaalto, jolla OpenAI ratsastaa, on käytännössä tullut johdatukseksi LLM:ihin suurimmalle osalle maailmaa. Ja käänsi kaikkien katseet Sam Altmanin OpenAI:hen.
Kun Altman ensimmäisen kerran vahvisti, että OpenAI itse asiassa rakensi vertailumallinsa GPT3:n seuraajaa, tekoälyyhteisö oli innoissaan. GPT3 oli huipputekninen kielimalli, jossa oli 175 miljardia parametria – sillä oli tuolloin kaikkien aikojen suurimman tekoälymallin ennätys. Ja sen julkaisusta vuonna 2020 lähtien GPT4:n ympärillä on spekuloitu. Voisiko se olla isompi, nopeampi, älykkäämpi? Saattaa olla vapaa vääristä vastauksista. Näytti siltä, että mikään täydellinen tuote ei voinut tyydyttää.
GPT-4:n julkaisu
Jopa eilisen ilmoituksen jälkeen Altman oli innokas myöntämään, kuinka täydellinen malli GPT4 ei ollut. “Se on edelleen puutteellinen, edelleen rajoitettu, ja se näyttää silti vaikuttavammalta ensimmäisellä käyttökerralla kuin sen jälkeen, kun sen kanssa vietät enemmän aikaa”, hän twiittasi ja sanoi “arvostamme todella palautetta sen puutteista” Twitter-seuraajilleen.
Samassa haastattelussa Altman myönsi, ettei hän ollut odottanut ChatGPT:n julkaisua seurannutta reaktiota. Ymmärrän, miksi DALL-E yllätti ihmiset, mutta olin todella ymmälläni siitä, miksi ChatGPT yllätti. Julkaisimme GPT-3:n melkein kolme vuotta sitten, laitoimme sen API:hen, ja päivityksen siitä ChatGPT:hen olisi pitänyt olla ennustettavissa, ja haluamme tehdä enemmän itsetutkiskelua siitä, miksi se kalibroitiin väärin”, hän lisäsi.
ChatGPT toimii GPT 3.5:llä. OpenAI oli ilmeisesti suunnitellut tämän mallin menevän hieman tutkan alle, koska sen piti olla GPT4:n edeltäjä. Koska ChatGPT laajensi mallia, keskimääräinen GPT4:ää käyttävä ihminen saattaa huomata, ettei se eroa kovinkaan paljon GPT 3.5:stä (ChatGPT).
Altman sanoi myös odottavansa vähemmän hypeä ja vähemmän käyttäjiä GPT4:lle kuin todellisuudessa oli, kun he valmistautuivat julkaisemaan ChatGPT:tä maailmalle. “Vähemmän hype on luultavasti parempi yleissääntönä. Yksi näiden teknologioiden kummallisista asioista on, että ne ovat vaikuttavia, mutta eivät kestäviä. Käytä niitä demossa, joka on mielestäsi hyvä, mutta käytä niitä pidemmällä aikavälillä ja näet heikkoudet. Mutta se tulee paranemaan”, hän sanoi.
Altman oli hyvin tietoinen siitä, kuinka erehtyviä LLM:t olivat todellisuudessa. Ne hallusinoivat paljon – samoin GPT4, mutta vähemmän kuin edeltäjänsä.
Ja OpenAI oli selvästi oppinut Googlen Bardin lanseerauksesta. Pyrkiessään edetmään kilpailussa Sundar Pichai ilmoitti kilpailevasta chatbotista, jonka odotettiin olevan parempi kuin ChatGPT. Valitettavasti, vaikka viesti oli älykkäämpi kuin OpenAI:n tuote (se olisi yhdistetty Internetiin), demo oli floppi. (Demovideo osoitti yhden Bardin hallusinoiduista reaktioista maailmalle)
Lisäksi OpenAI:lla oli jo iso joukko ihmisiä, mukaan lukien sijoittajat, media ja ChatGPT:tä käyttävät käyttäjät, jotka odottavat ennustettavasti GPT4:ää. Tammikuuhun mennessä chatbot oli saavuttanut nopeimmin kasvavan käyttäjäkunnan ennätyksen mille tahansa alustalle – chatbotin arvioitiin keränneen 100 miljoonaa kuukausittaista aktiivista käyttäjää kahdessa kuukaudessa. Koska GPT4 on saatavilla ChatGPT Plusissa, OpenAI:lla on 100 miljoonan potentiaalinen käyttäjäkunta. Ja tämän monien odotuksiin on vaikea vastata.
Silti paljon parempi kuin GPT-3.5
Tämä selittää, miksi OpenAI:n blogi kuvaili huolellisesti eroa GPT-3.5:n ja GPT4:n välillä sen julkaisun aikana sanoen, että se ei ole havaittavissa “rennon keskustelun” aikana. Siinä todettiin: “Ero tulee esiin, kun tehtävän monimutkaisuus saavuttaa riittävän kynnyksen – GPT-4 on luotettavampi, luovempi ja pystyy käsittelemään paljon vivahteikkaampia ohjeita kuin GPT-3.5.”
Mutta kaikille tietävälle GPT4 on paljon suurempi parannus GPT-3.5:een verrattuna. OpenAI:n mukaan GPT4 vastaa 82 % vähemmän todennäköisemmin sellaisiin sisältöpyyntöihin, joita OpenAI ei salli, ja 60 % vähemmän todennäköisesti saa hallusinaatioita.
Se myös ylittää ChatGPT:n ihmistesteissä, kuten Uniform Bar Exam -testissä – GPT4 sijoittuu 90. prosenttipisteeseen ja ChatGPT 10. prosenttipisteeseen. Biologiaolympiadissa GPT4 sijoittuu 99. prosenttipisteeseen ja ChatGPT sijalle 31.
Oren Etzioni, Allen Institute for AI:n toimitusjohtaja ja perustaja, kutsui mallia benchmarkiksi ja aivan oikein. “Jatkuvat parannukset monissa ulottuvuuksissa ovat merkittäviä. GPT-4 on nyt standardi, jolla kaikki perustusmallit arvioidaan”, hän totesi.
Kaikista GPT4:n mahdollisesti aiheuttamista pettymyksistä huolimatta – multimodaalista ominaisuutta tutkitaan edelleen, OpenAI:n mallia koskeva paperi ei paljasta käytännössä mitään ja se on edelleen hallusinaatio. Mutta tosiasia on, että GPT4:ää parempaa AI-mallia ei ole. Se vain pyytää käyttäjiä luopumaan ennakkokäsityksistä ja olemaan avoin mieli.
Hype saavuttaa kuumepisteen
Mutta sen jälkeen, kun ChatGPT julkaistiin viime vuoden marraskuussa, asiat näyttävät huomattavasti erilaisilta. OpenAI:sta on tullut kuuma omaisuus, ja Microsoft kaataa siihen miljardeja. Chatbotin suosio suuren yleisön keskuudessa riitti murehtimaan Googlea heidän hauistaan. Ja kaikki katsoivat GPT4:ää.
Mutta Altman on tehnyt paljon hillitäkseen odotuksia. Tammikuussa StrictlyVC:n haastattelussa Altman jatkoi, että “ihmiset pyytävät pettymystä ja tulevat olemaan.” Altman vastasi kielteisesti huhuihin, joiden mukaan mallin koko ja mittakaava ovat yli 100 biljoonaa parametria. “GPT-4-huhumylly on naurettava asia, en tiedä mistä se kaikki tulee. Se on jatkunut kuusi kuukautta tällä volyymilla”, hän sanoi.