Seuraava artikkeli auttaa sinua: GPT-4-ennusteet: osumia ja osumia
Kissa on vihdoin ulos pussista. GPT-4 on täällä ja on saanut maailman kiireiseksi. AIM julkaisi GPT-4-ennusteet tuntia ennen OpenAI:n yllätysjulkaisua. Vaikka he ovat saattaneet tarjota GPT-4:n live-demon kehittäjille, se ei ollut konkreettista käsiteltäessä joitakin kriittisiä ominaisuuksia, joita kaikki odottivat.
GPT-4:n suurin tarjonta, kuten ennustettiin, on sen multimodaalisuusmalli jossa se pystyy käsittelemään kuva- ja tekstisyötteitä tekstin tuottamiseksi. Ominaisuuden oletetaan olevan käyttökelpoinen dialogijärjestelmissä, tekstin yhteenvedossa ja konekäännöksissä. OpenAI ei kuitenkaan puhunut GPT-4:n parametreista ja kapasiteetista.
Multimodaalisuus
Suurin ennuste multimodaalisuudesta saatiin osittain käsiteltyä kuvien integroinnilla. Microsoft Saksan tapahtumassa viime viikolla, kun teknologiajohtaja Andreas Braun ilmoitti multimodaalisuuden mahdollisuudesta GPT-4:ssä, kuvan, videon, äänen ja monien muiden ominaisuuksien integrointi näytti mahdolliselta. GPT-4:n kehittäjädemo esitteli kuitenkin vain kuvaintegroinnin.
Greg Brockman, OpenAI:n puheenjohtaja ja perustaja, selitti, että GPT-4:n kuvaominaisuus on esikatselutilassa ja vain “sneak-peak”. Hän lisäsi lisäksi, että se ei ole vielä julkisesti saatavilla ja että he tekevät edelleen yhteistyötä Be My Eyes -startupin kanssa, joka pyrkii luomaan teknologiaa auttamaan sokeita tai heikkonäköisiä ihmisiä.
Demossa GPT-4 pystyi kuvaamaan loogisesti kuvaa, kuten “Miksi tämä kuva on hauska?”. Tämä ominaisuus ehdotettiin Microsoftin Kosmos-1:ssä, jossa multimodaalisuutta käytetään kuvien analysointiin ja tulosteen antamiseen. GPT-4 ymmärtää kuvia ja ilmaisee niistä loogisia ajatuksia.
GPT-4 on myös varustettu lukemaan käsin kirjoitettuja viestejä, joissa on erityisiä ohjeita, ja muuntaa ne haluttuun lähtöön.
GPT-4:n parametrit
OpenAI ei puhunut parametreista, joilla GPT-4 on koulutettu, joten suuri ennuste siitä, onko GPT-4 koulutettu 100 biljoonaan parametriin – kuten huhutaan –ratkaisematta. Vaikka Sam Altman kiisti kysymyksen haastattelussa tammikuussa, OpenAI ei vahvistanut samaa. OpenAI ei myöskään puhunut kustannuksista tai siitä, millaista teknistä tukea se käytti GPT-4:n rakentamiseen.
OpenAI puhui kuitenkin pitkään GPT-4:n edistyneestä tekstiominaisuudesta, mikä tarkoittaa välttämättä sitä, että uuden mallin kouluttamiseen käytettiin enemmän parametreja. GPT-4 voi lukea, analysoida ja luoda jopa 25 000 sanaa tekstiä, mikä on “8 kertaa enemmän kuin ChatGPT”. Lisäksi se voi jopa kirjoittaa koodia kaikilla tärkeimmillä kielillä. Jatkuva vertailu heidän GPT-3-malliinsa oli melkein kuin vahvistus sille, kuinka tämä malli on parempi kuin ChatGPT.
Hallusinaatiot
Tekoälyasiantuntijat olivat maininneet ennusteita LLM:iden lisääntyvistä hallusinaatioista; riski on huomattavasti suurempi GPT-4:llä. Gary Marcus oli myös maininnut, kuinka suurten tietojoukkojen harjoittelu tuo enemmän hallusinaatioita esiin. Sam Altman kuitenkin kumosi ennusteen. Altman mainitsi, että GPT-4 hallusinoi “merkittävästi vähemmän” ja on “vähemmän puolueellinen”, mutta mitään selvyyttä siitä, miten se toteutuu, ei tarjottu. Brockmanin korostaessa OpenAI:n jatkuvaa työtä “saadakseen järjestelmän toimimaan nopeammin”, väite hallusinaatioiden vähenemisestä voidaan vahvistaa vain ajan myötä.
GPT-4 paljon suurempi kuin GPT-3
Marraskuussa 2022 AIM oli puhunut siitä, kuinka GPT-4 on paljon suurempi kuin GPT-3 ja suorittaa tehtäviä, joita GPT-3 ei pysty. Kehittäjän esittelyvideossa Brockman kertoo tehtäviä, jotka eivät aiemmin olleet mahdollisia GPT-3:lla. Hän korostaa “miten työskennellä järjestelmän kanssa sellaisen tehtävän suorittamiseksi, jota kukaan meistä ei halua tehdä, mutta joka on pakko” ja jatkaa selittääkseen, kuinka GPT-4 voi auttaa “veroissasi”.
Keskittyessään GPT-4:ään, joka tarjoaa paljon enemmän kuin edeltäjänsä, OpenAI näytti keskittyvän uusien käyttäjien hankkimiseen, kun he mainitsivat jatkuvasti, kuinka uutta mallia oli testattu kuukausia, jotta se “sopii yhteiskunnalle” ja “lisäisi arvoa jokapäiväiseen elämään”. . Aiemmin mainittiin, että alustan integrointia LLM:ien kanssa tulisi lisää ja GPT-4:n ilmoitus johti yhteistyöilmoituksiin. Koulutukseen ja verkkokokeiden läpäisemiseen keskittyvä GPT-4 pyrki saavuttamaan “opetussegmentin”. Tämä kävi ilmi verkkokoulutusalustojen, kuten Khan Academyn ja Duolingon, ilmoituksista, jotka tulivat GPT-4:n julkaisutapahtuman aikoihin.
Vaikka laajat GPT-4-ennusteet toteutuivat, OpenAI:n epäselvyyden puute on estänyt meitä päättelemästä GPT-4:n tarkkaa suuruutta. Ajan myötä käyttötapaukset ovat ainoa vahvistava tekijä sen ymmärtämisessä, kuinka suuri osa väitteistä pitää paikkansa.