Seuraava artikkeli auttaa sinua: 7 avoimen lähdekoodin mallia OpenAI:sta
Elon Musk oli mukana perustamassa OpenAI:ta – erittäin suositun ChatGPT:n takana olevan yrityksen. Mutta hän on puhunut siitä, ettei yritys pysy uskollisena nimelleen. Musk twiittasi äskettäin ilmaiseen pettymyksensä siihen, että yhtiöstä on tullut “suljettu lähde, maksimivoitto”.
“OpenAI luotiin avoimeksi lähdekoodiksi (siksi annoin sille nimen “Open” AI), voittoa tavoittelemattomaksi yritykseksi vastapainona Googlelle, mutta nyt siitä on tullut suljetun lähdekoodin suurin voittoa tuottava yritys, jota tehokkaasti hallitsee Microsoft. ”, hän twiittasi.
Yritys on aiemmin kohdannut kritiikkiä suljettujen ovien politiikastaan paitsi Teslan toimitusjohtajalta, myös useilta alan asiantuntijoilta ja avoimen lähdekoodin yhteisön jäseniltä. Yritystä on syytetty avoimen lähdekoodin yhteisön hyödyntämisestä antamatta takaisin.
OpenAI yrittää kuitenkin nyt omaksua avoimen lähdekoodin lähestymistavan. Avautumalla uudelleen “Consistency Models” -mallien avulla OpenAI asettaa itsensä entistä laajempaan yhteistyöhön ja panoksensa avoimen lähdekoodin yhteisöön.
Yhtiö on aiemmin hankkinut avoimen lähdekoodin useita malleja. Tässä on joitain OpenAI:n avoimen lähdekoodin malleja:
Evals:
OpenAI avasi Evals-nimisen ohjelmistokehyksen, jonka avulla käyttäjät voivat arvioida tekoälymallien suorituskykyä. Viitekehyksen avulla käyttäjät voivat tunnistaa malleissaan olevat puutteet ja antaa palautetta suorista parannuksista. OpenAI:n henkilökunta tarkastelee näitä arvioita aktiivisesti harkitessaan parannuksia tuleviin malleihin. Työkalujen tarkoituksena on luoda väline, jolla voidaan jakaa ja kerätä joukkolähteitä vertailuarvoja, jotka edustavat laajaa joukkoa vikatiloja ja vaikeita tehtäviä. OpenAI aikoo myöntää GPT-4:n käyttöoikeuden niille, jotka lähettävät korkealaatuisia vertailuarvoja.
Kuiskaus:
OpenAI esitteli monikielisen puheentunnistusjärjestelmän nimeltä Whisper syyskuussa 2022. Whisper on koulutettu käyttämään 680 000 tuntia monikielistä ja monitehtävää valvottua dataa. Whisper käyttää yksinkertaista päästä päähän -lähestymistapaa, joka on toteutettu enkooderi-dekooderimuuntajana, ja siinä on parannettu taustamelun, ainutlaatuisten aksenttien ja teknisen ammattikieltä tunnistamista. Se ei voita malleja, jotka ovat erikoistuneet LibriSpeech-suorituskykyyn, mutta näyttää vankan nollakuvan suorituskyvyn monissa erilaisissa tietojoukoissa, mikä tekee 50 % vähemmän virheitä kuin muut mallit. Avoimen lähdekoodin mallit ja päättelykoodi antavat kehittäjille mahdollisuuden lisätä äänirajapintoja laajempiin sovelluksiin.
Dall-E:
DALL-E ja sen seuraaja DALL-E 2 ovat OpenAI:n kehittämiä syväoppimismalleja, jotka luovat digitaalisia kuvia luonnollisen kielen kuvauksista. DALL-E 2, joka on suunniteltu tuottamaan realistisempia kuvia korkeammalla resoluutiolla, astui beta-vaiheeseen, jolloin kutsut lähetettiin miljoonalle odotuslistalla olevalle henkilölle heinäkuussa 2022, ja se avattiin kaikille syyskuussa 2022. Marraskuussa 2022 OpenAI julkaisi DALL-E:n 2 API:na, jonka avulla kehittäjät voivat integroida mallin omiin sovelluksiinsa, ja Microsoft julkisti DALL-E 2 -toteutuksensa Designer-sovelluksessa ja Image Creator -työkalussa, jotka sisältyvät Bingiin ja Microsoft Edgeen. API toimii kuvakohtaisen hinnan perusteella.
Pyöriminen ylös:
Spinning Up on OpenAI:n koulutusresurssi, jossa opitaan syvästä vahvistusoppimisesta (deep RL), joka on koneoppimisen ja syväoppimisen yhdistelmä. Se sisältää johdannon RL-terminologiaan ja teoriaan, esseen RL-tutkijaksi tulemisesta, luettelon tärkeistä artikkeleista, avainalgoritmien kooditoteutuksia ja harjoituksia.
LIIKE:
OpenAI CLIP on koneoppimismalli, joka käyttää kuvien luonnollisen kielen kuvauksia luonnolliseen kieleen ja kuvankäsittelyyn liittyvien tehtävien suorittamiseen. Se voi luokitella kuvia, havaita esineitä ja hakea kuvia tekstikehotteiden perusteella. CLIP on koulutettu käyttämään laajaa tietojoukkoa kuvia ja kuvatekstejä, ja se on saatavilla avoimen lähdekoodin mallina. Sen ainutlaatuinen ominaisuus on, että se voi suorittaa hyvin monenlaisia tehtäviä ilman, että tarvitaan huomautettuja kuvatietoja.
Jukeboksi:
OpenAI Jukebox on generatiivinen malli, joka luo musiikkia syvien hermoverkkojen avulla, jotka on koulutettu laajalle tietojoukolle musiikkinäytteitä eri genreistä. Se voi luoda alkuperäisiä musiikkinäytteitä, jotka ovat tyyliltään ja rakenteeltaan samanlaisia kuin erityyppinen musiikki. Jukebox voi myös luoda musiikkia sanoituksella tietyn kehotteen perusteella. Se on avoimen lähdekoodin projekti, jossa tutkijat ja muusikot ympäri maailmaa tutkivat luovien taiteiden luovien mallien mahdollisuuksia.
Piste-E
OpenAI:n GPT-3 Point-Eleven tai Point-E on sen kielimallin GPT-3 optimoitu muunnos keskustelupalstojen tekoälysovelluksiin. Se käyttää laajempaa kontekstiikkunaa ja muita optimointeja parantaakseen mallin vastausten luonnollisuutta ja johdonmukaisuutta keskusteluissa. Point-E ei ole saatavana erillisenä mallina, vaan se tarjotaan OpenAI:n GPT-3 API:n kautta, joka tarjoaa erilaisia kielipohjaisia palveluita, kuten tekstin täydennyksen, kysymyksiin vastaamisen ja keskustelun tekoälyn.