Gekissimo.net - Opi ansaitsemaan rahaa webilläsi Internetissä!

5 asiaa, joiden kanssa tekoälykuvageneraattorit kamppailevat edelleen

Seuraava artikkeli auttaa sinua: 5 asiaa, joiden kanssa tekoälykuvageneraattorit kamppailevat edelleen

Tekoälykuvageneraattorit, kuten Dall-E, Stable Diffusion, Midjourney ja Bing Image Creator, tuottavat uskomattomia tuloksia, mutta joskus ne voivat olla uskomattoman turhauttavia. Yksinkertaisilla kehotteilla, jotka sisältävät vain muutaman sanan, tekoäly voi tuottaa vaikuttavia kuvia, jotka näyttävät ammattimaisista valokuvista ja vakuuttavista eri tyyleistä. Sama kehote saa kuitenkin toisinaan aikaan jonkin kauhistuttavan olennon tai naurettavan virheellisen renderöinnin.

Negatiiviset kehotteet voivat auttaa vähentämään näiden virheiden todennäköisyyttä, mutta monimutkaisuus ei aina pelasta sinua. Jopa tekoälyasiantuntijat kamppailevat epämuodostuneiden olentojen ja epämaailmallisten kohtausten kanssa, mikä vaatii pitkiä tunteja tarkentamalla kehotteita tai parantamalla kuvia perinteisellä kuvankäsittelyohjelmalla. Jos katsot tarkasti kuvan oikeita alueita, voit toistaiseksi tunnistaa, onko se koneella tehty.

Käsisalaattia ja sormipalloja

Tekoälykehittäjät ovat edistyneet taistelussaan opettaa tekoälytyökaluja, miltä ihmiskäsien pitäisi näyttää, mutta parantamisen varaa on runsaasti. Jos sormet eivät ole näkyvästi esillä, virheet on helppo jättää huomiotta, mutta se on jatkuva ongelma.

Dall-E oli varhainen tekoälyjohtaja, mutta kädet eivät ole sen asia. Dall-E Alan Trulyn kehotuksesta

Yksi ensimmäisistä ja parhaista yleisön saatavilla olevista tekoälykuvageneraattoreista, OpenAI:n Dall-E, loi nämä kuvat kädestä pitävistä ihmisistä. Ensi silmäyksellä se saattaa näyttää hyvältä. Tarkemmin tarkasteltuna huomaa joitakin ongelmia. Varo ylimääräisiä sormia, outoja kynsiä ja yhdistettyjä numeroita.

Monimutkaiset kahvat ja lomitetut sormet ovat vieläkin haastavampia. Älä ylläty, jos tekoälykuvasi tulevat takaisin klassisilla virheillä, joita kutsutaan “käsisalaattiksi” tai “sormipalloiksi”.

Dall-E:n lomitetut kädet ovat häiritseviä. Dall-E Alan Trulyn kehotuksesta

Häiritsevä teksti ja kirjoittaminen

Saatat odottaa, että tekstin luominen tietokoneella on helppoa. Näet todisteita sanoista näytöillä päivittäin, kun nostat puhelimen tai avaat selaimen. Varhaiset tietokoneet, toisin kuin nykypäivän huippupelitietokoneet, eivät pystyneet näyttämään minkäänlaista grafiikkaa. Kaikki oli tekstiä tai numeroita.

Leonardo AI tuntee tyylit, mutta painettu teksti on haastavaa. Leonardo AI Alan Trulyn kehotuksesta

Todellisten kirjainten ja symbolien näyttäminen painetuina tai kirjoitettuina sanoina on kuitenkin yllättävän hankalaa tekoälykuvageneraattorille. Se saattaa kuulostaa helpolta ongelmalta ratkaista, mutta se ei ole sitä. Sovellus ei voi vain peittää pelkkää tekstiä. Ollakseen vakuuttava tekstin tyylin, varjostuksen, kulman ja perspektiivin on vastattava kohtauksen muuta osaa.

🔥 Empfohlen:  Vinkkejä luottamuksen rakentamiseen asiakkaidesi kanssa

Esimerkissä suhteellisen uusi tekoälykuvageneraattori, Leonardo AI, teki urheasti työtä vintage-mainostaulun kanssa Jack Rabbit Slimin ruokalassa. Useiden yritysten jälkeen tekoäly onnistui täsmentämään sanan “Jack Rabbit’s”, joka on melko lähellä pyyntöä. Vintage-valokuvatyyli oli jokaisessa kuvassa paikallaan, mutta kirjaimet ja sanat olivat enimmäkseen virheellisiä.

Leonardo AI oli lähellä saada tekstiä oikeaan vasemmanpuoleisessa renderöinnissa. Leonardo AI renderöi Alan Trulyn kehotuksesta

Silmillä sitä ei ole

Alan Trulyn kehottama Bing Image Creator

Usein sanotaan, että silmät ovat sielun ikkuna. Luotamme niin paljon katsekontaktiin, että se voi olla kriittisin yksityiskohta realistisen muotokuvan luomisessa. Mutta monilla tekoälytyökaluilla on vaikeuksia renderöidä ihmissilmiä.

Bing Image Creator teki kunnollisen työn studiotaustalla ja poseerasi usean sukupolven perhekuvan. Melkein jokaisella ihmisellä on kuitenkin omituiset silmät, jotka näyttävät alienien laittamalta, tai ehkä nämä hymyilevät ihmiset ovat muuttumassa epämallisiksi olentoiksi.

Kaksi lähempää esimerkkiä Bing Image Creatorin häiritsevistä silmäongelmista. Alan Trulyn kehottama Bing Image Creator

Hankalat työkalut

Ihminen osaa hyvin työkaluja, ei vain digitaalista monipuolisuutta, kuten tekoälyä. Hallitsemme nopeasti kaikki käsissämme olevat fyysiset työkalut. Tekoälyllä sen sijaan on vaikeuksia ymmärtää, mitä ne ovat ja miten niitä käytetään.

Midjourney ymmärtää käsiä, mutta on ymmällään jakoavaimista. Onko tuo lamppu vasemmassa alakulmassa? Keskimatka Alan Trulyn kehotuksesta

Midjourney on tekoälykuvageneraattori, joka edistyy fantastisesti ihmisten kasvojen ja käsien ongelmien ratkaisemisessa. Kuitenkin, kun sinua kehotetaan näyttämään mekaanikkoa kiristämässä pulttia avaimella, työkalu puuttuu kokonaan. Käsineisiin lisätään yhdessä tapauksessa kynnet ja toisessa näkyy jotenkin hehkulamppu.

Sakset ovat liian monimutkaisia ​​Bing Image Creatorille tässä leikattavien hiusten lähikuvassa. Ne ovat auki vain yhdessä kuvassa eivätkä koskaan näytä olevan leikkausvaiheessa.

Bing Image Creator ei pysty ymmärtämään, miten sakset toimivat. Alan Trulyn kehottama Bing Image Creator

Painajaisen hampaat

Vakaa diffuusio Leonardo AI:n kautta, Alan Trulyn kehotuksesta

Kun ihmiset hymyilevät ja nauravat, se yleensä parantaa kuvaa, mikä tekee siitä miellyttävän ja hauskan. Kun tekoäly antaa yksinkertaisen kehotuksen, kuten kaksi hymyilevää ja nauravaa opiskelijaa, tekoäly voi muuttaa tämän painajaispolttoaineeksi, jossa on useita hammasrivejä ja muita outoja vääristymiä.

Leonardo AI antaa sinun valita useiden mallien välillä, ja jotkut käsittelevät hampaita hyvin. Suosittu Stable Diffusion 2.1 -malli tarvitsi apua saadakseen hampaat kuntoon. Kielteisellä kehotuksella ongelma ratkesi. Näihin tekoälykuvaongelmiin on ratkaisuja, mutta hyvien tulosten saavuttaminen vaatii silti työtä.

🔥 Empfohlen:  Kuinka nostaa rahaa Coinbasesta vuonna 2023
Vakaat diffuusiohymyt hyötyvät negatiivisista kehotuksista poistaa “outot hampaat” ja “vääristynyt suu”. Vakaa diffuusio Leonardo AI:n kautta, Alan Trulyn kehotuksesta

AI-taide kehittyy nopeasti

Tekoälytaiteen alkuaikoina tulokset olivat outoja ja upeita, luoden kauneutta ja kauhua yhtä lailla. Virheet ovat yhä vähemmän havaittavissa jokaisen uuden päivityksen myötä, ja monet ongelmat voidaan ratkaista pienellä tarkennuksella.

Koska saatavilla on niin monia tekoälytyökaluja, on helppo kokeilla toista järjestelmää. Monet tekoälykuvageneraattorit sallivat negatiivisten kehotteiden tai muiden vaihtoehtojen säätää algoritmia ja saada parempia tuloksia.

Saatat joutua kokeilemaan useita yrityksiä saadaksesi käyttökelpoisen kuvan, varsinkin jos keskitytään kasvoihin tai käsiin. Kun haluat sisällyttää painettuja tai kirjoitettuja sanoja, ole valmis viettämään aikaa kuvankäsittelyohjelmassa pyyhkiäksesi tekoälyn järjettömät kirjaimet ja sekoittamalla oikean tekstin.

Hyvä uutinen on, että monet tekoälykuvageneraattorit ovat ilmaisia, ja tilausmallit ovat suhteellisen edullisia. Nämä viipyvät ongelmat voitaisiin ratkaista vuoden kuluessa, jolloin voit käyttää tekoälyä valmiina taideteoksena tai valokuvan korvikkeena.

Table of Contents