Seuraava artikkeli auttaa sinua: Bengaluru-tutkijan malli havaitsee tarkasti tekoälyn luomat profiilikuvat
IIT-Kharagpurin alumni Shivansh Mundra, joka työskentelee tällä hetkellä LinkedInissä yhdessä Kalifornian yliopiston ja Berkeleyn tutkijoiden kanssa, keksi äskettäin uuden tekniikan GAN:n (generative adversaria network) luomien väärennettyjen profiilikuvien tunnistamiseksi tarkasti. Mundra kertoi AIM, “Tutkittuamme tuhansia profiilikuvia, löysimme GAN:ien luomista kuvista erityisiä rakenteellisia kuvioita. Nämä tiedot olivat meille todella hyödyllisiä, ja teimme hyvin yksinkertaisen lineaarisen mallin.
UC Berkeleyn ja LinkedInin tutkimusyhteistyössä käytettiin kevyitä, pieniulotteisia malleja suhteellisen vähäisellä harjoitusdatalla, joka laskee matemaattisesti StyleGAN-kasvojen lopullisen kuvion oikeista profiilikuvista.
Väärennettyjen profiilikuvien nousu
LinkedIn, joka isännöi yli 930 miljoonaa profiilia, jotka yhdistävät toisiaan ammattimaisesti, on myös satojen tuhansien oikeiksi naamioituneiden valeprofiilien koti. He saalistavat pahaa-aavistamattomia käyttäjiä, tarjoavat työpaikkoja, joita ei ole olemassa, väärennettyä teknistä tukea vastineeksi rahasta tai vain perinteistä tietojenkalastelua.
Ensimmäinen askel sosiaalisen median huijauksissa on kaatuminen profiilikuvaan. On olemassa työkaluja, jotka auttavat selvittämään, onko kuva GAN-generoitu vai todellinen, mutta ne ovat vain noin 60 % tarkkoja. UC Berkeleyn ja LinkedInin tutkimusyhteistyössä keinotekoisesti luodut profiilikuvat tunnistetaan tarkasti 99,6 % ajasta, kun taas vain 1 % tunnistaa aidot kuvat väärennöksiksi.
Kuinka se toimii?
Useimmat tähänastiset mallit ratkaisevat väärennettyjen kuvien tunnistamisen ongelman käyttämällä konvoluutiohermoverkkoja tai CNN:ää, eräänlaista syväoppimismallia, joka sisältää suodattimen. Kuva kulkee tämän suodattimen läpi erottuvan rakenteen tai kuvion poimimiseksi. Käyttämällä useita suodattimia voit valita erilaisia erityisominaisuuksia. Tämä on tehokasta vain, kun mallilla on paljon harjoitusdataa GAN-kuvan yhteisten ominaisuuksien oppimiseksi.
Huono puoli tässä on, että GAN kilpailevine ominaisuuksineen ylittää itsensä. “Luoduissa kuvissa on kuvioita, jotka toistavat itseään, ja tutkimassamme 100 000 kuvassa on vähemmän monimuotoisuutta. Synteettiset kuvat ovat hyvin rakenteellisia ja näistä tiedoista oli meille todella hyötyä. Tätä silmällä pitäen loimme hyvin yksinkertaisen mallin, yhtä yksinkertaisen kuin lineaarisen mallin”, Mundra selitti.
Muut menetelmät
Tämän ongelman ratkaisemiseksi voidaan yleensä käyttää kahta rikosteknistä menetelmää. Ensimmäinen on hypoteesiin perustuva lähestymistapa, joka havaitsee epäsäännöllisyydet synteettisesti luoduissa kasvoissa. Tämä menetelmä kohtaa kuitenkin haasteita käsiteltäessä edistyneitä synteesimoottoreita, jotka voivat jäljitellä aitoja ominaisuuksia. Muut, dataohjatut menetelmät, kuten koneoppiminen, voivat erottaa luonnolliset kasvot tietokoneella luoduista. Siitä huolimatta he voivat kamppailla, kun he kohtaavat tuntemattomia kuvia.
Tässä artikkelissa ehdotettu lähestymistapa on hybridi, joka yhdistää molemmat menetelmät. Se alkaa tunnistamalla erottuva geometrinen attribuutti tietokoneella luoduista kasvoista ja sitten käyttää tietopohjaisia tekniikoita mittaamiseen ja havaitsemiseen. Tämä lähestymistapa perustuu kevyeen ja helposti koulutettavaan luokittimeen, joka vaatii harjoittelua pienellä joukolla synteettisiä kasvoja.
Mundra sanoi, että tämän saavuttamiseksi he loivat 41 500 synteettistä pintaa viidellä eri synteesimoottorilla sekä ylimääräisen tietojoukon, joka sisälsi 100 000 aitoa LinkedIn-profiilikuvaa. Aiempi tarkkuusaste koskee vain GAN-generaattoreiden tuottamia ihmiskasvoja, vaikka ne työskentelevätkin mallien parissa, jotka poimivat Stable Diffusionin ja muiden työkalujen luomia vääriä kuvia.
Mitä seuraavaksi?
“Tämä on vain GAN-pohjaisille kuville. Muissa menetelmissä, kuten diffuusio tai näissä uusissa muuntajapohjaisissa menetelmissä, kuten Stable Diffusion, joihin on rakennettu erilaisia rakennekuvioita, emme pystyneet havaitsemaan vääriä kuvia näillä yksinkertaisilla lineaarisilla malleilla. Mutta on muitakin menetelmiä, joita kehittelemme ja jotka luultavasti otamme käyttöön pian”, Shivansh selitti.