Seuraava artikkeli auttaa sinua: Opas XAutoML:ään: Visuaalisen analytiikan työkalu
XAutoML on analytiikkatyökalu, joka selittää AutoML:n optimointimenettelyt ja AutoML:n rakentamat koneoppimisprosessit. Jotta AutoML-prosessi olisi läpinäkyvä ja ymmärrettävä, se yhdistää interaktiiviset visualisoinnit selitettävän AI:n (XAI) vakiintuneisiin tekniikoihin. XAutoML:n integroiminen liiketoimintaan voi auttaa asiantuntijoita keskittymään mallien selitettävyyteen ja saamaan lisää siirtomalleja, jotta sidosryhmät voivat uskoa ratkaisuun. Tässä viestissä keskustelemme XAutoML:stä ja siitä, kuinka yritykset voivat hyödyntää tätä tekniikkaa. Seuraavassa on tärkeimmät kohdat, joista on tarkoitus keskustella tässä viestissä.
Sisällysluettelo
- Johdatus XAutoML:ään
- XAutoML:n työnkulku
- Miten sitä voidaan käyttää
Johdatus XAutoML:ään
Koneoppiminen (ML) on päätynyt kriittiseen osaan monissa arkielämän elementeissä. Silti hyvin näkyvien ML-sovellusten rakentaminen on kova ja aikaa vievä haaste, joka vaatii melko erikoistuneita tietotieteilijöitä ja alueen asiantuntijoita.
AutoML pyrkii parantamaan nykyistä ML-ohjelmien rakentamistekniikkaa kahdella tavalla:
- ML-ammattilaiset voivat säästää aikaa automatisoimalla tylsiä tehtäviä, kuten hyperparametrien optimointia (HPO), mikä parantaa suorituskykyä ja lisää huomiota erityisen vaikeissa tehtävissä. ja
- Toimialueen asiantuntijat voivat rakentaa ML-putkia ilman koneoppimisen asiantuntijaa.
AutoML:ssä luodaan suuri määrä ML-liukuhihnaehdokkaita, jotka voivat ratkaista tietyn tehtävän, mutta AutoML-järjestelmät luovat erilaisia ehdokkaita ilman merkittäviä eroja niiden suorituskyvyssä. Mallin validointi ja valitseminen useista malleista on aikaa vievää työtä ML-kehittäjälle, ja toimialueen asiantuntijoille, joilla ei ole kokemusta ML:stä, on lähes mahdotonta suorittaa tämä tehtävä.
Siksi tutkijat kehittivät uusia visuaalisia analytiikkatyökaluja nimeltä eXplainable Automated Machine Learning (XAutoML) AutoML-järjestelmän luoman putkilinjan analysointiin ja ymmärtämiseen.
XAutoML:n tavoitteena on valtuuttaa kaikki AutoML:n käyttäjät, kuten datatieteilijät, toimialueen asiantuntijat ja AutoML-tutkijat,
- AutoML-järjestelmien sisäisen optimointiprosessin ja hakutilan läpinäkyvyys
- Riittävien tietojen antaminen automaattisesti luotujen ML-mallien validoimiseksi ja valitsemiseksi.
Etsitkö täydellistä arkistoa tietotieteessä käytettävistä Python-kirjastoista, katso tästä.
XAutoML:n työnkulku
XAutoML-työnkulku sulautuu yleiseen datatieteen työnkulkuun, mikä tekee visuaalisen analytiikan työkalun käytöstä helpompaa.
Kuvan lähde
Tämä datatieteen työnkulku on ehdottanut Wang, näet kuvan työnkulku on jaettu kolmeen vaiheeseen: valmistelu, mallintaminen ja käyttöönotto, nämä vaiheet on edelleen jaettu 10 osaan tiedonkeruusta ajonaikaiseen seurantaan ja mallin parantamiseen. AutoML-järjestelmien tarkoituksena on automatisoida vaiheet ominaisuussuunnittelusta kokoamiseen tietotieteen työnkulussa. Voit nähdä kuvasta, että Visual Analytics on jumissa AutoML-optimointimenettelyssä, tämä osa on XAutoML.
Visualisoinnilla on kolme päätavoitetta. Ensimmäinen on mallien tehokas validointi, toinen AutoML-menetelmien ymmärtäminen ja diagnosointi ja kolmas hakutilan tarkennukset, mikä tarkoittaa taustalla olevan hakutilan mukauttamista. Lisäksi sen suunnittelun tavoitteina on mukautua AutoML:n kohdeyleisöön, sulautua tavanomaiseen datatieteen työnkulkuun ja tarjota yksityiskohtaista tietoa.
Miten sitä voidaan käyttää
Tällä hetkellä XAutoML toimii vain rajoitetussa automatisoidussa koneoppimiskehyksessä, kuten
auto-sklearn, dswizard, FLAML, Optuna, scikit-learn. Mutta kehittäjät yrittävät lisätä AutoML-järjestelmiä tulevaisuudessa.
Se on hyvin yksinkertainen toteuttaa. Muutamalla koodirivillä pääset Jupyteriin sisäänrakennettuun visualisointiin. Kuvan alla on XAutoML-mallin tulos.
Kuvan lähde
Visualisoinnin ymmärtämiseksi se on jaettu osiin yllä olevan kuvan mukaisesti.
- V: on visualisoinnin koodi,
- B: Vasemmalla oleva optimointikatsaus näyttää perustilastot optimointiajosta
- B1: se kertoo kaikkien ehdokkaiden tarkkuudesta ajan mittaan
- B2: Valittujen ehdokkaiden ROC-käyrät.
- C: Tämä on tulostaulukkonäkymä, joka tarjoaa yleiskatsauksen kaikista arvioiduista ehdokkaista. Käyttäjät voivat avata yksittäisiä ehdokkaita yleiskatsaukseen.
- C2: Tätä alaosiota kutsutaan suorituskyvyn yksityiskohtien näkymäksi. Tämä osio näyttää suorituskykymittarit, jotka perustuvat ehdokkaiden suoritukseen, näet hämmennysmatriisin, luokkaraportit ja ROC-käyrän.
- D: Nämä välilehdet antavat käyttäjille pääsyn hakutilaan ja kokonaisuuden tarkastukseen. Voit nähdä, että jokaiseen tietoon liittyy Jupyter-logo, koska käyttäjät voivat viedä tiedot Jupyteriin lisäanalyysiä varten.
Yllä olevassa kuvassa C:n tietojen alakohdat on koottu korttiin, jossa on lyhyt kuvaus, jota voi laajentaa valitsemalla sitä. Nyt aiomme keskustella niistä korteista lyhyesti.
Esityksen yksityiskohtien näkymä:
Alla oleva kuva analysoi ja visualisoi suorituskyvyn perusmittareita. Harjoittelu- ja validointisuorituskyky, harjoituksen kesto ja ennusteen kesto näytetään. Jokaisen kohdeluokan osalta luokkaraportti tarjoaa tarkkuutta ja muistamista. Tavallinen sekaannusmatriisi ja ROC-käyrä näytetään.
Kuvan lähde
Globaali korvikenäkymä:
Se sopii ennusteen päätöspuuhun. Kun määrität poistumissolmujen enimmäismäärän, käyttäjät voivat säätää interaktiivisesti päätöspuun kokoa. Tarkkuuspalkki osoittaa, kuinka tarkasti päätöspuu vastaa todellista mallia. Lisäanalyysiä varten käyttäjät voivat viedä sovitetun päätöspuun Jupyteriin.
Kuvan lähde
Datajoukon esikatselu:
Tietojoukon esikatselussa käyttäjät voivat tarkastaa valitun liukuhihnan tietojoukon. Käyttäjät näkevät, kuinka kukin liukuhihnan vaihe muuttaa syöttödataa ja tarjoaa tietojen läpinäkyvyyttä. Visualisoitavaa on paljon. Käyttäjät voivat laajentaa sen Jupyteriin napsauttamalla Jupyter-logoa lisäanalyysiä varten.
Kuvan lähde
Kokoonpanonäkymä:
Seuraava osa on, se luettelee hyperparametrit jokaiselle liukuhihnan vaiheelle. Jokaiselle hakuavaruudelle hyperparametrit piirretään CPC-kaaviolle ja valitaan kunkin hyperparametrin arvot.
Kuvan lähde
ML-mallin suorituskykyyn voivat vaikuttaa suuresti sen hyperparametrit. Mutta todellisuudessa on vain muutama hyperparametri, joilla on merkittävä vaikutus suorituskykyyn. Joten tunnistaaksesi nämä hyperparametrit, Hyperparametrien tärkeysnäkymä tarjoaa visuaalisen esityksen kunkin hyperparametrin tärkeydestä ja niiden parien välisistä vuorovaikutuksista.
fANOVAa käytetään hyperparametrien tärkeyden laskemiseen. fANOVA on AutoML:n menetelmä, jolla arvioidaan algoritmin parametrien tärkeyttä. Kun käyttäjä valitsee hyperparametrin, näkyviin tulee yksityiskohtainen erittely hakutilan hyvin ja huonosti toimivista alueista.
Kuvan lähde
Ominaisuuden tärkeysnäkymä:
Lopuksi ominaisuuden tärkeysnäkymä näyttää ominaisuuksien tärkeyden. Kunkin ominaisuuden vaikutusta ML-mallin ennustevoimaan mitataan permutaatioominaisuuden tärkeydellä. Käyttäjät voivat tarkastella kaikkien ominaisuuksien sijoitusta sekä PDP- ja ICE-kuvia. Kun suoritat moniluokkaista luokitustehtävää.
Kuvan lähde
‘kesto’ on sitten tärkein ominaisuus’savings_status’ ja niin edelleen voit nähdä kuvasta.
Viimeiset sanat
XAutoML:ssä on paljon katettavaa, yksi artikkeli ei riitä, mutta käsittelen lähes kaikki XAutoML:n tärkeimmät toiminnot. Näimme kuinka XAutoML integroitui Jupyteriin visualisoinnin tekemiseksi. Keskustelimme siitä, kuinka AutoML:ltä puuttuu yksityiskohtaisten tietojen tarjoaminen malleista. Lopuksi kävimme läpi kaikki XAutoML:n tarjoamat tiedot.