Seuraava artikkeli auttaa sinua: Kuinka visualisoida erilaisia ML-malleja PyCaretilla optimointiin?
Koneoppimisessa mallien tuottamien tulosten optimointi on tärkeässä roolissa parempien tulosten saavuttamisessa. Yleensä saamme nämä tulokset taulukkomuodossa, ja mallien optimointi tällaisten taulukkotulosten avulla tekee menettelystä monimutkaisen ja aikaa vievän. Tulosten hyvä visualisointi on erittäin hyödyllistä mallin optimoinnissa. PyCaret-kirjaston avulla voimme visualisoida tulokset ja optimoida ne. Tässä artikkelissa keskustelemme siitä, kuinka voimme visualisoida tuloksia eri mallinnusmenetelmistä. Tärkeimmät artikkelissa käsiteltävät kohdat on lueteltu alla.
Sisällysluettelo
- Mikä on PyCaret?
- Luokittelumallin visualisointi
- Regressiomallin visualisointi
- Klusterimallin visualisointi
- Visualisoi poikkeamien havaitseminen
Mikä on PyCaret?
Yhdessä artikkelissamme olemme keskustelleet siitä, että PyCaret on avoimen lähdekoodin kirjasto, joka auttaa meitä suorittamaan erilaisia koneoppimismallinnuksia automaattisesti. Tämän kirjaston tarkoituksena on tehdä koneoppimismallinnuksen prosessista yksinkertaista käyttämällä matalan koodin käyttöliittymää. Yhdessä tällaisen alhaisen koodin käyttöliittymän kanssa tämä kirjasto tarjoaa moduuleja, jotka ovat erittäin tehokkaita ja vähän aikaa vieviä.
Prosessin selitettävyyden ja tulkittavuuden parantamiseksi tämä kirjasto tarjoaa erilaisia visualisointeja, jotka on toteutettu joidenkin moduulien avulla. Tämä kirjasto yhdistää visualisoinnin useista kuuluisista paketeista, kuten yellowbricks, autovig, plotly jne. Tässä artikkelissa PyCaretin visualisointimoduuleilla aiomme piirtää tuloksia eri malleista.
Aloitetaan luokittelumallista.
Luokittelumallin visualisointi
Aloitetaan toimenpide tuomalla tietoja. Koska PyCaret-kirjastossamme on useita tietojoukkoja, voimme hyödyntää niitä käytännön tarkoituksiin. Tässä artikkelissa aiomme käyttää sydänsairauksien tietojoukkoa, jossa on useita lääketieteellisiin tiloihin liittyviä arvoja, jotka luokittelevat, voiko henkilöllä olla sydänsairaus vai ei. Tuodaan se suoraan kirjastosta.
from pycaret.datasets import get_data data = get_data(‘sydänsairaus’)
Lähtö:
Tässä yllä olevassa lähdössä voimme nähdä joitain arvoja tietojoukosta. Laitetaan nyt malli.
from pycaret.classification import * malli1 = setup(data = data, target=”tauti”)
Lähtö:

Mallin asetuksissa olemme antaneet tietojoukon nimen ja kohdemuuttujan nimen. Tietojoukon optimoinnin jälkeen asennusmoduuli on antanut tietoa muuttujista, joista tietojoukko koostuu.
Sovitetaan malli.
random_forest = create_model(‘rf’)
Lähtö:
Täältä näemme tietoja mallin tarkkuudesta ja AUC-pisteistä. Tämän jälkeen mallin sovituksen jälkeen kuvaan tulee artikkelin päätarkoitus.
Tulosten visualisointi
Toinen PyCaret-kirjastossa hieno asia on se, että voimme hyödyntää sen ominaisuuksia visualisoidaksemme tulokset mallista, joka meillä on taulukkomuodossa.
AUC-pisteiden piirtäminen:
plot_model(random_forest, plot=”auc”)
Lähtö:

Tässä kaaviossa voimme nähdä, että meillä on mallin AUC-arvojen yksityiskohtainen visualisointi. On olemassa erilaisia kirjastoja, kuten yellowbricks ja autovig, jotka auttavat PyCaretia tekemään tällaisia visualisointeja.
Katsotaan hämmennysmatriisia visualisoidussa muodossa.
plot_model(random_forest , plot=”sekoitusmatriisi”)
Lähtö:

Tässä näemme hämmennysmatriisin. Voimme myös muuntaa sekavuusmatriisin alaisia arvoja prosentteina.
plot_model(random_forest , plot=”confusion_matrix”, plot_kwargs = {‘prosentti’ : tosi})
Lähtö:

Voimme myös piirtää tulokset harjoitustietojen perusteella antamalla use_train_data arvoksi True. Piirretään mallin päätösraja.
plot_model(satunnainen_metsä, plot=”raja”, use_train_data = tosi)
Lähtö:

Ominaisuussuunnittelulla on ratkaiseva rooli tiedon mallintamisessa. Voimme tarkistaa ominaisuuden tärkeyden käyttämällä seuraavia koodirivejä.
plot_model(random_forest, plot=”feature_all”, use_train_data = True)
Lähtö:

Tässä on käsitelty tulosten visualisointia luokittelumallilla. Voimme myös piirtää erilaisia tuloksia regressiomallista.
Regressiomallin visualisointi
Sovitetaan regressiomalli autotietojoukon avulla.
data = get_data(‘auto’) from pycaret.regression import * model2 = setup(data = data, target=”price”) random_forest_r = create_model(‘rf’)
Lähtö:

Tässä näemme satunnaisen metsäregression tulokset taulukkomuodossa. Piirretään nämä tulokset.
Oppimiskäyrän piirtäminen
plot_model(random_forest_r, plot=”learning”, use_train_data = True)
Lähtö:

Piirretään virheet ja jäännösarvot mallista.
Virhekaavio
plot_model(random_forest_r, plot=”error”, use_train_data = True)
Lähtö:

Jäännöstontti
plot_model(random_forest_r, plot=”residuals”, use_train_data = True)
Lähtö:

Tässä olemme nähneet joitain regressiomallin tulosten visualisointeja. Voimme myös piirtää tuloksia klusterimallinnuksen avulla.
Klusterimallin visualisointi
Klusteroinnissa käytämme hiirten tietoja ja sovitamme k-keskiarvomallin dataan.
data = get_data(‘hiiret’) from pycaret.clustering import * model3 = setup(data, normalize = True, ignore_features = [‘MouseID’]session_id = 123) kmeans = create_model(‘kmeans’)
Lähtö:

Nyt olemme valmiita piirtämään klusterimallinnuksen tulokset.
Piirustusklusterit
plot_model(kmeans, plot=”klusteri”)
Lähtö:

PyCaret käyttää tähän visualisointiin plotly-pakettia. Tämä paketti tarjoaa interaktiivisia tontteja, joita ei ole täällä, löydämme nämä tontit täältä.
Piirretään klusterit 3D:nä.

Voimme myös piirtää tulokset, kuten siluetin ja etäisyyden. Piirretään klustereiden etäisyys.
plot_model(kmmeans, plot=”etäisyys”)
Lähtö:

Tässä olemme nähneet joitain klusterianalyysin tuloksia visualisoituina. Voimme myös visualisoida poikkeamien havaitsemisprosessin tulokset.
Visualisoi poikkeamien havaitseminen
Sovitetaan malli samanlaisiin tietoihin, joita käytimme klusteroinnissa.
from pycaret.anomaly import * model4 = setup(data, normalize = True, ignore_features = [‘MouseID’]session_id = 123) iforest = create_model(‘metsä’)
Piirretään anomalian havaitsemisen tulokset.
tonttimalli(metsä)
Lähtö:
Voimme myös piirtää umap-ulottuvuuskaavion.
plot_model(metsä, plot = ‘kartta’)
Lähtö:
Nämä juonet luodaan myös plotlykirjaston avulla. Voimme myös nähdä kaaviosta, mitkä ovat poikkeavuuksia hiirten tietojoukossa.
Viimeiset sanat
Artikkelissa olemme pohtineet, kuinka voimme visualisoida mallin tulokset PyCaret-kirjaston moduuleilla. Koska jokainen juoni oli tarpeeksi informatiivinen, voimme hyödyntää niitä mallien optimoinnissa ja mallinnusmenetelmissä, jotta voimme parantaa tuloksia.
Viitteet