Seuraava artikkeli auttaa sinua: Parhaat Python-kirjastot suositusjärjestelmille
Suositusjärjestelmä tai recsys on datatieteen ongelma, joka ennustaa, mitä käyttäjät haluavat historiallisten tietojen perusteella. Sitä voidaan pitää järjestelmänä tietojen suodattamiseksi, jotta voidaan ennustaa paras “luokittelu”, jonka käyttäjä antaisi tuotteelle. Antaaksesi sinulle kontekstin, muistatko kuuluisan Netflix-palkinnon? Kilpailu, joka houkutteli tuhansia kehittäjiä ympäri maailmaa. Tehtävänä oli tehdä yrityksen suositusmoottorista 10 % tarkempi.
Saatavilla on monia avoimen lähdekoodin suosittelujärjestelmän kirjastoja, jotka auttavat sinua pääsemään alkuun suositusmallin ensimmäisellä käyttöönotolla. Tässä on kuusi parasta GitHubissa saatavilla olevaa python-kirjastoa.
Recmetriics
Suositusjärjestelmän algoritmin oppiminen olisi täydellinen vain arviointimittareiden kanssa. Recmetrics on listalle saavutettavissa oleva arviointimetriikan ja diagnostisten työkalujen kirjasto suositusjärjestelmille. Paketti sisältää monia suositusjärjestelmän arviointimittareita, kuten:
- Pitkän hännän juoni
- Kattavuus
- Uutuus
- Mukauta
- Intralistinen samankaltaisuus
Paketin asentaminen edellyttää vain seuraavan koodin suorittamista:
pip-asennusremetriikka
Jos haluat lisätietoja, tarkista sen dokumentaatio täältä.
Yllätys
Surprise on avoimen lähdekoodin Python-paketti suositusjärjestelmän rakentamiseen luokitustietojen perusteella. Nimi on lyhenne sanoista Simple Python RecommendatIon System Engine. Paketti sisältää kaikki tarvittavat työkalut järjestelmän rakentamiseen – tietojoukon lataamisesta, ennustealgoritmin valinnasta ja mallin arvioinnista.
Paketin asentaminen edellyttää vain seuraavan koodin suorittamista:
pip install scikit-surprise
Jos haluat lisätietoja, tarkista sen dokumentaatio täältä.
DeepCTR
DNN-pohjaisia tekniikoita on käytetty laajalti napsautussuhteen ennustetehtävissä. Tämä on helppokäyttöinen ja modulaarinen paketti syvään oppimiseen perustuvia CTR-malleja, joissa on useita ydinkomponenttikerroksia, joiden avulla voit helposti rakentaa mukautettuja malleja.
Voidaan käyttää mitä tahansa monimutkaista mallia mallin.fit(), ja model.predict() kanssa.
DNN-pohjaisissa napsautussuhteen ennustemalleissa on yleensä seuraavat neljä moduulia:
- Syöttö ja upottaminen
- Matala- ja korkealaatuinen
- Ominaisuuspoimija
- Ennustus
Jos haluat lisätietoja siitä, voit tarkistaa sen dokumentaation täältä.
OpenRec
OpenRec on avoimen lähdekoodin kirjasto neuroverkon inspiroimille suositusalgoille. Jokainen suosittelija mallinnetaan laskennallisena graafina, joka koostuu rajapintojen kautta kytkettyjen uudelleenkäytettävien moduulien rakenteellisesta kokonaisuudesta. Kirjasto rakennettiin helpottamaan neurosuosittajien laajentamista ja mukauttamista heterogeenisiin suositusskenaarioihin, joissa eri käyttäjien, kohteiden ja kontekstuaaliset tietolähteet on sisällytettävä. Ennen kuin asennat OpenRecin, asenna TensorFlow-taustaosa (suositellaan GPU-versiota).
Paketin asentamiseksi sinun on suoritettava seuraava koodi (PyPI-suositus):
pip install openrec
Saat lisätietoja tutustumalla sen dokumentaatioon täältä.
fastFM
fastFM on akateeminen projekti, jonka avulla Pythonissa (2.7 & 3.x) voidaan käyttää faktorointikoneita tunnetun scikit-learn API:n kanssa. Kaikki suorituskykykriittiset koodit on kirjoitettu C-kielellä ja kääritty Cythonilla. fastFM tarjoaa stokastisen gradientin laskeutumisen (SGD) ja koordinaattilaskennan (CD) optimointirutiineja sekä Markov Chain Monte Carlon (MCMC) Bayesin päättelyä varten.
Saat lisätietoja tutustumalla dokumentaatioon tästä.
LightFM
LightFM toteuttaa erilaisia suositusalgoritmeja implisiittisille ja eksplisiittisille palautetyypeille. Sen avulla käyttäjät voivat sisällyttää nimikkeiden ja käyttäjien metatiedot perinteisiin matriisifaktorointialgoritmeihin, jolloin on mahdollista yleistää uusiin tuotteisiin (tuoteominaisuuksien kautta) ja uusiin käyttäjiin (käyttäjäominaisuuksien kautta).
Saat lisätietoja tutustumalla dokumentaatioon tästä.