Seuraava artikkeli auttaa sinua: Miksi suositusjärjestelmien oikeudenmukaisuutta vaaditaan?
Me kaikki hyödynnämme tai teemme ehdotuksia jokapäiväisessä elämässämme. Koneoppiminen auttaa toistamaan saman ehdotusmekanismin, joka on järjestelmä, joka suodattaa ei-toivotut tiedot ja antaa erilaisia tuloksia, jotka perustuvat erillisiin ominaisuuksiin, jotka vaihtelevat käyttäjästä toiseen. Suosittelemalla nämä suosittelujärjestelmät voivat toisinaan olla puolueellisia tai epäreiluja; harha voi olla missä tahansa muodossa, kuten mallipoikkeama tai datapoikkeama. Tämä artikkeli keskittyy keskusteluun kohteiden oikeudenmukaisuudesta ja kohteiden oikeudenmukaisuudesta suositusjärjestelmissä. Tässä artikkelissa käsiteltävät aiheet ovat seuraavat.
Sisällysluettelo
- Lyhyesti Recommender-järjestelmästä
- Oikeudenmukaisuuden tarve suositusjärjestelmässä
- Oikeudenmukaisuus suositusjärjestelmässä
- Kuluttajan oikeudenmukaisuus
- Tarjoajan oikeudenmukaisuus
Suositusjärjestelmät auttavat meitä arvioinnissa kirjojen valinnasta ystävien valintaan. Tutustu suositusjärjestelmiin tarkemmin.
Lyhyesti Recommender-järjestelmästä
Recommender-järjestelmät (RS) toimittavat tuoteehdotuksia kuluttajille tekoäly-ideoita hyödyntäen. Verkkokirjakauppa voi esimerkiksi käyttää koneoppimisalgoritmia kirjojen luokitteluun genren mukaan ja lisäkirjojen ehdottamiseen asiakkaalle, joka haluaa ostaa kirjan.
Recommender-järjestelmät luokitellaan kolmeen tyyppiin niiden tietojen perusteella, joihin ne perustuvat: yhteistoiminnallinen, sisältöpohjainen ja hybridisuodatus.
- Käsiteltäessä tietoja ehdotusta varten, yhteiskäyttöinen suosittelujärjestelmä arvioi käyttäjätiedot. Esimerkiksi käyttämällä verkkomusiikkikaupan käyttäjäprofiileja RS voi saada tietoja, kuten kaikkien käyttäjien iän, maan ja kaupungin sekä heidän ostamansa kappaleet. Näiden tietojen avulla järjestelmä voi tunnistaa henkilöt, joilla on samanlainen musiikkimaku, ja sitten suositella kappaleita, joita samanlaiset käyttäjät ovat ostaneet.
- Sisältöpohjaista suodatusta käyttävä suositusjärjestelmä tekee ehdotuksia niiden nimiketietojen perusteella, joihin sillä on pääsy. Harkitse tapausta, jossa henkilö etsii uutta tietokonetta verkkokaupasta. Kun käyttäjä etsii tiettyä tietokonetta (kohdetta), RS kerää tietoja kyseisestä tietokoneesta ja etsii tietokannasta koneita, joilla on vertailukelpoisia ominaisuuksia, kuten hinta, suorittimen nopeus ja muistikapasiteetti. Tämän haun tulokset palautetaan sitten käyttäjälle ehdotusten muodossa.
- Suositusjärjestelmä, joka yhdistää kaksi edellistä luokkaa hybridisuodatusstrategiaksi, joka suosittelee asioita käyttäjä- ja tuotetietojen perusteella. Esimerkiksi sosiaalisen verkoston suositusjärjestelmä voi suositella käyttäjän kanssa samankaltaisia profiileja (collaborative filtering) vertaamalla heidän kiinnostuksen kohteitaan. Myöhemmässä vaiheessa järjestelmä voi käsitellä suositeltuja profiileja asioina ja siten päästä niiden tietoihin etsiäkseen uusia vertailukelpoisia profiileja (sisältöpohjainen suodatus). Molemmat profiilisarjat palautetaan lopulta ehdotuksina.
Tavanomaisen suositusprosessin lisäksi, jossa käyttäjille näytetään kohteita, joista he saattavat olla kiinnostuneita, suosituksia voidaan tehdä monella eri tavalla.
Kontekstitietoisia ehdotuksia luodaan sen kontekstin perusteella, johon käyttäjä on sijoitettu. Konteksti on kokoelma tietoja käyttäjän tämänhetkisestä tilasta, kuten aika hänen nykyisessä sijainnissaan (aamu, iltapäivä, ilta) tai hänen toimintojaan (joutokäynti, juoksu, nukkuminen). Analysoitavan kontekstitiedon määrä on suuri, mikä tekee kontekstitietoisista ehdotuksista vaikean tutkimusaiheen.
Riskitietoiset suositukset ovat osa kontekstitietoisia ehdotuksia, jotka ottavat huomioon skenaarion, jossa olennaista tietoa, kuten käyttäjän tärkeitä tietoja, on saatavilla. Se on riskitietoinen, koska huono päätös saattaa vaarantaa käyttäjän hengen tai aiheuttaa todellista vahinkoa. Joihinkin tapauksiin kuuluu käyttäjän neuvominen siitä, mitä lääkkeitä hänen tulee ottaa tai mitä osakkeita ostaa, myydä tai sijoittaa.
Etsitkö täydellistä arkistoa tietotieteessä käytettävistä Python-kirjastoista, katso tästä.
Oikeudenmukaisuuden tarve suositusjärjestelmässä
Suositusjärjestelmä on rakennettu palautesilmukalle, jossa on kolme ehdokasta: käyttäjä, data ja malli. Näitä ehdokkaita käytetään kolmessa eri vaiheessa.
- Kokoelma: Tämä tarkoittaa vaihetta, jossa kerätään tietoja käyttäjiltä, mukaan lukien käyttäjäkohteiden vuorovaikutus ja muut satunnaiset tiedot (esim. käyttäjäprofiili, nimikkeen attribuutit ja kontekstit).
- Oppiminen: Tämä viittaa kerättyihin tietoihin perustuvien suositusmallien kehittämiseen. Perustamisestaan se ennustaa, kuinka todennäköisesti käyttäjä omaksuu kohdetuotteen aikaisempien kohtaamisten perusteella. Viime vuosikymmeninä on tehty paljon tutkimusta.
- Tarjoilu: Tämä vaihe toimittaa ehdotustulokset käyttäjille heidän tietotarpeidensa täyttämiseksi. Tämä vaihe vaikuttaa käyttäjien tulevaan käyttäytymiseen ja päätöksiin.
Nämä ovat vaiheita, joissa järjestelmään tuodaan harhoja, joiden vuoksi suositusjärjestelmä voi olla epäreilu joko subjektille tai objektille. Sukellaan syvälle suositusten oikeudenmukaisuuteen ja ymmärretään ongelmien perimmäiset syyt ja ratkaisut.
Oikeudenmukaisuus suositusjärjestelmässä
Oikeudenmukaisuuden saavuttamiseksi yleinen tekniikka on määrittää muuttuja tai muuttujat, jotka osoittavat kuulumisen suojattuun luokkaan, kuten rotu työelämässä, ja rakentaa algoritmeja, jotka poistavat tähän muuttujaan liittyvät ennakkoluulot. Jotta voisimme soveltaa tätä lähestymistapaa suositusjärjestelmiin, meidän on tunnustettava personoinnin kriittinen merkitys. Ehdotuksen käsite merkitsee sitä, että parhaat asiat yhdelle käyttäjälle voivat poiketa toiselle. On myös syytä huomata, että on olemassa suosittelujärjestelmiä, jotka auttavat tapahtumia. Tämän seurauksena monet suositushakemukset sisältävät monia sidosryhmiä, ja ne voivat herättää oikeudenmukaisuusongelmia useammalle kuin yhdelle osallistujajoukolle.
Harkitse suositusjärjestelmää, joka ehdottaa työpaikkoja työnhakijoille. Tällaisen järjestelmän ylläpitäjä voi esimerkiksi pyrkiä takaamaan, että mies- ja naiskäyttäjät, joilla on samanlainen pätevyys, saavat työehdotuksia, joilla on vertailukelpoinen asema ja tulot. Tämän seurauksena järjestelmän olisi taisteltava suositusten tulosten harhoja vastaan, mukaan lukien puhtaasti käyttäytymiseroista johtuvia harhoja vastaan: esimerkiksi mieskäyttäjät voivat olla alttiimpia napsauttamaan optimistisesti korkeapalkkaisia paikkoja.
Tällaista harhaa on vaikea voittaa, jos ei ole yksimielisyyttä tavaroiden maailmanlaajuisesta etusijajärjestyksestä. Henkilökohtainen mieltymys on ehdotuksen ydin, erityisesti aloilla, joilla yksilöllinen maku on ratkaiseva, kuten musiikki, kirjallisuus ja elokuvat. Jopa työelämässä jotkut käyttäjät saattavat suosia hieman huonommin palkattua työtä, jos sen mukana tulee lisäetuja, kuten joustavat työajat, lyhyempi matka-aika tai parempia etuja. Palkkaperusteisen työsuosituksen poliittisen tavoitteen saavuttamiseksi toimipaikan ylläpitäjän on mentävä puhtaasti personointiin tähtäävää lähestymistapaa pidemmälle, tunnistettava palkka keskeiseksi tulosmuuttujaksi ja ohjattava suositusalgoritmia, jotta se on herkkä suojattujen palkkojen jakautumiselle. ryhmiä.
Oikeudenmukaisuus vaihtelee sidosryhmien mukaan
Erilaisia suositustilanteita voidaan luonnehtia erilaisilla sidosryhmien etukokoonpanoilla. Suositusjärjestelmän sidosryhmät on jaettu kolmeen kategoriaan: asiakkaat, toimittajat ja alusta tai järjestelmä.
- Kuluttajat ovat niitä, jotka saavat ehdotuksia. He ovat ihmisiä, jotka tulevat alustalle, koska heillä on vaikeuksia tehdä päätöstä tai etsiä jotain, ja he odottavat vinkkejä auttamaan heitä.
- Toimittajat ovat organisaatioita, jotka toimittavat tai muuten tukevat ehdotettuja kohteita ja hyötyvät kuluttajan päätöksestä.
- Alusta on kehittänyt suositusjärjestelmän yhdistämään asiakkaat toimittajiin, ja sillä on jonkinlainen tapa hyötyä prosessista.
Järjestelmällä on lopulta tavoitteet, jotka ovat muiden sidosryhmien hyödyistä riippuvaisia. Kun monipuoliset alustat voivat houkutella ja pitää kriittisiä massaa pelaajia markkinoiden kaikilta puolilta, ne menestyvät. Jos työnhakija ei pidä työllisyysesimerkissämme järjestelmän suosituksia hyödyllisinä, hän voi jättää tämän järjestelmän komponentin huomioimatta tai siirtyä kilpailijan alustalle. Sama pätee palveluntarjoajiin; Jos jokin sivusto ei tarjoa mainoksiaan ehdotuksina tai ei tarjoa sopivia ihmisiä, yritys voi valita toisen alustan työmahdollisuuksiensa julkistamiseksi.
Monipuolisten alustojen suositusmenetelmät saattavat herättää huolta monipuolisesta oikeudenmukaisuudesta. Tarkemmin sanottuna oikeudenmukaisuuteen liittyviä kriteerejä voi olla käytössä useammalla kuin yhdellä liiketoimen puolella, joten kauppaa ei voida arvioida vain toiselle osapuolelle kertyvien tulosten perusteella. Näissä ryhmissä esiintyvien oikeudenmukaisuuden vaikeuksien perusteella on olemassa kahden tyyppisiä järjestelmiä: kuluttajien oikeudenmukaisuus ja palveluntarjoajien oikeudenmukaisuus.
Kuluttajan oikeudenmukaisuus
Oikeudenmukaisuus on syrjimättömyyden käsite, joka perustuu suojeltuihin ryhmiin kuulumiseen ja jonka määrittelee suojattu piirre, kuten sukupuoli ja ikä. Asiakaskohtaisessa suosittelujärjestelmässä otetaan huomioon ehdotuksen erilainen vaikutus suojattuihin suosituskuluttajiin.
Ryhmän oikeudenmukaisuus on tietyn ryhmän syrjinnän puutetta, joka määritellään eron puuttumiseksi niille luotuihin tuloksiin. Monien sidosryhmien osallistumisesta huolimatta suositusjärjestelmien oikeudenmukaisuudella voi olla erityisen kielteinen vaikutus kuluttajiin ehdotuksia saaviin henkilöihin. Tämän seurauksena ryhmien kuluttajien oikeudenmukaisuus ei saisi ottaa huomioon suositusten suhteetonta vaikutusta suojeltuihin kuluttajaryhmiin. Tämän kiinteistön takaaminen on kriittinen strateginen tavoite alan vastuullisen edistymisen kannalta.
Luottokorttiyritys suosittelee asiakkaiden luottotarjouksia motivoivassa esimerkissä. Koska tuotteet ovat kaikki samasta pankista, tuottajan oikeudenmukaisuuden kanssa ei ole vaikeuksia. Tällaisissa järjestelmissä ei ole monia sidosryhmiä koskevia näkökohtia. Useita malleja voidaan tarjota. Yksi kiehtova vaihtoehto on luoda reilun luokituksen periaatteeseen perustuva suositusjärjestelmä. Voimme luoda kartoituksen jokaisesta käyttäjästä prototyyppitilaan, mahdollisesti käyttämällä luokitustiedoista haettuja piileviä ominaisuuksia. Jokainen prototyyppi voidaan suunnitella siten, että sillä on tilastollinen pariteetti suojatun luokan suhteen. Tämän tyyppisen järjestelmän olennainen piirre on rajallisen menetyksen varmistaminen tulon suhteen.
Jotkut kuluttajan oikeudenmukaisuuden algoritmit
- HOIKKA: Epäoikeudenmukaisuuden vähentämiseksi ehdotettiin, että luodaan ehdotuksia käyttäjälle naapurustosta, jossa on yhtä monta vertaista kustakin luokasta. SLIM-järjestelmään lisättiin säännöstely, yhteistyöhön perustuva suodatusmenetelmä tasapainon luomiseksi suojattujen ja suojaamattomien naapureiden välille. Oikeudenmukaisuutta testattiin riskisuhdeversiolla; tämä pistemäärä on pienempi tai suurempi kuin 1, kun suojatulle ryhmälle ehdotetaan vähemmän halutun genren elokuvia; keskimäärin 1 tarkoittaa täydellistä tasapuolisuutta.
- Piilevä lohkomalli: Sen tarkoituksena on tarjota oikeudenmukaisia suosituksia ryhmittelemällä ihmisiä ja tavaroita samalla kun säilytetään tilastollinen pariteetti joidenkin arkaluonteisten ominaisuuksien osalta. Se käyttää ordinaalista regressiomallia, jonka syötteinä on herkkiä ominaisuuksia. Oikeudenmukaisuus määritettiin varmistamalla, että saman valinnan tehneiden käyttäjien osuus kaikissa väestöryhmissä oli sama kahdessa tuotteessa.
- NLR: Alustan sitoutumisen asteen perusteella kehittäjä arvioi kuluttajien epäoikeudenmukaisuutta käyttäjäryhmien (enemmän tai vähemmän aktiivisten) keskuudessa. Lieventämiseksi käytettiin uudelleensijoitustekniikkaa, jonka tavoitteena oli valita kohteet kunkin käyttäjän perustason top-n-luettelosta yleisen suositushyötyohjelman optimoimiseksi. Malli rajoittui minimoimaan eron keskimääräisessä suositusten tehokkuudessa käyttäjäryhmien välillä.
- Satunnaisotos ilman vaihtoa: Kehittäjä otti uudelleen otoksia käyttäjien vuorovaikutuksista koulutussarjassa siten, että käyttäjien vuorovaikutusten esitys ryhmien välillä oli tasapainossa, ja koulutti sitten uudelleen suositusmallit tasapainoisella koulutusjoukolla. Lieventäminen sisälsi suositusmallin kehittämisen vähentämällä eroja aitojen ja odotettujen arvioiden välillä ja maksimoimalla samalla riippumattomuuden ennusteiden ja arkaluonteisten merkintöjen välillä. MAE:tä käytettiin ennustevirheiden laskemiseen. Riippumattomuuden arvioinnissa käytettiin ryhmien välisten odotettujen luokitusjakaumien yhtäläisyyttä.
Tarjoajan oikeudenmukaisuus
Palveluntarjoajan oikeudenmukainen järjestelmä on järjestelmä, jossa oikeudenmukaisuus on säilytettävä yksinomaan palveluntarjoajia varten. Harkitse online-mikrorahoitusportaalia, joka kerää lainapyyntöjä kenttäkumppaneilta ympäri maailmaa, jotka lainaavat pieniä summia paikallisille yrittäjille. Lainoja sponsoroivat korottomasti järjestön jäsenet, joista suurin osa asuu maassa. Organisaatiolla ei tällä hetkellä ole räätälöityä suositustoimintoa, mutta jos se tarjoaisi, voisi kuvitella, että yksi organisaation tavoitteista olisi säilyttää rahan tasapuolinen jakautuminen monien kumppaneidensa kesken tunnettujen käyttäjien ennakkoluulojen edessä. Ehdotusten kuluttajat ovat yksinkertaisesti osallistujia, jotka eivät saa suoraa etua järjestelmästä, joten kuluttajan oikeudenmukaisuusongelmia ei ole.
Kun on kiinnostusta edistää markkinoiden vaihtelua ja estää monopolistinen herryys, P-reilu voi myös olla yksi tekijä. Esimerkiksi verkkokäsityömarkkinapaikalla Etsy järjestelmä saattaa haluta taata, että uudet tulokkaat saavat kohtuullisen osan suosituksia, vaikka heillä on vähemmän kuluttajia kuin vakiintuneilla kauppiailla. Tällaista oikeudenmukaisuutta ei vaadita laissa, vaan se on rakennettu alustan talousmalliin.
Palveluntarjoajan oikeudenmukaisuus (P-fairness) sisältää vaikeuksia, joita kuluttajan oikeudenmukaisuus (C-fairness) ei sisällä. Etenkin P-reilun esimerkin tuottajat ovat passiivisia; he eivät etsi ehdotusmahdollisuuksia, vaan heidän on sen sijaan odotettava, että käyttäjät tulevat järjestelmään ja pyytävät suosituksia.
Harkitse edellistä työllisyysesimerkkiä. Haluamme, että vähemmistöomisteisissa yrityksissä olevia tehtäviä ehdotetaan korkeasti koulutetuille henkilöille samaan tahtiin kuin työpaikkoja muissa yrityksissä. Mahdollisuus ehdottaa tiettyä vähemmistöomisteista yritystä hyväksyttävälle hakijalle on harvinainen, ja se on tunnustettava sellaisena. Haluamme rajoittaa suojattujen palveluntarjoajien mainonnan mukanaan tuomaa personoinnin menetystä, kuten teimme C-fairness-esimerkissä.
Monimuotoisuustietoisissa järjestelmissä suositus on usean tavoitteen mukainen optimointiongelma, jonka tavoitteena on säilyttää tietty tarkkuustaso ja samalla varmistaa, että suositusluettelot vaihtelevat jonkin tuotteen sisällön esityksen suhteen. Näitä strategioita voidaan käyttää uudelleen P-reiluussuosituksiin katsomalla suojatun ryhmän kohteita erillisenä luokkana ja optimoimalla sitten erilaisia ehdotuksia tämän muuttujan suhteen.
Yksilöllisen P-oikeudenmukaisuuden kattavuuden saavuttamiseksi tarvitaan dynaamisempi lähestymistapa ehdotusmahdollisuuksien hallintaan. Vastaavin analogi löytyy ehkä näyttömainonnan verkkohinnoittelusta, jossa rajoitetut mainoskulut hajottavat näyttökertoja kilpailevien mainostajien kesken. Yksilöllinen P-oikeudenmukaisuus saavutetaan tässä skenaariossa mukautetun mekanismin rajoitusten puitteissa tarjoamalla suojatulle ryhmälle yhtäläinen ostovoima suojaamattomalle ryhmälle.
Johtopäätös
Suositusjärjestelmä voi olla epäreilu käyttäjän tai palveluntarjoajan puolelta. Suositusjärjestelmä on oikeudenmukainen, kun se ottaa huomioon ehdotuksen erilaisen vaikutuksen suojattuihin suosituskuluttajaluokkiin sekä suojaa myös järjestelmän tarjoajan tavoitetta. Tämän artikkelin avulla olemme ymmärtäneet suositusjärjestelmän oikeudenmukaisuuden käsitteen sekä kuluttajalta että palveluntarjoajalta.