Gekissimo.net - Opi ansaitsemaan rahaa webilläsi Internetissä!

Kuinka rakentaa parempia datatuotteita

Seuraava artikkeli auttaa sinua: Kuinka rakentaa parempia datatuotteita

Neeraj Gehani, dunnhumbyn tuotejohtaja, esitti tuoteajattelunsa MLDS:n (Machine Learning Developers Summit) neljännessä painoksessa istunnon “Emergence of Data Products” aikana. Hän selvitti syitä datatuotteiden kasvavaan merkitykseen, datatuotteiden tyyppejä, rakennustietotuotteiden puitteita ja rakennustietotuotteiden ainutlaatuisia haasteita.

Datatuotteet

”Arvotoimitus on personointia. Kilpailuedun näkökulmasta kyse on asiakkaiden säilyttämisestä, kannattavuudesta tai tietojen käyttämisestä kilpailuedun luomiseen liiketoiminnalle. Ja strategisen eriyttämisen näkökulmasta katsottuna yrityksillä on ainutlaatuiset tietoresurssit, ainutlaatuiset algoritmit tai liiketoimintamallit, ja kaikki nämä asiat yhdessä luovat datatuotteiden makua”, Gehani sanoi.

Dataa on kolmenlaisia: raakadata, aggregoitu data ja data ML-malleista. Kaikki sisäiseen käyttöön tarkoitetut tapahtumatietojen muodossa olevat tiedot – esimerkiksi Google Cloudiin, Amazon s3:een, Microsoft Azureen jne. tallennetut tiedot – ovat raakadataa. Datan rakentavat tai ylläpitävät tietosuunnittelijat. Kehityksen seuraava taso on kootun datan ympärillä, jonka avulla luodaan hallintapaneeleja oivallusten saamiseksi. Tällaiset tietojoukot ovat sisäisiä. Kojelaudat tarjoavat näkemyksiä tai raportteja päätöksentekoa varten: Tietojoukot ovat tyypillisesti luotuja ja ylläpitämiä yritysanalyytikoiden toimesta kehittäjien tuella. Automatisoidut alustat, kuten Optimizely, tuottavat dataa automatisoidusti testausta, mallin telemetriaa jne. varten. Tällaisia ​​alustoja rakentavat ja ylläpitävät datatieteilijät ja koneoppimisinsinöörit.

Tieto-ohjautuva

Viime aikoina toimittajat kehittävät paljon työkaluja infrastruktuurin puolelta koneoppimispuolelle, analyytikkopuolelle, yrityssovelluksiin, tietoturvatietosarjoihin jne.

“Kehittäjäyhteisö on panostanut voimakkaasti asiaankuuluvien taitojen oppimiseen markkinoiden kysynnän hyödyntämiseksi. Monet ihmiset suorittavat data-analyysin, SQL:n, Pythonin ja ML:n kursseja. Itse asiassa toukokuusta 2019 toukokuuhun 2020 koneoppimiskurssien ilmoittautumisten kokonaismäärä on kasvanut 300 %. Mutta tutkimuksen mukaan alle 40 % organisaatioista hallitsee dataa liiketoiminnan voimavarana ja luo tietovetoisen organisaation”, Gehani kertoi.

Katkaisu on käsin kosketeltava. Toimittajat ottavat käyttöön datatuotteita ja kouluttavat yhteisöä. Mutta kun on kyse tietovetoisen organisaation luomisesta, datavetoisen kulttuurin luomisesta tai datan hallinnasta liiketoiminnan voimavarana, luvut eivät ole positiivisia. Jokin on todella pielessä sen suhteen, miksi yritykset eivät saa sellaista arvoa, jota he odottaisivat tietojoukoilta.

🔥 Empfohlen:  Kuinka selata Internetiä nimettömästi vuonna 2023

Parempi RoI

Siiloissa työskentelyn sijaan on tärkeää rakentaa suhteita yritysryhmien kanssa. Ratkaisun näkökulmasta datatieteilijöiden, kehittäjien ja koneoppimisinsinöörien on alettava toimia tuoteajattelulla.

Kun kehittäjät ovat rakentaneet mallin ja kojelaudan, on tärkeää jatkaa tuotteen iterointia, jotta ne pysyvät merkityksellisinä. Tämä liittyy tuoteajatteluun, joka liittyy arvoketjun päähän ulottuvaan ajatteluun. “Luulen, että tämä on jotain, mikä yhteisöstämme puuttuu. Se alkaa siitä, että liiketoimintaongelmat määritellään erittäin korkealla tasolla mitkä ovat tavoitteet, mitkä ovat käyttötapaukset? Mitkä ovat benchmarkingin menestyskriteerit?” sanoi Gehani.

Vaikka datatieteilijät ovat määritelleet liiketoimintaongelman, on tärkeää ymmärtää data sen suhteen, onko oikeaa tietoa saatavilla, tunnistaa laadun puutteet, siivota tiedot, etsiä esimerkiksi puuttuvia arvoimputaatioita, merkitä kaikki ne. asioita sekä ominaisuussuunnittelua. Sitten, kun mallin kehittäminen on tärkeää ennustaville tuotteille, on kyse mallinnustekniikoiden valinnasta mallien rakentamiseen ja sitten mallien arvioimiseen.

”Yritän korostaa sitä, että yhteisönä olemme mielestäni hyvin, hyvin siiloissa. Meillä on siis ihmisiä, jotka keskittyvät ymmärtämään dataa ja varmistamaan, että data on asetettu menestykseen. He ovat keskittyneet mallien kehittämiseen, mutta ihmiset, jotka ajattelevat päästä päähän -arvoketjua, ovat rajallisia. sanoi Gehani. “Joten pelkkä tiedemallin rakentaminen ei auta. Sinun on mietittävä tämä päästä päähän ja mietittävä kaikkia alueita, joilla integraatioita tapahtuu.

Table of Contents