Gekissimo.net - Opi ansaitsemaan rahaa webilläsi Internetissä!

Kyselyn rentoutuminen ja kattavuus osana semanttista hakua

Seuraava artikkeli auttaa sinua: Kyselyn rentoutuminen ja kattavuus osana semanttista hakua

Oikea hakukysely on Goldilocks-tyylinen pyrkimys: ei liian tarkka, jotta et saisi tuloksia, eikä liian laaja, jotta saisit liian monta.

Semanttisen haun tarkoituksena on puolestaan ​​ymmärtää, mitä hakijat heittävät hakukenttään.

Toisin sanoen semanttisella haulla tapaamme etsijät siellä, missä he ovat sen sijaan, että vaadimme heidän tapaavan meidät siellä, missä olemme.

Anna kyselyn lievennys ja kyselyn laajuus.

Hakukoneet ohjaavat etsijät oikeaan sisältöön heti käyttämällä synonyymeja, hakusanan poistoa ja kyselyn laajuutta.

Vältämme menettämästä olennaista tietoa, joka ei muuten näkyisi, ja jätämme pois tiedot, jotka eivät ole olennaisia.

Kyselyn rentoutuminen ja kattavuus liittyvät hyvin läheisesti tarkkuuden ja muistamisen käsitteeseen.

Tarkkuus mittaa, ovatko palautetut tulokset merkityksellisiä, ja muistaminen on, palautetaanko asiaankuuluvat tulokset.

Yksi tapa lisätä muistamista erityisesti on kyselyn laajentaminen.

Kyselyn laajennus

Kyselyn laajennuksessa pyritään laajentamaan kyselyä ja toivomaan parempia tuloksia.

Pääsyy, miksi hakukone saattaa käyttää kyselyn laajennusta, johtuu jostain osoituksesta, että “perus”hakutulokset ilman kyselyn laajennusta eivät olisi hakijan kannalta tyydyttäviä.

Tässä sarjassa olemme jo nähneet tapoja laajentaa kyselyitä.

Kirjoitusvirheiden toleranssi, monikon huomioimatta jättäminen sekä stemming ja lemmatisointi ovat kaikki tapoja lisätä hakujen muistamista.

Olemme jo nähneet nämä kyselyn laajennusmenetelmät haun peruskallioissa, mutta myös muut kyselyn laajennusmenetelmät ovat yhtä tärkeitä.

Search Engine Journalin artikkeli vuodelta 2008 kattaa, kuinka Google suorittaa kyselyn laajentamisen!

Artikkelissa käsitellään johdos- ja kirjoitusvirhetoleranssin lisäksi myös käännöksiä, sananpoistoja ja synonyymejä.

Synonyymit ja vaihtoehdot

On syy, miksi George Orwell esitteli Newspeakin romaanissaan 1984 ja miksi se resonoi tarinassa elämästä, joka on täysin hallittua tylsyyteen asti.

Kielellistä rikkautta ohjaa kyky sanoa sama asia tai lähes sama asia eri sanoilla ja ilmauksilla. “Hieno” voi olla “mahtavaa” ja “halpa” on “halvan” läheinen naapuri.

Samaan aikaan nämä erilaiset sanat voivat auttaa meitä viittaamaan tarkemmin esineisiin, jotka ovat samankaltaisia ​​kaikilta paitsi pienimmiltä tavoilta.

Nämä erot ovat joskus niin pieniä, että tämä tarkkuus sen sijaan aiheuttaa hämmennystä ja vähemmän todennäköistä, että löydämme haluamamme.

Asiakas, joka haluaa keinutuolia, ei välttämättä tiedä, pitäisikö hänen etsiä sanalla “keinutuolit”, “keinutuolit” vai “tuolit”.

Tässä synonyymit ja vaihtoehdot tarjoavat arvoa.

Niiden avulla voimme laajentaa muistamista hakutuloksissa.

Synonyymit ja vaihtoehdot ovat samankaltaisia, mutta ne eivät ole samoja.

(Voisi sanoa, että ne eivät ole synonyymejä.)

Synonyymit viittaavat kahteen sanaan tai lauseeseen, jotka tarkoittavat samaa asiaa.

Vaihtoehdot viittaavat sen sijaan samankaltaisiin sanoihin tai lauseisiin, mutta niillä on jonkin verran eroja.

Synonyymit

Usein synonyymit pääsevät hakukoneeseen synonyymiluetteloiden kautta.

Nämä luettelot voivat olla peräisin ennalta määritetyistä luetteloista, kuten yleisistä verkkokauppatermeistä.

Ennalta määritettyjen luetteloiden ongelmana on, että yhden yrityksen hakukoneen synonyymit eivät välttämättä toimi toisessa.

Quick: Mikä on konsoli? Saatat heti ajatella videopelejä, mutta joku muu saattaa ajatella autoa tai musiikkia.

🔥 Empfohlen:  Kyselyn pyöreän pöydän arvostelu: huijaus vai laillinen kyselysivusto?

Tästä syystä monet synonyymiluettelot luodaan talon sisällä.

Haun toteutusprosessin alussa sisäiset aiheasiantuntijat miettivät kaikkia sanoja, jotka voisivat olla synonyymejä muille sanoille, ja lisäävät ne hakukoneen kokoonpanoon.

(Tämä on todellisuudessa usein idealisoitu näkemys siitä, mitä tapahtuu. Usein synonyymiluettelon luoja ei ole aiheen asiantuntija, vaan hakukoneen toteuttaja.)

Yleensä tämä alkuperäinen luettelo on hyvä lähtökohta, mutta synonyymejä puuttuu varmasti.

Ainoa todellinen tapa selvittää, mitä termejä hakijat käyttävät, on antaa heidän etsiä.

Analyysin käyttö synonyymien löytämiseen

Näet hyvin nopeasti analytiikkakyselyissäsi, jotka voivat käyttää uusia synonyymejä.

Nämä kyselyt palauttavat nollaa tulosta ja ovat merkki siitä, että hakijat etsivät jotain, jota he eivät löydä.

Nyt kaikki nämä kyselyt eivät anna sinulle uutta synonyymiä.

Joskus etsijät etsivät kohteita, joita sinulla ei vain ole.

Siitä huolimatta näet kyselyitä, joissa ajattelet heti: “Oi, meillä on sellainen” ja “En tiennyt, että ihmiset pyysivät sitä tällä tavalla.”

Joskus kysely palauttaa tulokset, mutta ei sitä, mitä hakija haluaa.

Nämä kyselyt voivat myös antaa ideoita synonyymeille, jos seuraat “haun tarkennuksia”.

Haun tarkennukset edustavat sitä, kun hakijat tekevät hakuja ja tekevät sen sitten uudelleen.

Tämä tarkoittaa, että etsijät eivät löytäneet haluamaansa ensimmäistä kertaa ja yrittivät uudelleen löytää jotain parempaa.

Joku, joka etsii “Dell-kannettavaa” ja seuraa sitä “Dell-kannetulla”, sanoo, että “kannettava tietokone” ja “kannettava” liittyvät toisiinsa, mutta hakutulokset “kannettavalle” olivat riittämättömät.

Vaikka ei ole mitään väärää etsiä näitä trendejä analytiikasta manuaalisesti (voi olla hyvä harrastus siirtyä hitaasti työviikkoon), olet paljon tuottavampi, jos sinulla on järjestelmä, joka hankkii ne ennakoivasti puolestasi.

Jotkut järjestelmät saattavat jopa käyttää synonyymejä puolestasi, mutta tämä ei aina ole hyödyllistä.

Ihminen voi havaita tarkennuksia, jotka eivät näytä kelvollisia synonyymejä, tai voi nähdä, että järjestelmä ehdottaa väärää synonyymityyppiä.

Synonyymien tyypit

Aivan oikein: Synonyymejä on erilaisia.

Tämä käsite saattaa aluksi tuntua oudolta, mutta se ei todennäköisesti ole kaukana siitä, kuinka useimmat ihmiset ajattelevat niistä.

“Kaksisuuntainen” on ensimmäinen synonyymityyppi. Nämä synonyymit korvaavat suoraan toisiaan.

“Pieni” ja “mini” ovat toistensa kaksisuuntaisia ​​synonyymejä.

Sanojen ei tarvitse olla täydellisiä korvikkeita, mutta ne voivat olla riittävän lähellä toisiaan, jotta ihmiset voivat käyttää toisiaan.

Esimerkiksi “köysi” ja “merkkijono” eivät kuvaa samaa asiaa, mutta ne ovat tarpeeksi lähellä ollakseen kelvollisia kaksisuuntaisia ​​synonyymejä.

Voi olla hyödyllistä ajatella synonyymien avulla luotua kyselyä.

Jos otamme kyselyn “pieni juustopizza” ja laajennamme sitä, voit ajatella kyselyä nyt muodossa “(pieni tai mini) ja juusto ja pizza.”

“Yksisuuntainen” on seuraavan tyyppinen synonyymi.

Tätä tyyppiä käytetään usein sanoille, jotka viittaavat suurempaan luokkaan kuuluvaan esineeseen.

“PlayStation” on eräänlainen videopelikonsoli, mutta “konsoli” ei ole “PlayStation”-tyyppi.

Jos lisäät hakukokoonpanoon yksisuuntaisen synonyymin, voit saada PlayStationin näkyviin aina, kun joku tekee haun “konsoli”.

🔥 Empfohlen:  GSM-osakelista kansallisessa pörssissä

Miksei näiden kahden termin kaksisuuntainen synonyymi?

Koska kaksisuuntaiset synonyymit ovat transitiivisia.

Jos termi yksi ja termi kaksi ovat kaksisuuntaisia ​​synonyymejä ja termit kaksi ja kolme ovat kaksisuuntaisia ​​synonyymejä, termit yksi ja kolme ovat kaksisuuntaisia.

Suoremmassa esimerkissä “PlayStation” ja “console” ja “Xbox” ja “console” kaksisuuntaisten synonyymien ryhmänä tarkoittaisivat, että “PlayStation” ja “Xbox” ovat synonyymejä, ja hakijat näkisivät Playstationin etsiessään Xboxit ja päinvastoin.

“Vaihtoehtoiset korjaukset” on viimeinen tyyppi.

Näitä käytetään, kun sanat eivät korvaa tarkasti toisiaan ja haluat tarkan vastaavuuden näkyvän vaihtoehtoa korkeammalla.

Voit esimerkiksi sanoa, että “housut” ovat vaihtoehto “shortseille”, mutta kun joku tekee haun sanalla “shortsit”, kaikkien shortsien pitäisi näyttää korkeammalta kuin housut yleensä.

Kaikki synonyymityypit laajentavat luonteeltaan muistamista.

Osuma tarkkuuteen tulisi kuitenkin olla minimaalinen, koska nämä synonyymit ovat “osoittimia” samanlaisiin käsitteisiin.

Odotat parempaa hakukokemusta loppukäyttäjälle.

Pyydä sanan poistoa

Joskus hakijat käyttävät kyselyä, joka ei palauta mitään, koska kysely oli liian tarkka tai käytti sanaa, jota ei ollut missään tietueessa.

Poista yksi sana tai kaksi sanaa kyselystä, niin täysin kunnolliset tulokset palaavat.

Tämä on hyvä aika käyttää hakusanan poistoa.

Lopeta Sanat

Ehkä yleisin hakusanan poistovaihe on lopetussanojen poistaminen.

Pysäytyssanat ovat hyvin yleisiä sanoja, jotka antavat viestinnässä merkityksen, mutta eivät auta hakemisessa. Sanat, kuten “the” tai “an”, voivat poistaa muuten hyviä osumia.

Tämä on yleisempää luonnolliseen kieleen suuntautuneissa kyselyissä, kuten puhehakukyselyissä.

Esimerkki tästä voisi olla hakusanalla “oranssi paita” tuotehakukoneessa.

Jos hakukone hakee otsikon, värin ja kategorian perusteella, saattaa olla paljon tietueita, joiden kategoriana on “paita” ja värinä “oranssi”, mutta yksikään ei sisällä sanaa “an”.

Tarjoaako sana “an” tässä mitään hyödyllistä tietoa?

Ei, ei, ja hakukone voi poistaa sen turvallisesti tarkkuutta menettämättä.

Toisin kuin synonyymit, et yleensä halua luoda omia lopetussanaluetteloita, ja useimmissa hakukoneissa on ne sisäänrakennettuna kielikohtaisesti.

Joskus kuitenkin haluat laajentaa sisäänrakennettua luetteloa, esimerkiksi jos sinulla on toimialan termi, joka on niin yleinen, että se ei anna kyselylle mitään arvoa.

Sanojen poistaminen, jos ei tuloksia

Sitten on kyselyitä, joissa kaikki sanat tuovat arvoa, mutta yhdessä haetut sanat eivät tuota tuloksia.

Usein etsijät ovat tyytyväisiä vähemmän tarkkoihin tuloksiin vastineeksi lisääntyneestä muistamisesta. Näissä tilanteissa haluamme poistaa sanoja näyttääksemme tulokset käyttäjälle.

On kaksi päätapaa tehdä tämä: tehdä kaikista kyselysanoista valinnaisia ​​tai poistaa sanoja kyselystä.

Jos teet kaikista kyselysanoista valinnaisia, kun tuloksia ei ole, oletetaan, että tietueet, jotka vastaavat useampia sanoja, ovat merkityksellisempiä, kun kaikki muut ovat samat.

Vaihtoehtona on poistaa kyselysanat yksitellen, kunnes löydät vastaavat tietueet tai kyselyssä ei ole enää sanoja jäljellä.

Voit aloittaa poistamalla ensimmäiset sanat tai viimeiset sanat. Viimeisen sanan poistaminen on yleensä yleisempää.

Kaikkien kyselysanojen tekeminen valinnaisiksi ja lajittelu vastaavien sanojen lukumäärän mukaan on yleensä parempi tapa, varsinkin kun se yhdistetään lopetussanojen poistamiseen.

🔥 Empfohlen:  Mikä on SQL? Strukturoidun kyselyn kielen esittely

Tämä on kuitenkin vähemmän ihanteellinen lähestymistapa, kun tarkkuus on tärkeää ja haluat osoittaa, että kaikkia hakusanoja vastaavia tuloksia ei todellakaan löytynyt.

Yksi henkilö voi olla kunnossa nähdessään Uniqlon v-kaula-aukoiset neuleet kyselyssä “Gucci v-neulepuserot”, kun taas toinen pitää näitä tuloksia täysin merkityksettöminä.

Tietenkin toinen skenaario on tietää, mitkä sanat todella tuottavat eniten arvoa kyselylle, ja merkitä ne valinnaisiksi.

Tätä ei yleensä näe avainsanapohjaisissa hakukoneissa, mutta jotkut hakukoneet ovat käyttäneet samanlaista lähestymistapaa lopetussanoihin.

Jotkut hakukoneet ovat esimerkiksi kokeilleet yleisten sanojen diskonttaamista automaattisesti ilman lopetussanaluetteloita käyttämällä käänteistä asiakirjatiheyttä.

Kuten synonyymien kohdalla, kyselysanojen poistaminen laajentaa muistamista, yleensä ilman tarkkuutta. Koska lopetussanat eivät anna paljon arvoa tulokselle, et menetä hyviä tuloksia, jos niitä ei sisällytetä.

Vastaavasti sanojen poistamisella, kun tuloksia ei ole, ei ole tarkkuutta heikentää, koska ei ole tuloksia, jotka voisivat olla tarkkoja.

Kyselyn laajuus

Olemme tarkastelleet ensisijaisesti tilanteita, joissa hakija on liian tarkka ja hakukoneen on laajennettava kyselyä parantaakseen muistamista.

On myös aikoja, jolloin hakukone voi ymmärtää käyttäjän tarkoituksen, ja kyselyn laajuus voi lisätä tarkkuutta.

Hakuasiantuntija Daniel Tunkelang soittaa kyselyn laajuus “yksi tehokkaimmista tavoista saada kyselyn tarkoitus.”

Hän tunnistaa kaksi päävaihetta kyselyn laajuuden määrittämisessä. Ensimmäinen on kyselytunniste, jota seuraa itse laajuus.

Kyselytunnisteet tunnistavat kyselyn osat attribuutteilla, joihin ne todennäköisesti kuuluvat.

Esimerkiksi “Marcia” vastaa todennäköisimmin “name” -attribuuttia, kun taas “The Brady Bunch” vastaa “show title” -attribuuttia.

Kyselyn laajuus ottaa tämän kartoituksen ja rajoittaa näiden kyselyn osien attribuuttihakua.

Hakukone ei etsi “Brady” attribuutin “name” sisällä tai “Marcia” “show title” -attribuutissa.

Tällainen kyselyn laajuus vähentää muistamista, koska emme näe tuloksia, joissa tämä teksti on muissa määritteissä.

Tuloksena pitäisi kuitenkin olla suurempi tarkkuus, koska emme etsi merkityksettömiä attribuutteja.

Voisimme lisätä tarkkuutta entisestään suodattamalla tulokset tunnettujen attribuuttiarvojen mukaan.

Tämä ei edes vaadi koneoppimista, koska hakukone voi tehdä yksinkertaisen vastaavuuden fasetin arvojen ja kyselyn tekstin välillä.

Tämä vähentää muistamista huomattavasti, joten voimme myös löytää hyvän tasapainon, jossa sen sijaan tehostamme tuloksia vastaavilla arvoilla suodatuksen sijaan.

Tehostetut tulokset ovat yleensä parhaiten vastaavat, koska kyselysuodattimen haku antaa signaalin, että se on sitä, mitä hakija haluaa.

Jos huomaat analytiikan tai käytännön kokemuksesi perusteella, että haustasi puuttuu käyttäjän tarkoitus ja että haut ovat “oikeat”, kyselyn laajennus ja kyselyn laajuus ovat kaksi tapaa kalibroida tarkkuuttasi ja muistamistasi.

Nämä lähestymistavat antavat tuloksia, joiden pitäisi olla olemassa, ja jättävät pois ne, joiden ei pitäisi.

Lisää resursseja: