A Google és az entitások története

II. rész

Az entitások fontosságának térnyerése tehát már a saját bőrünkön tapasztalható, legyünk akár SEO szakemberek vagy neten szörfölő felhasználók. Hogyan alakult mindez így? Öveket bekapcsolni, rövid, de annál velősebb történelmi áttekintés következik!

A kulcsszavakon alapuló keresés

A keresőmotorok fejlődése során az első nagy változás a kulcsszóra alapuló keresés volt, ahol a találatok rangsorolása a keresési kifejezések gyakoriságán és azok előfordulási helyén alapult.

Ez a módszer azonban hamar elavulttá vált, mivel könnyen manipulálható volt, például kulcsszóhalmozással, ami sok esetben gyenge minőségű, irreleváns találatokhoz vezetett.

A Freebase és a Wikidata

A Google és az entitások története valójában 2010. július 16-án kezdődött, amikor a keresőóriás megvásárolta a Freebase nevű adatbázist.

Ez volt az első komoly lépés a Google entitásalapú keresőrendszerének létrehozása felé.

A Freebase-ben rejlő potenciál felismerése után azonban hamar kiderült, hogy a Wikidata egy sokkal alkalmasabb eszköz lehet az eredeti célok megvalósítására.

A Google ezért elkezdte integrálni a Freebase-t a Wikidata rendszerébe, ám ez a feladat nagyobb kihívást jelentett, mint ahogy azt eleinte gondolták.

Az átállás folyamatát és nehézségeit öt Google-kutató egy tanulmányban dolgozta fel, amelynek címe: „From Freebase to Wikidata: The Great Migration”.

A tanulmányban kiemelték, hogy a Freebase egy objektumalapú adatbázis volt, ahol minden objektumnak egy egyedi, „mid” azonosítója volt, míg a Wikidata egy másfajta modellre épül.

A Wikidatában az entitások „qid” azonosítóval rendelkeznek, és ezekhez az entitásokhoz különböző állítások és címkék társíthatók több nyelven is.

A Freebase-szel ellentétben a Wikidata nem törekszik arra, hogy csak a valós tényeket tárolja – különböző források ellentmondásos állításait is lehetővé teszi.

Mivel a Google egyre inkább a strukturált adatokat kívánta felhasználni, tovább kellett bővítenie az entitásismeretét. A strukturálatlan források, például blogok vagy közösségi média bejegyzések feldolgozása ehhez már nem volt elegendő.

Ezért a Google összefogott a Binggel és a Yahoo-val, és közösen létrehozták a Schema.org szabványt, amely segíti a weboldal-tulajdonosokat abban, hogy strukturált adatokat adjanak meg az oldalaikon. Ezzel a keresőmotorok számára egyértelműbbé tehetik a tartalom jelentését, így az jobban értelmezhetővé válik.

keresőbotok jobban értelmezik a tartalmat

Példák strukturált adatokra

Például egy recept esetében nem csak a kulcsszavak alapján találhatja meg a kereső az adott leírást, hanem a recept összetevői, a főzési idő és más fontos részletek alapján is.

Ez a strukturált adat segít a Google-nek abban, hogy „dolgokra, fogalmakra”, ne csak „szavakra” fókuszáljon. És természetesen ezeket az oldalakat a Google relevanciájuk függvényében előrébb is sorolja.

Az előbbi példánkból kiindulva, lássuk milyen strukturált adatai lehetnek egy receptnek:
Ide tartozik a recept neve (pl. "lecsó"), a főzési idő, az előkészítési idő, a teljes idő (az előbbi kettő együtt), az összetevők, az elkészítési lépések, az adagok száma, a kalóriák száma, egyéb étkezési információ (pl. "vegetáriánus étrend") és az értékelés (ha biztosítunk lehetőséget erre az oldalon).

A keresőoptimalizálás terén tevékenykedő szakemberek kezében ez hatalmas „fegyver”, hiszen ezáltal a weboldalak tartalma könnyebben értelmezhető keresőmotorok számára.

Az elmúlt évtizedben a Google több milliárd entitást azonosított, és a keresés ezen az alapon folyamatosan fejlődik. Így jött például képbe a Tudásgráf is.

Mi az a Tudásgráf (Knowledge Graph)?

A Tudásgráf olyan adatbázis, amely a keresőmotorok számára strukturált módon tárolja és rendszerezi az entitásokat és azok közötti kapcsolatokat. Így segíti a pontosabb és relevánsabb keresési találatok megjelenítését.

Ahogy az entitások száma és az adatok mennyisége nő, a Google rendszere egyre pontosabbá válik. Ez lehetővé teszi, hogy a felhasználók még relevánsabb információkat kapjanak a kereséseikre.

Beszéljünk még egy kicsit a Tudásgráfról

A Tudásgráf segítségével a Google tehát egy hatalmas adatbázist hozott létre, amely összekapcsolja az entitásokat és azok attribútumait. Például, ha valaki rákeres „Albert Einstein” nevére, a Tudáspanel segítségével azonnal megjelennek az életrajzi információk, fontosabb tudnivalók, valamint Einstein kapcsolata más tudósokkal és témákkal. Ez a megközelítés teszi lehetővé, hogy a Google nemcsak pontosan találja meg az információt, hanem mélyebb összefüggéseket is feltárjon.

Hogyan azonosíthatók és használhatók az entitások a SERP-ben?

A SERP (Search Engine Results Page) a keresőmotor által megjelenített találati oldal, ami akkor jelenik meg, ha elindítasz egy keresést. Az entitások különböző módokon jelenhetnek meg a SERP-ben, például a Tudáspanel formájában, ami döntően a keresési találatok jobb oldalán található, vagy más speciális funkciókban (például a snippet-ek).

Másik gyakori példa a helyi találatok, ahol a vállalkozások, éttermek, szállodák jelennek meg részletes információkkal, beleértve a címet, nyitvatartási időt és felhasználói értékeléseket.

…Folytatása következik…

Amennyiben érdekesnek tartod a témát, azt javasoljuk, olvasd el előző cikkünket is, ahol az entitásokról gyűjtöttünk össze egy részletes, átfogó tudásanyagot! Tarts velünk a folytatásban is, ahol az entitásokkal foglalkozó 3. cikkünkben gyakorlati tippekkel jövünk, amelyeket alkalmazva előnyösebb helyezést érhetsz el a találati listán!

Q & A

Mik azok a kereső entitások?
A kereső entitások egyedi, azonosítható dolgok vagy fogalmak.
Hogyan azonosítja a Google az entitásokat?
A Google az entitásokat szemantikus elemzés, strukturált adatok, valamint a szövegek közötti összefüggések alapján azonosítja, így képes megérteni a tartalom kontextusát és az entitások közötti kapcsolatokat.