Hogyan látja a Google az oldalad

Indexelhetőség – Hogyan látja a Google a weboldalad?

Ahogyan azt már korábbi posztomban is említettem, a keresőoptimalizálás technikai szempontjai közül az egyik legfontosabb az indexelhetőség.

Google index html oldalak

Mi az indexelhetőség és miért fontos?

Az indexelhetőség a weboldalad azon tulajdonsága, hogy mennyire egyszerűen tudja a Google az ott található tartalmat feltérképezni, értelmezni.

Ahhoz, hogy ezt könnyebben megértsük először nézzük meg hogyan épül fel egy weboldal!

Hogyan működik a honlapom?

Minden weboldal alapja a HTML (Hypertext Markup Language). Ez egy olyan leíró nyelv, melyet direkt weboldalak készítéséhez fejlesztettek ki, és mára protokollá alakult. Gyakorlatilag minden egyes alkalommal amikor megnyitsz egy weboldalt a böngésződdel, az ‘elolvas’ egy HTML fájlt, majd ezt vizualizálja Neked.

A HTML nyelv különböző tageket (ejtsd: teg) tartalmaz. Íme néhány a leggyakoribb HTML tagek közül:

  • <html> :  A html fájl kezdetét jelöli
  • <head> :  Ide kerülnek a metainformációk, valamint az oldal címe is
  • <body> :  Ide maguk a megjelenítendő elemek kerülnek
  • <p> paragraph: ezek a tagek általában sima szövegrészleteket tartalmaznak
  • <h1> header: Főként címeknél használjuk, az alcímeknél <h2>, vagy <h3> elemeket szoktunk használni
  • <li> Egy listának az elemeit jelöli.

Itt találsz egy listát az összes HTML elemről.

A ‘nyers’ HTML file ezután a css stílusnyelv (valamint a JavaScript) utasításai alapján lesz vizualizálva. Jól megfigyelhető a css szerepe, amikor gyenge internetkapcsolattal rendelkezünk, és a böngésző csak a nyers HTML fájlt tölti be. (Ilyenkor minden amit a weboldalból látunk csupán kék linkek egymás alatt és nyers szöveg.)

weboldal képernyőfotó css nélkül
Így nézne ki a főoldalunk css nélkül

Ezen kívül a böngésző a weboldalon található JavaScript kódot is értelmezi. A JavaScript a legnépszerűbb frontenden (azaz a felhasználó számítógépén/telefonján és NEM a szerveren) futó programnyelv, melynek felhasználási módjai szinte kimeríthetetlenek.

Minden alkalommal amikor megnyitsz egy weboldalt, a számítógéped (és a böngésződmegkapja ezeket az információkat a szervertől, és a másodperc töredéke alatt egy modern weboldalt varázsol a szemed elé. De miért fontos mindez?

Mert nem csak a Te böngésződ, hanem a Googlebot is ugyanígy nyitja meg a weboldalad.

Hogyan látja a Google a honlapom?

A Google úgynevezett crawler (ejtsd: ~kraulör) botok segítségével ‘térképezi fel’ az internetet. Ezek a botok linkeken keresztül haladva nyitnak meg weboldalakat és töltik be az ott található tartalmat. Ezáltal a nyers a keresőmotor kap egy ‘nyers’ formátumot, melyből a rangsorolás során információkat nyer ki.

HTML kód fekete alapon fehér
A kezdőlapunk így látja egy crawler.

A keresőmotorok ebből a nyers fájlból nyerik ki a metainformációkat, a szöveget tartalmazó elemeket, és minden mást. A szövegek értelmezése és ezek struktúrált formában történő mentése egy külön poszt témája lesz, de érdemes megfigyelni, hogy képeket csak linkek formájában tartalmaz a fenti képernyőfotó.

A Google a képeket is indexeli, azonban értelmezésével lényegesen nagyobb problémákba ütközik mint a szöveg esetén. Ahogyan azt már korábbi posztunkban írtuk, a tartalomban szereplő képek alt információinak a definiálása (többek között) ezért is fontos. Bár az utóbbi időben a Google képfelismerő mesterséges intelligenciát alkalmazó algoritmusai rengeteget fejlődtek, még mindig nem tökéletesek.

Mire érdemes figyelni?

JavaScript

A Googlebot (a fent említett crawler) hivatalosan képes a JavaScript, vagy CSS Által elrejtett szöveget értelmezni, azonban ez nem mindig sikerül. Ezen felül, még ha sikerül is indexelni, MOZ indormációi szerint ezek kisebb súllyal esnek a latba. A Google tehát nem tekinti olyan fontosnak, mint a nem elrejtett szöveget. Ez olyan esetekben fontos, amikor a ‘Tudj meg többet’ gomb megnyomásával nem egy új oldalra kerülünk, hanem az oldalon belül jelenik meg új tartalom. Igyekezzünk kerülni ezeket a megoldásokat amennyiben van rá mód.

Sitemaps.XML

A sitemap, azaz oldaltérkép szintén egy fontos pontja a weboldaladnak. Ez a dokumentum mutatja meg a Googlebotnak, hogy mely aloldalakat kell meglátogatnia és indexelnie. Amikor új tartalmat töltesz fel az oldaladra, mindig érdemes frissíteni az oldaltérképet, így a keresőmotorok tudják, hogy hol találják meg a legújabb tartalmat. Erre azért van szükség, mert amíg nem vezetnek külső linkek egy oldalra, addig nem valószínű, hogy a Google rátalál. Ezen a címen megtekinthetitek az én oldaltérképem, ezen pedig csinálhattok magatoknak egyet ingyen.

Robots.txt és robots meta tag

Ellentétben a sitemaps.xml céljával, a robots.txt arra szolgál, hogy megmutasd a keresőmotoroknak, mely oldalakat NE indexeljék. Ennek több oka is lehet, például a fizetés oldalt nem szeretnéd megmutatni. Ez egy egyszrű txt fájl, melyben a “Disallow:” kifejezés után csak az aloldal címét kell beírnod, hogy kitiltsd a botokat. Itt meg tudod nézni a Facebook robotos.txt-jét példaképpen.

A robots meta tag, ahogyan azt a meta tagekről szóló posztomban is írtam, szintén a botoknak szolgál információval. Így használd:

  • <meta name=”robots” content=”index,” “follow”> : A Google indexelje az oldalad és a rajta található linkeken haladjon tovább
  • <meta name=”robots” content=”noindex,” “nofollow”> : Ne indexelje és ne kövesse a linkeket az oldalon.

Mobilos indexelhetőség

A Google tavaly jelentette be, hogy a mobilos indexelhetőség egyre nagyobb hangsúlyt fog kapni. Ez egyértelműen annak a trendnek köszönhető, mely szerint egyre többen keresünk egyre többet a mobilunkon. A Google pedig szeretné a legjobb találatokat elénk tárni, akármilyen eszközön használjuk.

Ellenőrizd az oldalad indexeltségét!

A Google Search Console (régebbi nevén Webmaster Tools) a legjobb eszköz az indexelhetőség ellenőrzésére. Regisztráld be az oldalad (ha eddig nem tetted meg), és töltsd fel az oldaltérképet! Ha nem vagy benne biztos, hogy a Googlebot látja mi van az oldaladon így ellenőrizheted:

  1. Kattints az “URL-ellenrőzés” gombra a baloldali sávban.
  2. Illeszd be a kívánt urlt a keresőmezőbe
  3. Kattints a “Forrás Megtekintése” gombra
Google search console url ellenőrzés forráskód képernyőfotó
A főoldalunk Search Consoleban tárolt forráskódjának egy részlete

Amennyiben itt nem találod a kívánt tartalom egy részét, azonnal változtass az oldalon, majd kérd az url újraindexelését (szintén a Search Console használatával)!

Konklúzió

A Google csakúgy, mint ahogyan a böngésződ is, HTML fájlokat nyit meg, melyekből információt nyer ki. Az oldal indexelhetőségének javítása nem rakétatudomány, azonban az első és legfontosabb lépés a keresőoptimalizálás során. A legfontosabb, hogy az oldaltérképen és a robots.txt-n keresztül tudasd a Googlebottal, hogy mely oldalakat indexelje és melyeket ne. Fontos továbbá, hogy reszponzív legyen az oldal, valamint hogy az értékes információkat ne rejtsd “mutass többet” gombok alá! Ha ezekkel a lépésekkel végeztél, ellenőrizd folyamatosan a Google Search Console segítségével, hogy a Google is úgy látja-e az oldalad ahogyan Te szeretnéd.

Remélem hasznos volt számodra ez a cikk. Kövess minket Facebookon, Instagramon, vagy vedd fel velünk a kapcsolatot, ha többet szeretnél megtudni!

Oszd meg ezt a cikket!

Tájékozódj Több Forrásból!

Próbáld ki hírolvasó applikációnkat és segíts nekünk tesztelni!