Hogyan látja a Google az oldalad

Indexelhetőség – Hogyan látja a Google a weboldalad?

Ahogyan azt már korábbi posztomban is említettem, a keresőoptimalizálás technikai szempontjai közül az egyik legfontosabb az indexelhetőség.

Google index html oldalak

Mi az indexelhetőség és miért fontos?

Az indexelhetőség a weboldalad azon tulajdonsága, hogy mennyire egyszerűen tudja a Google az ott található tartalmat feltérképezni, értelmezni.

Ahhoz, hogy ezt könnyebben megértsük először nézzük meg hogyan épül fel egy weboldal!

Hogyan működik a honlapom?

Minden weboldal alapja a HTML (Hypertext Markup Language). Ez egy olyan leíró nyelv, melyet direkt weboldalak készítéséhez fejlesztettek ki, és mára protokollá alakult. Gyakorlatilag minden egyes alkalommal amikor megnyitsz egy weboldalt a böngésződdel, az ‘elolvas’ egy HTML fájlt, majd ezt vizualizálja Neked.

A HTML nyelv különböző tageket (ejtsd: teg) tartalmaz. Íme néhány a leggyakoribb HTML tagek közül:

  • <html> :  A html fájl kezdetét jelöli
  • <head> :  Ide kerülnek a metainformációk, valamint az oldal címe is
  • <body> :  Ide maguk a megjelenítendő elemek kerülnek
  • <p> paragraph: ezek a tagek általában sima szövegrészleteket tartalmaznak
  • <h1> header: Főként címeknél használjuk, az alcímeknél <h2>, vagy <h3> elemeket szoktunk használni
  • <li> Egy listának az elemeit jelöli.

Itt találsz egy listát az összes HTML elemről.

A ‘nyers’ HTML file ezután a css stílusnyelv (valamint a JavaScript) utasításai alapján lesz vizualizálva. Jól megfigyelhető a css szerepe, amikor gyenge internetkapcsolattal rendelkezünk, és a böngésző csak a nyers HTML fájlt tölti be. (Ilyenkor minden amit a weboldalból látunk csupán kék linkek egymás alatt és nyers szöveg.)

weboldal képernyőfotó css nélkül
Így nézne ki a főoldalunk css nélkül

Ezen kívül a böngésző a weboldalon található JavaScript kódot is értelmezi. A JavaScript a legnépszerűbb frontenden (azaz a felhasználó számítógépén/telefonján és NEM a szerveren) futó programnyelv, melynek felhasználási módjai szinte kimeríthetetlenek.

Minden alkalommal amikor megnyitsz egy weboldalt, a számítógéped (és a böngésződmegkapja ezeket az információkat a szervertől, és a másodperc töredéke alatt egy modern weboldalt varázsol a szemed elé. De miért fontos mindez?

Mert nem csak a Te böngésződ, hanem a Googlebot is ugyanígy nyitja meg a weboldalad.

Hogyan látja a Google a honlapom?

A Google úgynevezett crawler (ejtsd: ~kraulör) botok segítségével ‘térképezi fel’ az internetet. Ezek a botok linkeken keresztül haladva nyitnak meg weboldalakat és töltik be az ott található tartalmat. Ezáltal a nyers a keresőmotor kap egy ‘nyers’ formátumot, melyből a rangsorolás során információkat nyer ki.

HTML kód fekete alapon fehér
A kezdőlapunk így látja egy crawler.

A keresőmotorok ebből a nyers fájlból nyerik ki a metainformációkat, a szöveget tartalmazó elemeket, és minden mást. A szövegek értelmezése és ezek struktúrált formában történő mentése egy külön poszt témája lesz, de érdemes megfigyelni, hogy képeket csak linkek formájában tartalmaz a fenti képernyőfotó.

A Google a képeket is indexeli, azonban értelmezésével lényegesen nagyobb problémákba ütközik mint a szöveg esetén. Ahogyan azt már korábbi posztunkban írtuk, a tartalomban szereplő képek alt információinak a definiálása (többek között) ezért is fontos. Bár az utóbbi időben a Google képfelismerő mesterséges intelligenciát alkalmazó algoritmusai rengeteget fejlődtek, még mindig nem tökéletesek.

Mire érdemes figyelni?

JavaScript

A Googlebot (a fent említett crawler) hivatalosan képes a JavaScript, vagy CSS Által elrejtett szöveget értelmezni, azonban ez nem mindig sikerül. Ezen felül, még ha sikerül is indexelni, MOZ indormációi szerint ezek kisebb súllyal esnek a latba. A Google tehát nem tekinti olyan fontosnak, mint a nem elrejtett szöveget. Ez olyan esetekben fontos, amikor a ‘Tudj meg többet’ gomb megnyomásával nem egy új oldalra kerülünk, hanem az oldalon belül jelenik meg új tartalom. Igyekezzünk kerülni ezeket a megoldásokat amennyiben van rá mód.

Sitemaps.XML

A sitemap, azaz oldaltérkép szintén egy fontos pontja a weboldaladnak. Ez a dokumentum mutatja meg a Googlebotnak, hogy mely aloldalakat kell meglátogatnia és indexelnie. Amikor új tartalmat töltesz fel az oldaladra, mindig érdemes frissíteni az oldaltérképet, így a keresőmotorok tudják, hogy hol találják meg a legújabb tartalmat. Erre azért van szükség, mert amíg nem vezetnek külső linkek egy oldalra, addig nem valószínű, hogy a Google rátalál. Ezen a címen megtekinthetitek az én oldaltérképem, ezen pedig csinálhattok magatoknak egyet ingyen.

Robots.txt és robots meta tag

Ellentétben a sitemaps.xml céljával, a robots.txt arra szolgál, hogy megmutasd a keresőmotoroknak, mely oldalakat NE indexeljék. Ennek több oka is lehet, például a fizetés oldalt nem szeretnéd megmutatni. Ez egy egyszrű txt fájl, melyben a “Disallow:” kifejezés után csak az aloldal címét kell beírnod, hogy kitiltsd a botokat. Itt meg tudod nézni a Facebook robotos.txt-jét példaképpen.

A robots meta tag, ahogyan azt a meta tagekről szóló posztomban is írtam, szintén a botoknak szolgál információval. Így használd:

  • <meta name=”robots” content=”index,” “follow”> : A Google indexelje az oldalad és a rajta található linkeken haladjon tovább
  • <meta name=”robots” content=”noindex,” “nofollow”> : Ne indexelje és ne kövesse a linkeket az oldalon.

Mobilos indexelhetőség

A Google tavaly jelentette be, hogy a mobilos indexelhetőség egyre nagyobb hangsúlyt fog kapni. Ez egyértelműen annak a trendnek köszönhető, mely szerint egyre többen keresünk egyre többet a mobilunkon. A Google pedig szeretné a legjobb találatokat elénk tárni, akármilyen eszközön használjuk.

Ellenőrizd az oldalad indexeltségét!

A Google Search Console (régebbi nevén Webmaster Tools) a legjobb eszköz az indexelhetőség ellenőrzésére. Regisztráld be az oldalad (ha eddig nem tetted meg), és töltsd fel az oldaltérképet! Ha nem vagy benne biztos, hogy a Googlebot látja mi van az oldaladon így ellenőrizheted:

  1. Kattints az “URL-ellenrőzés” gombra a baloldali sávban.
  2. Illeszd be a kívánt urlt a keresőmezőbe
  3. Kattints a “Forrás Megtekintése” gombra
Google search console url ellenőrzés forráskód képernyőfotó
A főoldalunk Search Consoleban tárolt forráskódjának egy részlete

Amennyiben itt nem találod a kívánt tartalom egy részét, azonnal változtass az oldalon, majd kérd az url újraindexelését (szintén a Search Console használatával)!

Konklúzió

A Google csakúgy, mint ahogyan a böngésződ is, HTML fájlokat nyit meg, melyekből információt nyer ki. Az oldal indexelhetőségének javítása nem rakétatudomány, azonban az első és legfontosabb lépés a keresőoptimalizálás során. A legfontosabb, hogy az oldaltérképen és a robots.txt-n keresztül tudasd a Googlebottal, hogy mely oldalakat indexelje és melyeket ne. Fontos továbbá, hogy reszponzív legyen az oldal, valamint hogy az értékes információkat ne rejtsd “mutass többet” gombok alá! Ha ezekkel a lépésekkel végeztél, ellenőrizd folyamatosan a Google Search Console segítségével, hogy a Google is úgy látja-e az oldalad ahogyan Te szeretnéd.

Remélem hasznos volt számodra ez a cikk. Kövess minket Facebookon, Instagramon, vagy vedd fel velünk a kapcsolatot, ha többet szeretnél megtudni!

Oszd meg ezt a cikket!

Share on facebook
Share on google
Share on twitter
Share on linkedin
Share on pinterest
Share on print
Share on email

Tájékozódj Több Forrásból!

Próbáld ki hírolvasó applikációnkat és segíts nekünk tesztelni!