55.is Markaðsstofa
SEO

robots.txt og skriðun: Hvernig þú stýrir leitarvélum

Hvernig robots.txt virkar í raun, hvað á að loka á og hvað ekki, með skýrum dæmum fyrir skriðun, sitemap og algeng mistök.

6. nóvember 2024
Uppfært 13. apríl 2026
9 mín lestur
robots.txt og skriðun: Hvernig þú stýrir leitarvélum

robots.txt er stýring, ekki töfralausn

robots.txt er einföld skrá, en hún getur haft mikil áhrif á hvernig leitarvélar fara um vefinn þinn. Hún segir frá því hvaða hluta á að skriða og hvaða hluta ekki.

Það þýðir þó ekki að hún leysi öll vandamál. Hún er bara hluti af stærri tæknilegri mynd.

Ef þú ert að byggja skýra leið að mikilvægu efni eins og leitarvélabestun þarf robots.txt að styðja þá leið, ekki loka óvart á efni, skrár eða slóðir sem eiga að vera sýnilegar.

ℹ️
️ robots.txt stýrir crawling, ekki beint því hvort síða sé í index. Það er mjög algengur misskilningur.

Hvenær nýtist hún best?

robots.txt er gagnleg þegar þú vilt:

  • halda óþarfa slóðum frá skriðun
  • stjórna aðgengi að óviðkomandi svæðum
  • vísa á sitemap
  • halda tæknilegri uppsetningu hreinni

Praktísk dæmi geta verið:

  • filter- eða parameter-slóðir sem búa til endalaus afbrigði
  • innri leitarsíður sem eiga ekki að taka crawl budget
  • tæknileg svæði eða staging slóðir sem eiga ekki að vera opnar

Hvernig notarðu hana rétt?

Góð robots.txt á að vera einföld og skýr. Hún á ekki að vera notuð til að fela mikilvægt efni eða laga vandamál sem eiga sér annan uppruna.

Gott verklag

  • loka aðeins því sem á ekki að skriða
  • leyfa síðum sem þú vilt sjá í leit að vera aðgengilegar
  • vísa í sitemap þegar það á við
  • athuga breytingar með Source eða crawler áður en þú setur þær í loftið

Ef þú vilt sjá hvernig Google útskýrir þetta sjálft, þá er hér opinber leiðarvísir: robots.txt introduction hjá Google Search Central.

Dæmi um hreina uppsetningu

User-agent: *
Disallow: /leit/
Disallow: /karfa/
Sitemap: https://55.is/sitemap.xml

Þetta er skýrt dæmi. Það lokar ekki á opinberar þjónustusíður eða blogg, en heldur aftur af svæðum sem eiga sjaldan erindi í leit.

Hvað á robots.txt ekki að gera?

Það er jafn mikilvægt að skilja mörkin.

robots.txt á ekki að vera aðalverkfærið þegar þú vilt:

  • fjarlægja síðu úr index
  • laga duplicate content
  • merkja aðalútgáfu af síðu
  • senda notendur eða leitarvélar yfir á nýja slóð

Í þeim tilvikum þarftu yfirleitt að skoða:

  • noindex
  • canonical
  • 301 redirect
  • innri tengla

Þess vegna vinnur þessi grein vel með canonical tags og síðuendurgerðir og skriðun og indexing.

Algeng mistök

  • að loka síðum sem þú vilt í raun að birtist í leit
  • að halda að robots.txt fjarlægi síður úr vísitölu
  • að nota hana sem lausn á duplicate content
  • að gleyma að hún þarf að passa við sitemap og internals
ℹ️
️ Stærsta mistökin eru yfirleitt að copy-paste-a reglum sem virkuðu á öðrum vef og setja þær inn án þess að lesa slóðabygginguna hjá eigin vef.

Hvað þarf að passa?

Ef þú lokar röngum möppum geturðu gert meiri skaða en gagn. Þess vegna þarf alltaf að vita hvað á að vera sýnilegt og hvað ekki.

robots.txt og sitemap þurfa líka að vinna saman. Ef sitemap bendir á síðu sem robots.txt lokar á, færðu ósamræmi sem getur ruglað ferlið.

Stutt gátlisti áður en þú birtir breytingu

  • ertu að loka á tæknilegt svæði eða á mikilvæga opinbera síðu?
  • er sitemap enn að vísa á opnar slóðir?
  • þurfa CSS eða JS skrár að vera crawl-anlegar?
  • hefur þú prófað breytinguna áður en hún fer live?
Ef þú ert óviss skaltu byrja varlega. Of opin robots.txt er oft minni skaði en of lokuð.

Niðurstaða

robots.txt er einfalt en mikilvægt tæki. Þegar hún er notuð rétt hjálpar hún leitarvélum að eyða tíma sínum á réttum stöðum.

Skoðaðu líka sitemap leiðarvísinn, skriðun og indexing og tæknilegt SEO til að sjá heildarmyndina.

#robots.txt#Skriðun#Tæknilegt SEO#Indexing
Algengar spurningar

Algengar spurningar um robots.txt

Sérstaklega fyrir þá sem vilja halda crawl á réttri braut án þess að loka röngum síðum.

Hvað á robots.txt að loka fyrir?
Hún á fyrst og fremst að halda óviðkomandi eða tæknilegum slóðum frá skriðun, ekki fela efni sem þú vilt að notendur finni í leit. Opinberar þjónustu- og bloggsíður eiga almennt ekki að vera lokaðar.
Getur robots.txt lagað indexing vandamál?
Ekki ein og sér. Hún getur stýrt skriðun, en til að laga skráningu í leit þarf oft líka að skoða sitemap, innri tengla, noindex, canonical eða gæði síðunnar sjálfrar.
Hvað má ég alls ekki loka fyrir?
Ekki loka fyrir mikilvægar opinberar síður, þjónustusíður eða bloggfærslur sem þú vilt að Google finni og sýni. Ef lokað er fyrir rétta hluti getur það skaðað sýnileika.
Hvenær á ég að breyta robots.txt?
Þegar ný svæði bætast við, tæknilegir slóðarþættir breytast eða þú vilt hreinsa upp hvað leitarvélar eyða tíma í. Hún á að fylgja vefnum, ekki standa óbreytt þegar uppbyggingin breytist.
Sigurður Þór

Sigurður Þór

Stofnandi og framkvæmdastjóri 55.is. Sérfræðingur í stafrænni markaðssetningu með áralanga reynslu af SEO, Google Ads og vefsíðugerð fyrir íslensk fyrirtæki.

Tilboð

Vilt þú ná betri árangri?

Við hjálpum íslenskum fyrirtækjum að vaxa með gagnreyndri stafrænni markaðssetningu. Fáðu ókeypis ráðgjöf í dag.

Tökum spjall