Robots.txt i sitemap datoteka su dva osnovna tehnička SEO dokumenta koja upravljaju time kako pretraživači indeksiraju vašu web stranicu i koje stranice će biti otkrivene. Robots.txt govori botovima poput Googlebota koje dijelove stranice mogu ili ne mogu pregledavati; sitemap, odnosno web mapa, obavještava pretraživače o važnim URL-ovima, datumima ažuriranja i strukturi stranica. Ukratko: robots.txt usmjerava pregledavanje, dok sitemap ubrzava otkrivanje. Ispravno pripremljena robots.txt i sitemap datoteka mogu značajno povećati učinkovitost indeksiranja, posebno na novim stranicama, e-trgovinama, korporativnim web stranicama i velikim arhivima sadržaja.
U ovom vodiču ćemo korak po korak obraditi kako pripremiti robots.txt i sitemap datoteku, koje pravila koristiti, na što obratiti pažnju na WordPress i prilagođenim web stranicama, kako testirati greške i kako poslati datoteke Google-u. Ovaj sadržaj pripremljen je za blog Hostragons u skladu sa SEO standardima iz 2026. godine; fokusirajući se na korisničku namjeru, tehničku točnost, budžet za pregledavanje, indeksabilnost i praktičnu primjenu.
Što je Robots.txt?
Robots.txt je datoteka u jednostavnom tekstualnom formatu koja se nalazi u korijenskom direktoriju vaše web stranice. Obično se može pristupiti na adresi https://tvojadomena.com/robots.txt. Ova datoteka daje smjernice pretraživačkim botovima o tome koje mape ili stranice mogu pregledavati, a koje ne bi trebale. Ključna točka je da robots.txt nije sigurnosni alat. To je samo upute za pregledavanje koje se daju dobronamjernim botovima.
Na primjer, upravljačka ploča, korak u procesu kupovine, parametri filtriranja, stranice s rezultatima pretraživanja ili testni direktoriji mogu biti zatvoreni za pregledavanje od strane pretraživača. Međutim, povjerljive informacije se ne mogu zaštititi putem robots.txt. Budući da je datoteka vidljiva svima, za pravu sigurnost potrebno je koristiti zaštitu lozinkom, ograničenja pristupa na strani poslužitelja, sigurnu konfiguraciju hostinga i SSL. U ovom kontekstu, možete razmotriti rješenja za SSL certifikat i Web Hosting za osnovnu sigurnost vaše web stranice i performansnu infrastrukturu.
Koja je svrha Robots.txt datoteke?
- Usmjerava ponašanje botova pri pretraživanju.
- Smanjuje pregledavanje nevažnih ili dupliciranih stranica.
- Pomaže u raspodjeli budžeta za pregledavanje na važne stranice.
- Obavještava botove o lokaciji datoteke sa sitemapom.
- Može spriječiti pregledavanje stranica kao što su testne, upravljačke, interne pretrage i URL-ovi s parametrima.
Pogotovo na web stranicama koje imaju tisuće proizvoda, kategorija, oznaka ili stranica s filtrima, ako je robots.txt datoteka pogrešno konfigurirana, Google može kasno otkriti važne stranice. S druge strane, korištenje previše restriktivne datoteke može blokirati CSS, JavaScript, slikovne datoteke ili stranice kategorija, što može negativno utjecati na performanse rangiranja.
Što je Sitemap?
Sitemap, odnosno web mapa, je XML format datoteke koja pretraživačima navodi važne URL-ove na vašoj web stranici. Obično se nalazi na adresi https://tvojadomena.com/sitemap.xml. Sitemap daje pretraživačima poruku: Ove stranice su mi važne, molim vas, otkrijte ih i uključite u proces indeksiranja ako je moguće.
U sitemap datoteci mogu se nalaziti informacije kao što su URL, datum posljednje izmjene, učestalost promjena i prioritet. U pristupu SEO-u iz 2026. godine, datum posljednje izmjene postaje posebno važan. Jer pretraživači žele učinkovito otkrivati ažurirane i kvalitetne sadržaje. Međutim, sitemap sam po sebi ne jamči indeksiranje. To što URL postoji u sitemapu ne znači da će ta stranica nužno biti navedena na Googleu. Stranica mora biti kvalitetna, dostupna, indeksabilna, kanonički ispravna i odgovarati namjeri korisnika.
Kada je potrebna Sitemap datoteka?
- Ako imate novu web stranicu.
- Ako imate mnogo stranica, proizvoda ili blog sadržaja.
- Ako je vaša interna povezanost slaba.
- Ako imate mnogo vizualnih, video ili novinskih sadržaja.
- Ako često ažurirate proizvode na svojoj e-trgovini.
- Ako redovito ažurirate stare sadržaje.
Čak i na maloj web stranici s dobro strukturiranom internom povezanošću, korištenje sitemap-a je dobra praksa. Jer web mapa pruža jasnu listu URL-ova pretraživačima i smanjuje moguće odgode u otkrivanju.
Razlike između Robots.txt i Sitemap-a
Iako robots.txt i sitemap datoteka rade zajedno, njihove uloge su različite. Robots.txt igra ulogu u odobravanju i ograničavanju pregleda, dok sitemap navodi URL-ove koje želite otkriti. Sljedeća tablica sažima osnovne razlike.
| Osobina | Robots.txt | Sitemap |
|---|---|---|
| Osnovna svrha | Usmjeravanje botova koji dijelovi se mogu pregledavati | Obavještavanje pretraživača o važnim URL-ovima |
| Lokacija datoteke | Korijenski direktorij: /robots.txt | Obično /sitemap.xml |
| Format | Jednostavni tekst | XML |
| Jamči indeksiranje? | Ne | Ne |
| Rizik od pogrešne upotrebe | Može blokirati važne stranice za pregledavanje | Može poslati niskokvalitetne ili noindex stranice |
| SEO učinak | Pomaže u upravljanju budžetom za pregledavanje | Jača otkrivanje URL-ova i signal ažuriranja |
Kako pripremiti Robots.txt datoteku?
Priprema robots.txt datoteke tehnički je jednostavna; međutim, zahtijeva pažnju s SEO aspekta. Ime datoteke treba biti napisano malim slovima kao robots.txt i treba se učitati u korijenski direktorij web stranice. Dakle, ispravna adresa je https://tvojadomena.com/robots.txt. Robots.txt datoteka učitana u poddirektorij ne smatra se valjanom.
1. Kreirajte osnovnu strukturu Robots.txt
Najjednostavnija struktura daje svim botovima dozvolu za pregledavanje stranice i obavještava o lokaciji sitemap-a:
- User-agent: *
- Allow: /
- Sitemap: https://tvojadomena.com/sitemap.xml
Ovdje User-agent: * predstavlja sve botove. Allow: / daje dozvolu za pregledavanje cijelog sajta. Redak sitemap obavještava o lokaciji web mape. Ova struktura je obično siguran početak za novu web stranicu koju želite indeksirati.
2. Odredite dijelove koje ne želite da se pregledavaju
Nije potrebno da svaka stranica bude pregledana. Osobito korisnički specifične, privremene, duplicirane ili stranice s niskom SEO vrijednosti mogu se ograničiti putem robots.txt. Na primjer:
- Disallow: /wp-admin/
- Disallow: /sepet/
- Disallow: /placanje/
- Disallow: /pretraga/
- Disallow: /test/
Na WordPress stranicama često se zatvara pregledavanje /wp-admin/ mape. Međutim, za rad nekih AJAX datoteka WordPress-a potrebno je dopustiti pristup datoteci /wp-admin/admin-ajax.php. Stoga, primjer strukture za WordPress može biti:
- User-agent: *
- Disallow: /wp-admin/
- Allow: /wp-admin/admin-ajax.php
- Sitemap: https://tvojadomena.com/sitemap.xml
U ovom primjeru, upravljačka ploča je zatvorena za pregledavanje, dok su AJAX operacije potrebne za teme i dodatke dopuštene. Da biste brže i stabilnije pokrenuli svoju WordPress stranicu, možete razmotriti WordPress hosting usluge.
3. Provjerite parametre i filtre za e-trgovine
Na e-trgovinskim stranicama filtriranje, sortiranje, boja, veličina, raspon cijena, stanje zaliha i parametri pretraživanja mogu generirati mnogo URL-ova. Na primjer, ista kategorija može se multiplicirati s ovim varijacijama: /cipele?boja=crna, /cipele?velicina=42, /cipele?sortiraj=cijena_uzlazno. Ako se ova struktura ne kontrolira, Google botovi mogu pregledavati tisuće stranica s niskovrijednim parametrima.
Za ovakva polja, robots.txt, kanoničke oznake i podaci iz Google Search Console-a trebaju se zajednički procijeniti. Samo uz robots.txt zatvaranje svakog parametra ne mora uvijek biti ispravno rješenje. Jer neke stranice s filtrima mogu imati komercijalnu namjeru pretraživanja. Na primjer, kategorija crnih muških sportskih cipela može se planirati kao indeksabilna zasebna kategorijska stranica jer nosi SEO vrijednost.
4. Ne blokirajte CSS i JavaScript datoteke
U modernom SEO-u Google ne ocjenjuje stranice samo kao HTML, već i u svom renderiranom obliku. Stoga, blokiranje CSS i JavaScript datoteka može otežati Googleu razumijevanje rasporeda stranice, mobilne prilagodljivosti, izbornika ili strukture učitavanja sadržaja. Široka pravila poput Disallow: /assets/ ili Disallow: /js/ koja su korištena u prošlim razdobljima su danas rizična.
Siguran pristup za 2026. godinu je sljedeći: CSS, JS, slikovne i font datoteke koje čine korisničko iskustvo trebaju biti dostupne botovima. Samo se stvarno nepotrebni upravljački, privremeni ili posebni direktoriji trebaju ograničiti.
5. Testirajte Robots.txt datoteku
Nakon učitavanja datoteke, svakako je testirajte. Provjerite sljedeće:
- Otvara li se adresa https://tvojadomena.com/robots.txt s kodom statusa 200?
- Je li datoteka prazna, s greškom ili pripada pogrešnom domenu?
- Pokazuje li redak sitemap ispravnu URL adresu?
- Jesu li važne kategorijske, proizvodne, uslužne i blog stranice blokirane?
- Jesu li CSS, JS i slikovni resursi slučajno zatvoreni?
Možete provjeriti može li se pregledati važne stranice putem alata za provjeru URL-a u Google Search Console-u. Analiza logova poslužitelja kako bi se vidjelo koje URL-ove je Googlebot posjetio također je napredna, ali vrlo vrijedna metoda. Za snažnu performansu poslužitelja i pravilnu konfiguraciju mogu se razmotriti opcije VPS server ili korporativni hosting.
Kako pripremiti Sitemap datoteku?
Kada pripremate sitemap, cilj je pružiti pretraživačima čistu listu kvalitetnih URL-ova koje želite indeksirati. Nije svaka stranica nužno obavezna da bude uključena u sitemap. Čak i dodavanje noindex, preusmjerenih, greškom vraćenih ili dupliciranih stranica može stvoriti negativne signale s SEO aspekta.
1. Dodajte samo indeksabilne URL-ove
Stranice koje ćete dodati u sitemap trebaju zadovoljiti sljedeće kriterije:
- Treba vraćati kod statusa 200.
- Ne smije sadržavati noindex oznaku.
- Ne smije biti blokirana putem robots.txt.
- Treba imati kanoničku oznaku koja pokazuje sebe ili ispravnu metu.
- Treba sadržavati originalni sadržaj koji nudi vrijednost korisnicima.
- Treba biti mobilno prilagodljiva i brzo učitavajuća.
Na primjer, stranice sa uklonjenim proizvodima, proizvodi koji više nisu dostupni i trajno uklonjeni, rezultati interne pretrage, stranice za kupovinu i plaćanje ne bi trebale biti uključene u sitemap. S druge strane, glavne kategorijske stranice, važne podkategorije, uslužne stranice, blog postovi i aktivni proizvodi trebaju biti uključeni u web mapu.
2. Ispravno koristite XML Sitemap format
Jednostavna struktura XML sitemapa se gradi prema sljedećoj logici:
- <urlset> je glavni kontejner.
- <url> je zaseban blok za svaku stranicu.
- <loc> sadrži punu URL adresu stranice.
- <lastmod> označava datum posljednje izmjene stranice.
Primjer URL zapisa može izgledati ovako: <loc>https://tvojadomena.com/usluge/</loc> i <lastmod>2026-01-15</lastmod>. Preporučuje se da format datuma bude godina-mjesec-dan. Važno je automatski i ispravno ažurirati lastmod polje. Ažuriranje datuma svih URL-ova samo kako bi se "aktivirao" Google nije pouzdana praksa.
3. Podijelite Sitemap na velikim stranicama
Standardna XML sitemap datoteka trebala bi sadržavati najviše 50.000 URL-ova i ne smije premašiti 50 MB u nekomprimiranoj verziji. Na velikim stranicama, umjesto jedne sitemap datoteke, bolje je koristiti indeks sitemapa. Na primjer:
- /post-sitemap.xml
- /page-sitemap.xml
- /product-sitemap.xml
- /category-sitemap.xml
- /image-sitemap.xml
Ova struktura omogućuje pretraživačima učinkovitije procesuiranje datoteka i olakšava analizu koje vrste sadržaja imaju problema s indeksiranjem. Na primjer, ako od 20.000 URL-ova u sitemapu samo 8.000 bude indeksirano, potrebno je dodatno ispitati opise proizvoda, stanje zaliha, duplicirani sadržaj, brzinu stranice ili strukturu filtriranja.
4. Kreirajte Sitemap u WordPress-u
WordPress 5.5 i noviji ima ugrađenu XML sitemap funkcionalnost. Po defaultu je dostupna na adresi /wp-sitemap.xml. Međutim, na mnogim profesionalnim projektima, dodatci kao što su Rank Math, Yoast SEO ili slični nude napredniju kontrolu sitemapa, pa se preferiraju. Ovi dodaci omogućuju određivanje koje vrste sadržaja će biti uključene u sitemap, hoće li se prikazivati arhive oznaka i kako će se upravljati arhivama autora.
Česta greška na WordPress stranicama je dodavanje stranica s niskom vrijednošću oznaka u sitemap. Ako stranice s oznakama nemaju originalni opis, jake interne poveznice i stvarnu potražnju pretraživanja, bolje ih je izostaviti iz sitemapa. Također možete povezati temu kako napisati SEO optimiziran blog post kako biste ojačali svoju strategiju sadržaja.
5. Postavite automatski Sitemap na prilagođenim softverskim stranicama
Na stranicama s prilagođenim softverom, sitemap se može ručno pripremiti; međutim, dinamičnim projektima potrebna je automatska proizvodnja. Kada se doda proizvod, objavi blog post ili ažurira stranica usluge, sitemap se također mora automatski ažurirati. Preporučuje se timu developera da primijeni sljedeća pravila:
- Objavljene stranice automatski se dodaju u sitemap.
- Izbrisani ili 404 URL-ovi se uklanjaju iz sitemapa.
- Stranice s noindex oznakom ne smiju se dodavati u sitemap.
- Stranice s različitim kanoničkim odredištima trebaju se pažljivo upravljati.
- Lastmod se ažurira samo kod stvarnih promjena sadržaja.
Ova automatizacija je ključna za tehničko zdravlje SEO-a, posebno na projektima vijesti, oglasa, rezervacija, obrazovanja i e-trgovine koji se često ažuriraju.
Kako odrediti Sitemap unutar Robots.txt?
Dodavanje adrese sitemap-a na dno robots.txt datoteke je dobra praksa. Na taj način botovi mogu lako pronaći vašu web mapu. Primjer korištenja:
- User-agent: *
- Allow: /
- Sitemap: https://tvojadomena.com/sitemap.xml
Ako imate više sitemap datoteka, možete svaku od njih navesti u odvojenom retku:
- Sitemap: https://tvojadomena.com/post-sitemap.xml
- Sitemap: https://tvojadomena.com/product-sitemap.xml
- Sitemap: https://tvojadomena.com/category-sitemap.xml
Ako koristite HTTPS na svom domenu, URL-ovi sitemapa također trebaju biti HTTPS. Ne smiju se miješati HTTP, www i non-www varijacije. Stoga je važno da se struktura domene, SSL i preusmjeravanja pravilno planiraju od samog početka. Ako pokrećete novi projekt, obavezno obradite provjeru domene i SSL certifikat korake zajedno s vašim tehničkim SEO planom.
Slanje Sitemap-a na Google Search Console

Nakon što ste izradili sitemap, trebate ga poslati putem Google Search Console-a. Koraci su sljedeći:
- Prijavite se na Google Search Console.
- Odaberite ispravnu imovinu. Preporučljivo je koristiti imovinu domene.
- U lijevom izborniku idite na odjeljak Sitemap.
- Upišite URL sitemapa. Na primjer sitemap.xml.
- Kliknite na gumb Pošalji.
- Provjerite u odjeljku Status informaciju o uspjehu i broj otkrivenih URL-ova.
Nakon slanja sitemapa, ne očekujte odmah da će sve stranice biti indeksirane. Google prvo otkriva URL-ove, pregledava ih, obrađuje i na temelju signala kvalitete odlučuje hoće li ih indeksirati. Na novim stranicama, ovaj proces može trajati od nekoliko dana do nekoliko tjedana. Snažna interna povezanost, kvalitetan sadržaj i brzi odgovor poslužitelja pozitivno utječu na proces.
Najčešće greške u Robots.txt i Sitemap-u
1. Pogrešno blokiranje cijele stranice
Najkritičnija greška je ostavljanje pravila Disallow: / na aktivnoj stranici. Ovo pravilo sprječava pregledavanje cijele stranice. Ako se ova postavka koja se koristi u razvojnom okruženju ne ukloni pri prijelazu na aktivnu stranicu, Google ne može pregledati nove stranice. Robots.txt mora biti na kontrolnom popisu za prijelaz na aktivnu stranicu.
2. Dodavanje noindex stranica u Sitemap
Dodavanje noindex oznake stranici, a istovremeno uključivanje iste stranice u sitemap stvara kontradiktorne signale. Sitemap kaže da je ova stranica važna dok noindex kaže da je ne indeksirajte. Stoga, sitemap treba sadržavati samo URL-ove koje želite indeksirati.
3. Držanje URL-ova koji vraćaju 301, 404 ili 500 u Sitemap-u
URL-ovi unutar sitemapa trebaju idealno vraćati kod statusa 200. Preusmjereni, nepostojeći ili URL-ovi s greškom trebaju se redovito uklanjati. Mjesečna tehnička SEO provjera omogućuje vam rano otkrivanje ovih grešaka.
4. Korištenje pogrešnog domenskog imena ili protokola
Ako koristite https://www.tvojadomena.com, URL-ovi unutar sitemapa također trebaju biti u istom formatu. Različiti protokoli ili varijacije domene mogu otežati Googleu kombiniranje signala. Stoga, kanoničke oznake, sitemaps, robots.txt i struktura preusmjeravanja trebaju ukazivati na isti osnovni URL format.
5. Slanje previše URL-ova
Sitemap nije kanta za smeće. Umjesto da dodate svaku URL, dodajte samo kvalitetne stranice koje stvarno želite indeksirati. Isključivanje niskokvalitetnih, dupliciranih ili slabih stranica iz sitemapa šalje čišće signale pretraživačima.
Tehnička SEO kontrolna lista za 2026.
Kada pripremate robots.txt i sitemap datoteku, možete koristiti sljedeću kontrolnu listu:
- Je li Robots.txt u korijenskom direktoriju i dostupan?
- Je li adresa sitemapa ispravno navedena u robots.txt?
- Jesu li važne stranice otvorene za pregledavanje i nisu blokirane robots.txt?
- Jesu li CSS, JavaScript i slikovni resursi pregledivi?
- Uključuje li sitemap samo indeksabilne URL-ove koji vraćaju 200?
- Da li su noindex stranice izvan sitemapa?
- Odgovaraju li lastmod datumi stvarnim ažuriranjima?
- Korištenje sitemap indeksa na velikim stranicama?
- Je li sitemap uspješno obrađen u Google Search Console-u?
- Podržavaju li vremena odgovora poslužitelja efikasnost pregledavanja?
Tehnički SEO nije ograničen samo na izradu datoteka. Performanse hostinga, konfiguracija SSL-a, točnost DNS-a, preusmjeravanja, mobilna prilagodljivost i kvaliteta sadržaja također izravno utječu. Stoga je korisno razmotriti hosting paketi, prijenos domene i sigurnost web stranice prilikom planiranja infrastrukture vašeg projekta.
Primjer strategije Robots.txt i Sitemap
Preporučena struktura za jednostavnu korporativnu web stranicu može uključivati: početnu stranicu, uslužne stranice, stranicu o nama, kontakt i blog postove unutar sitemapa. Upravljačka ploča, stranice zahvalnosti za obrasce, privremeni testovi kampanja i rezultati interne pretrage upravljaju se putem robots.txt ili noindex. U takvoj stranici, sitemap obično sadrži između 20-200 URL-ova.
Na srednje velikoj e-trgovinskoj stranici, mape proizvoda, kategorija, marki i bloga mogu se odvojeno čuvati. Aktivni proizvodi se dodaju u sitemap, a trajno uklonjeni proizvodi se uklanjaju, dok se slični proizvodi preusmjeravaju 301. URL-ovi s filtrima se analiziraju pojedinačno. Filtri s potencijalom za pretraživanje i konverziju se strukturiraju kao posebne kategorije; ostali se kontroliraju strategijama robots.txt, kanonikalne ili noindex.
Na blogu ili vijestima s bogatim sadržajem, datumi objavljivanja, datumi ažuriranja, struktura kategorija i interna povezanost su od velike važnosti. Kada se stari sadržaj ažurira, lastmod se mora ispravno promijeniti, ali ne smije se vršiti umjetno ažuriranje. Signal kojem Google vjeruje je stvarno poboljšanje sadržaja.
Često postavljana pitanja
Da li robots.txt datoteka potpuno onemogućava indeksiranje?
Ne. Robots.txt onemogućava pregledavanje; indeksiranje ne onemogućava u svakom slučaju. Ako URL dobiva linkove s drugih stranica, Google može prikazati taj URL u indeksu i bez pregleda. Za onemogućavanje indeksiranja obično se koristi noindex oznaka ili odgovarajuće ograničenje pristupa.
Osigurava li sitemap visoke pozicije na Googleu?
Sitemap ne jamči direktno rangiranje. Međutim, pomaže u bržem otkrivanju važnih stranica, obavještava pretraživače o ažuriranjima i poboljšava tehničko zdravlje SEO-a. Za rangiranje su potrebni i kvaliteta sadržaja, poveznice, korisničko iskustvo, brzina i signali povjerenja.
Je li obavezno navesti sitemap u robots.txt?
Nije obavezno, ali se preporučuje. Uključivanje adrese sitemapa u robots.txt olakšava pretraživačima pronalaženje vaše web mape. Također, slanje sitemapa putem Google Search Console-a također je dobra praksa.
Koja je adresa sitemapa za WordPress?
Standardna adresa sitemapa za WordPress obično je u obliku /wp-sitemap.xml. Ako koristite SEO dodatke, adresa sitemapa može biti /sitemap_index.xml ili /sitemap.xml. Trebate provjeriti koja se adresa koristi ovisno o dodatku koji koristite.
Koliko URL-ova može biti u sitemapu?
Jedna XML sitemap datoteka ne smije sadržavati više od 50.000 URL-ova i ne smije premašiti 50 MB. Za veće stranice, najbolje je koristiti indeks sitemapa kako biste sadržaj razdvojili na datoteke za stranice, postove, proizvode, kategorije ili slike.
Zaključak
Robots.txt i sitemap datoteka su dva osnovna dijela tehničkog SEO-a koja se možda čine malima, ali imaju veliki utjecaj. Robots.txt usmjerava ponašanje botova pri pretraživanju, dok sitemap olakšava otkrivanje važnih URL-ova. Za pravilnu konfiguraciju važno je ostaviti važne stranice otvorenima, kontrolirano ograničiti nepotrebne dijelove, dodati samo indeksabilne URL-ove u sitemap i redovito pratiti putem Google Search Console-a.
Ako želite čvrsto postaviti tehničku osnovu svoje web stranice, dobar je korak započeti s pouzdanim hostingom, ispravnim upravljanjem domenama i SSL konfiguracijom. Možete istražiti Web Hosting, domen i SSL certifikat rješenja Hostragonsa kako biste stvorili brzu, sigurnu i SEO-friendly infrastrukturu za svoju stranicu.