Pogreške indeksiranja - google webmaster tools

Imam 2 pitanja, možda mi možete pomoći…

  1. Kad uđem u svoj Google Webmaster Tools --> Dijagnostika --> Pogreške indeksiranja i pod “Nije pronađeno” vidim popis nekim 35 stranica koje google nije mogao pronaći (error 404). Međutim, stvar je u tome da sve te nabrojene stranice google nije mogao pronaći na nekoj tuđoj web stranici, a ne mojoj vlastitoj. Nije ih mogao pronači jer je na toj tuđoj stranici bila ispravno napisana moja glavna domena (npr.
    http://www.example.com
    ), ali ne i konkretan naziv web stranice. Npr. umjesto
    http://www.example.com/page1.htm
    piše
    http://www.example.com/pag
    što je greška! Da li se pogreške mogu ispraviti?

  2. Stranica mi je 2-3 dana bila smrznuta od strane moj pružatelja usluge i bila je nedostupna tj. kad god bi ili preko google tražilice ili direktnim upisivanjem u web preglednik upisao moju stranicu bio bi preusmjeren na neku drugu stranicu na kojoj je je pisalo da je stranica trenutačno nedostupna. Kad mi je stranica natrag odmrznuta i aktivirana, kad sam ušao u google webmaster tools pod pogreške indeksiranja vidio sam velik broj svojih stranica pod “Ogranićen datotekom robots.txt” iako ja nikad nisam ručno u datoteci robots.txt ništa limitirao niti ograničavao. Pretpostavljam da je za vrijeme dok mi je stranica bila smrznuta google dotične stranice nije mogao pronaći i smjestio ih tu. Sad mi te stranice više uopće nisu u googlovom indeksu. Kako da riješim taj velik problem?

ako već nemaš napravi sitemap.xml da po njemu google traži što treba indeksirat, imaš stranice koje to rade automatski pa ga samo uploadaš na svoj server
ovaj dio oko grešaka sve ovisi zašto su nastale, nekad se desi da greške uopće nema, najbolje da samo provjeriš da nisi ti nešto od navedenog krivo linkao, ostalo ako nisi siguran što radiš nemoj dirat jer si možeš deindeksirat pola stranica
u rootu servera ima robots.txt, možeš je uređivat, ako ispred nekog foldera Disallow:, a treba se indeksirat izbriši taj red
kod cms-ova je normalno da ti stavi neke foldere da ih se ne indeksira, npr administrator, tmp, language i slično

  1. Prva mogućnost - zamoliti webmastera da ispravi link.
    Druga mogućnost je 301 redirekcija:
    Redirect 301 /pag
    http://www.example.com/page1.htm

  2. Provjeriti robots.txt i submitati sitemap.xml

Vezano za moj problem pod točkom Ad 2…

Pronašao sam ovaj google članak:

“Ako je URL preusmjeren na drugi URL koji je blokiran datotekom robots.txt, za prvi URL bit će javljeno da je blokiran datotekom robots.txt (čak i ako je taj URL naveden na popisu “Dozvoljen” u alatu za analizu datoteke robots.txt)”

Dakle, moja stranica je neko vrijeme bila blokirana i bila je preusmejrena na neki drugi url mog provajdera koji je očito ograničen datotekom robots.

Ja sam ponovno uploadao sitemap.xml i robots.txt no čitavo brdo stranica i dalje mi je ograničeno datotekom robots i izbačeno iz indexa. ??