Gugl Indexuje wp-content/uploads/2020/09/?MA - Kako zaustaviti indexovanje ovih foldera

U WMT sam našao u Coverage - Indexed, not submitted in sitemap brdo ovih stranica.

Kad kucam site:mojsajtcom samo jedna od ovih stranica se pojavljuje. I danas sam poslao zahtjev za uklanjanje

Te wp-content/uploads/2020/09/?SD (ili neka dva druga slova a ne SD9 izgledaju ovako (ako je to uopšte bitno)

Sad meni se nikako ne sviđa što gugl indexuje ovo. Ne razumijem zašto indexuje uopšte ove foldere ili šta je već ovo.


Ođe sam našao neko rješenje, sad dal je dobro ili nije nemam pojma pa da priupitam nekog ako zna bilo bi lijepo čut jel neko od ova dva rješenja dobro i trajno. Na ova rješenja mislim:

“Change your robots.txt situated in root directory, like this”

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
Noindex: /wp-content/
Noindex: /wp-includes/

Ovo je drugo rješenje:

Incase you are willing to edit ht-access file, then that would be a better approach.

I myself use it on my site. My code below if put in htaccess files, blocks all PHP and backend specific files, but allows all images, videos, pdfs and various similar file formats to be indexed by Google and others.

# Serves only static files
RewriteCond %{REQUEST_FILENAME} -f
RewriteRule ^wp-(content|includes)/([^/]+/)*([^/.]+\.)+ (jp(e?g|2)?|png|gif|bmp|ico|css|js|swf|xml|xsl|html?|mp(eg[34])|avi|wav|og[gv]|xlsx?|docx?|pptx?|gz|zip|rar|pdf|xps|7z|[ot]tf|eot|woff2?|svg|od[tsp]|flv|mov)$ - [L]
RewriteRule ^wp-(content|includes|admin/includes)/ - [R=404,L]

da li su ispravni ovi načini i kodovi, koji bi vi odabrali?

Sad interesuje me koja od ova dva rješenja da primjenim. Da li ću ako zabranim indeksovanje wp-content tako zabraniti da se indexuju slike ili ne?

Imam još pokoje pitanje pa ako ko zna i oće odgovorit fala mu. Zašto se ovo događa na ovom sajtu a na nekim drugim se ne događa? Ovo je u pitanju novi sajt sa baš dosta sadržaja 150 članaka i zanimljivo da pola članaka nema kad se gugla site:mojsajtcom a eto danas prvi put vidim jednu od ovih wp-content/uploads/2020/09/?MA indexovanu

Da li je ovo možda normalno i treba tako? ili izaziva problem jer troši crawl budžet i indexuje sajdržaj koji je tanak i ne bi trebao bit indexovan.

Nikada prije nisam ovo vidio a u Wordpressu sam preko 10 godina. Moze biti da je neki plugin postavio nesto svoje. Po meni trebas naci uzrok sto to pravi ove foldere. Nikako ne bi bio ispravan pristup da zabranis nesto preko robots.txt ili preko .htaccess.
Edit: što je u tim fileovima? Da li su o tvoje slike ili je nesto bezveze, jer vidim da su svi veličine 4 kB. Probaj downloadat jednu od tih slika i otvori ju na PC-u sa notepadom i vidi šta je unutra. Meni sve ovo liči na neko hakiranje stranice.

ma nije nikakvo hakiranje stranice. ovo su sve moje slike i ovo je neki direktorijum slika, možda od cache, možda amp, možda (najvjerovatnije) samo razne resizovane verzije slika pojma nemam. Kolko vidim ako sam dobro istražio u odnosu na prvo pisanje, predlažu ljudi na mnogo mjesta da se odradi Disable Directory Browsing

Najlaksi nacin https://htaccessbook.com/disable-directory-indexes/

1 Like

Da riješio sam pristup direktorijima sa ubacivanjem onog koda u htacces

Sad oce li mi se zbog ovog pojavit tona erora? Dal će gugl pokušavat da indexuje i dalje ove direktorijume?

A jbga, ja to odmah kad pravim stranicu stavim. Nikada nisam stavljao kad je vec sajt bio live pa ne znam.

Ovisi, dali je Google For Trump ili For biden :smile:

Da budem on topic, evo jedan link sa problemom i mogućim pristupom ka rješavanju problema https://support.google.com/webmasters/thread/16974145?hl=en

Jeli ovo tvoj problem? Što vidiš “post” za attachment koji se nalazi u nekom originalnom postu? https://www.wpbeginner.com/wp-tutorials/how-to-disable-image-attachment-pages-in-wordpress/#:~:text=You%20can%20do%20this%20too,redirect%20users%20to%20parent%20posts.

Još jedan link https://www.wpexplorer.com/disable-image-page/

U mene nema grešaka, Google indexira sve živo, ali mi kaže što nije u sitemaps

a jel ti se pojavljuje u wmt ovi 403 erori iako odradiš odmah?

da, imam ovu stranicu otvorenu i pored nje još dvadesetak tabova oko ovog.

nije to problem, redirektovano mi je to preko joasta.

Pa i kod mene stoje ovi direktorijumi koje sam blokiro u coverage-valid, ali mi to nikako ne treba da gugl indexuje i troši uopšte crawl resurse kravlajući to, a npr nisu mi indexovani svi postovi

Ne znam bi li još šta trebao odradit sem ovog što sam dodao u htacces da gugl uopšte ne kravla i ne pokušava kravlat i indexovat te direktorijume, dal bi trebao još i da disejblujem mod_autoindex ili je ovo dovoljno.

Ništa vidjeću u wmt šta će se dešavat u narednim danima

Rek’o bi’ da je Google za Google.
Al’ kad bi’ baš treb’o nagadjati, ne bi’ se 100% kladio da je za onog ko im je ukin’o Huawei tržište.