Kaip ištrinti svetainę ar jos fragmentus iš "Google" indekso

Internetas

Pagal "Google" patvirtintą indeksavimo koncepciją,Atsižvelgiama į informacijos išsamumą, objektyvumą ir atitikimą paieškos užklausai, kai pateikiami rezultatai. Jei svetainė su neteisėtu turiniu įveda indeksą arba jis yra skirtas šlamštui, tokios svetainės puslapiai nebus pažymėti bendrosios paieškos sistemos duomenų bazėje. Svarbu mums išmokti ištrinti svetainę iš serverio paieškos rezultatuose.

"Google" nulio indeksavimo parinktys

Kai tikrintuvas yra rinkimo programainformacija apie naujus išteklius - bus nuskaityti svetainę kiekviename puslapyje, tada, jei ji atitinka "Google" politikos dėl analizavimo reikalavimus, ji bus indeksuota. Tačiau mes taip pat apibūdinsime, kaip ištrinti jūsų svetainę ar atskirus paieškos sistemos fragmentus naudodami robots.txt - rodyklę ir tuo pačiu metu paieškos terminatorių.

Išskyrus visą šaltinį nuo išleidimo,serverio šakninis aplankas, kuriame yra svetainė, sukuria konkrečią teksto zoną - pirmiau minėtą robots.txt. Ši zona apdorojama paieškos sistemomis ir veikia pagal skaitytus nurodymus.

Turėkite omenyje, kad "Google" paieškos variklisindeksuokite puslapį, net jei vartotojas negali peržiūrėti. Kai naršyklė atsako 401 arba 403, "Prieiga neteisinga", tai taikoma tik lankytojams, o ne šio rinkimo serverio rinkimo programoms.

Norėdami suprasti, kaip ištrinti svetainę iš paieškos indeksavimo, teksto rodyklėje turėtumėte įvesti šias eilutes:

Naudotojo agentas: "Googlebot"

Neleisti: /

Tai nurodo paieškos robotui, kad draudžiama indeksuoti visą svetainės turinį. Štai kaip ištrinti "Google" svetainę, kad svetainė neaptiktų šaltinio sąraše aptiktų svetainių.

Skenavimo parinktys skirtingiems protokolams

Jei reikia nurodyti atskirus standartusjungtis, kuri norite taikyti specialias nuostatas dėl "Google" indeksavimo, pavyzdžiui, atskirai hiperteksto protokolus HTTP / HTTPS, taip pat būtina registruotis į tokiu būdu (pavyzdys) robots.txt.

(http://yourserver.com/robots.txt) - jūsų svetainės domeno vardas (bet kuris)

User-agent: * - bet kokiam paieškos varikliui

Leisti: / - leisti visišką indeksavimą

Kaip visiškai pašalinti svetainę iš problemos "https" protokolui

(https://yourserver.com/robots.txt):

Vartotojo agentas: *

Neleisti: / visiškai uždrausti indeksavimą

Skubus šaltinio URL šalinimas iš "Google" paieškos rezultatų

Jei nenorite laukti naujo indeksavimo, irSvetainė turėtų būti paslėpta kuo greičiau, aš rekomenduoju naudotis paslauga http://services.google.com/urlconsole/controller. Pre-robots.txt jau turi būti įtrauktas į svetainės serverio šakninį katalogą. Reikėtų nurodyti atitinkamus nurodymus.

Jei rodiklis dėl kokios nors priežasties negalimasNorėdami redaguoti šakninį katalogą, pakanka sukurti jį aplanke su objektais, kurie turi slėpti iš paieškos sistemų. Kai tai atliksite ir eikite į paslaugą, kad galėtumėte automatiškai pašalinti hiperteksto adresus, "Google" nebus nuskaito aplankų, kurie yra užregistruoti, kad juos pašalintų robots.txt.

Tokio nematomumo laikotarpis yra 3 mėnesiai. Po šio laikotarpio "Google" apdoros katalogą, pašalintą iš problemos.

IkiKaip pašalinti svetainę iš dalies nuskaityti

Kai paieškos robotas nuskaito robotų turinį.txt, tada tam tikri sprendimai priimami remiantis jo turiniu. Tarkime, kad nereikia rodyti viso katalogo, vadinamo anatom. Norėdami tai padaryti, pakanka rašyti tokias instrukcijas:

Naudotojo agentas: "Googlebot"

Neleisti: / anatom

Arba, pavyzdžiui, norite, kad visi vaizdai, pavyzdžiui, .gif, nebūtų rodomi. Norėdami tai padaryti, pridėkite šį sąrašą:

Naudotojo agentas: "Googlebot"

Neleiskite: /*.gif $

Čia yra dar vienas pavyzdys. Būtina pašalinti informaciją apie dinamiškai sugeneruotus puslapius iš analizavimo, tada pridėti įrašo tipą į rodyklę:

Naudotojo agentas: "Googlebot"

Neleisti: / *?

Taigi, apytiksliai, ir taisyklėspaieškos sistemos. Kitas dalykas yra tai, kad daug lengviau naudoti META žymelę. O žiniatinklio valdytojai dažnai naudoja tik tokį standartą, kuris reguliuoja paieškos sistemų veiksmus. Bet mes apie tai kalbėsime šiuose straipsniuose.