Как да изтриете сайт или неговите фрагменти от индекса на Google
Съгласно концепцията за индексиране, приета от Google, са взети предвид пълнотата, обективността на информацията и спазването на нейната заявка за търсене при предаването на резултатите. Ако даден сайт с незаконно съдържание влиза в индекса или ресурсът е предназначен за спам, тогава страниците на такъв сайт няма да бъдат маркирани в общата база данни на търсачката. За нас е важно да научим, как да изтриете сайт от издаването на сървъра въз основа на резултатите от търсенето.
Опции за нулиране на индексирането за Google
Веднага след като роботът - програмата за събиране на информация за нови ресурси - сканира сайта на страница, тогава ако отговаря на изискванията на правилата на Google относно анализа, той ще бъде индексиран. Но също така ще опишем как да изтриете вашия сайт или отделни фрагменти за търсачките, като използвате robots.txt - показалец и в същото време терминатор за търсене.
За да изключим целия ресурс от проблема, в основната папка на сървъра, на който се намира сайтът, се създава определена зона за текст - горепосоченият файл robots.txt. Тази зона се обработва от търсачките и работи в съответствие с инструкциите.
Имайте предвид, че търсещата машина на Google ще индексира страницата, дори ако потребителят няма право да я преглежда. Когато браузърът издава отговор 401 или 403, "Достъпът не е валиден", това важи само за посетителите, а не за строителите за това търсачката.
За да разберем, как да премахнете сайт от индекса за търсене, в показалеца на текста трябва да бъдат включени следните редове:
Потребителски агент: Googlebot
Забрана: /
Това показва на робота за търсене, че е забранено да се индексира цялото съдържание на сайта. тук как да изтриете сайт Google, така че последният да не кешира ресурса в списъка.
Опции за сканиране за различни протоколи
Ако трябва да посочите отделни стандарти за комуникация, за които бихте искали да приложите конкретни правила за индексиране на Google, например, отделно за хипертекст http / https, Това също трябва да бъде зададено в robots.txt по следния начин (пример).
(https://yourserver.com/robots.txt) - името на домейна на вашия сайт (всяко)
Потребителски агент: * - за всяка търсачка
Позволява: / - позволи пълно индексиране
Как да премахнете напълно сайта от издаването за https протокола
(Https://yourserver.com/robots.txt):
Потребителски агент: *
Забрана: / пълна забрана на индексирането
Неотложено премахване на URL адреса на ресурса от търсенето с Google на Google
Ако не искате да чакате повторно индексиране и сайтът трябва да бъде скрит възможно най-скоро, препоръчваме да използвате услугата https://services.google.com/urlconsole/controller. Предварително-robots.txt трябва вече да бъде поставен в основната директория на сървъра на сайта. Инструкциите трябва да бъдат написани в него.
Ако указанието по някаква причина не е налице за редактиране в основната директория, достатъчно е да го създадете в папката с обекти, за които искате да се скриете от търсачките. Щом го направите и се свържете с услугата за автоматично премахване на хипертекст, Google няма да сканира папките, изписани в robots.txt.
Периодът на такава невидимост е фиксиран за 3 месеца. След този период директорията, премахната от издаването, ще бъде обработена отново от сървъра на Google.
KКак да изтриете сайт за сканиране отчасти
Когато ботът за търсене прочита съдържанието на robots.txt, а след това въз основа на съдържанието му, се вземат определени решения. Например, трябва да изключите от дисплея цялата директория, наречена anatom. За това е достатъчно да напишете такива инструкции:
Потребителски агент: Googlebot
Забранете: / анатом
Или, например, не искате да индексирате всички снимки като .jpg. За да направите това, добавете следния списък:
Потребителски агент: Googlebot
Забрана: /*.jpg$
Ето още един пример. Нека изтрием информацията за динамично генерираните страници от анализа, след което добавете следния запис към показалеца:
Потребителски агент: Googlebot
Забрана: / *?
Така че, приблизително, и правилата за търсачките са предписани. Друго нещо е, че е много по-удобно за всичко това да използвате маркера META. И уебмастърите често използват точно такъв стандарт, който регулира работата на търсачките. Но ние ще говорим за това в следващите статии.
- Класиране - какво означава това?
- Индексиране на страници. Бързо индексиране на сайта от търсачките "Google" и…
- Както в "Google Chrome" премахнете началната страница. Конфигуриране на браузъра от…
- Google Alert: всички подробности
- Търсене в сайта чрез Google и Yandex. Сценарий за търсене в сайта
- Контекстуална реклама на Google
- Индексиране на сайта в търсачките
- Какво представлява роботът? Функциите на робота за търсене "Yandex" и Google
- Индексиране на сайт в търсачките. Как се индексира сайтът в "Yandex" и "Google"
- Как да променя настройките си за търсене в Google Chrome?
- Търси сървър: какво е, списък, предимства и недостатъци
- Как да направите началната страница на Google в различни браузъри?
- Добавянето на сайт към търсачките не е достатъчно - как да се ускори индексирането?
- Оптимизиране на сайтове. Регистрация в търсачките
- Ефективен асистент за всеки ресурс - огледален сайт
- Регистрацията на сайт в Google не е лесна, но много проста
- Защо да регистрираме сайт в Google Анализ?
- Как да добавите сайт към Google?
- Google. Разширено търсене като работен инструмент
- Регистрирайте сайт в търсачките - това е много важно за неговото популяризиране
- Малко за това как да индексирате уебсайт