Cookie

Attention


Cet article a été publié il y a plus d'un an, il peut y avoir des développements été.
S'il vous plaît prendre en compte.

Exister dans le réseau de normes de comportement pour crawler (le présenté, ou encore araignée) pour’L'indexation de contenu. Je ne parle pas dans le fichier “.htaccess“, qui est utilisé pour configurer le serveur Web, Je parle le fichier “robots.txt“.

Le fichier “robots.txt” est l'un des fichier de configuration simples qu'il n'y, et contrairement à “.htaccess” doit être placé unique que dans répertoire Radice Site. Ce fichier communique avec les moteurs de recherche qui indexent notre site indexation ou moins déterminé fichier le répertoire, et l'opération est très simple:

campo : valore

Vous ne pouvez entrer deux types de champs: “User-agent” et “Permettre / Interdire“.

User-Agent

Avec le champ “User-Agent” spécifier un moteur de recherche précise. Juste un petit Recherche sur Internet, ou un la surveillance de l'accès au fil du temps, pour réaliser le les principaux moteurs de recherche qui accèdent le site. Habituellement, les demandes dans le fichier “robots.txt” sont effectuées seulement par les moteurs de recherche, et en tout cas l'agent utilisateur sont immédiatement reconnaissables.

Permettre / Interdire

Avec la valeur “Permettre” le “Interdire” est déclarée Permis d'accès sur le site pour le moteur de recherche qui utilise l'agent d'utilisateur spécifié dans l' “User-Agent“. A titre d'exemple on peut vouloir exclure le répertoireimages” indexation des “Googlebot-Image“, surtout si les images que nous laissons sur le serveur nous voulons les vendre avec licences différent de Creative.

Permettez-moi de clarifier un peu’ Idées avec un bel exemple:

User-Agent : *
Disallow: /wp-

Dans ce cas, nous avons indiqué que les chenilles qui se produisent avec un agent d'utilisateur ne pas utiliser répertoires qui commencent par “wp-“, ceux qui se consacrent à l'administration de WordPress. Simple, pas?

Pas assez?


TheJoe

Je garde ce blog comme un hobby par 2009. Je suis passionné de graphisme, la technologie, logiciel Open Source. Parmi mes articles ne sera pas difficile de trouver de la musique, et quelques réflexions personnelles, mais je préfère la ligne directe du blog principalement à la technologie. Pour plus d'informations me contacter.

2 commentaires

TheJoe · 5 Juillet 2010 à 4:36 PM

Vous aurez également une incidence sur les articles de “.htaccess” puis! 😀

https://thejoe.it/wordpress/?s=htaccess

cours d'informatique · 5 Juillet 2010 à 3:35 PM

ottimo tip 🙂

Laisser un commentaire

Votre adresse email ne sera pas publiée. les champs requis sont indiqués *

Ce site utilise Akismet pour réduire le spam. Découvrez comment vos données de commentaire est traité.