TheJoe.it Dans le (ouvrir) Source

24Feb/104

Utilisez le fichier “.htaccess” pour bloquer l'accès

googlebot1.jpg Pour quelqu'un qui est arrivé à contrôler l'accès d'un site sera jamais rencontré très semblables les uns aux autres accès, il est souvent crawler (Google lui-même utilise un type sophistiqué de robot appelé GoogleBot). Paraphrasant Wikipedia:

Une chenille (également appelé araignée le Robot), est un logiciel qui analyse le contenu d'un réseau (ou une base de données) dans un méthodique, automatisé, typiquement pour compte d'un moteur de recherche,.

Crawlers sont généralement inoffensives, créer un pas de circulation dans le site (si bien fait) à offrir Le service d'indexation que nous connaissons et apprécions tous. [plus]

Cependant, il ya robots que, en utilisant les mêmes mécanismes de l'indexation sur chenilles, balayage de la bande à la recherche d' failles dans le code pages. Comme nous le savons webmasters ne sont pas toujours attention à la planification, et parfois nous sommes conscients de certains les failles de sécurité Site (Le portail). Ces chenilles nuisibles explorer la longueur et la largeur du web, l'indexation des pages pour eux-mêmes afin de "Pierce«Le site, et accéder le serveur ou pour le pire des données sensibles.

Aussi, en plus de ne pas nous un bon service d'indexation faire, augmenter l'utilisation de la bande, forçant le navigateur à visiter le site plus lentement. Eh bien ... au-dessus insulte à l'injure.

Cependant, il est possible via un fichier texte simple de bloquer l'accès à certaines adresses IP ou "user agent" une fois identifié. Je parle de ce fichier. "Htaccess".

Le fichier «. Htaccess" est un fichier de configuration utile pour le serveur, un outil très simple, mais tout aussi puissante, et ne peut être utilisé à la légère. Une erreur dans le fichier de configuration peut inhiber l'accès à leurs pages webmaster, pour qui Andiamoci prudent.

La meilleure façon de savoir si le "agent utilisateur"Qui a fait une visite récente au site est chenilles nuisibles est une recherche sur Google. Laissez-le séparément "agent utilisateur” e l’Adresse IP à partir de laquelle nous avons reçu la demande.

Verrouiller le bot à travers. "Htaccess"

Cet exemple, et toutes les suivantes, On peut ajouter à la fin du fichier ".htaccess", toujours il a été créé. Si elle n'existe pas déjà, vous pouvez le créer: un simple fichier texte que nous appellerons ". htaccess" mettra en "répertoire racine"Le serveur.

#Débarrassons-nous du bot %{HTTP_USER_AGENT} ^ Malbot(.*)$ http://go.away /

Qu'est-ce que ce morceau de code? Simple. Les quelques lignes ci-dessus indiquent au serveur de contrôler tous les accès dont "user agent " en commençant par "Malbot". Quand il en trouve une qui coïncide redirections à une adresse qui n'existe pas appelé "http://go.away /".

Maintenant, nous allons voir comment bloquer plus d'un:

#Débarrassons-nous des robots %{HTTP_USER_AGENT} ^ Malbot [OU]
RewriteCond %{HTTP_USER_AGENT} ^ EvilScaper [OU]
RewriteCond %{HTTP_USER_AGENT} ^ FakeUser(.*)$ http://go.away /

Le code ci-dessus fait exactement les mêmes choses qui ont fait la première, dans ce cas, bloque tout "agent utilisateur"Qui commencent par"Malbot", "EvilScraper", "Faux utilisateur". Notez que quand il ya plus d'un bot pour verrouiller vous devez mettre "[OU]«À la fin de la ligne de toutes les règles, sauf que le dernier.

Verrouillage de la bande passante de "voleurs"

N'importe qui voile ne sait généralement pas, mais il arrive souvent que, pour être plus léger sur votre propre serveur (ou la simple ignorance) certains webmasters inclure des images de résidents ailleurs dans vos pages. Cette éclaircit la charge sur le serveur qui n'a pas le fardeau de l'accueil l'image, mais poids trafic sur le serveur où réside l'image, sans compter que le second serveur n'a pas de publicité du travail accompli.

Puisque nous ne pouvons pas nous permettre de changer en séquence les images sur notre site, dans ce cas aussi ".htaccess«Il ya de l'aide.

RewriteEngine on %{HTTP_REFERER} ^ Http://.*somebadforum  com. [NC]
Rewriterule .* - [F]

De cette façon "somebadforum.com"Allez être redirigé vers un Code "403 Interdite"Pour chaque image incluse. Le résultat final sera le symbole classique de l'image manquante (image brisée), e nostro côté serveur enregistre Sara.

Pour verrouiller plus d'un site c'est le code:

RewriteEngine on %{HTTP_REFERER} ^ Http://.*somebadforum  com. [NC,OU]
RewriteCond %{HTTP_REFERER} ^ Http://.*example1  com. [NC,OU]
RewriteCond %{HTTP_REFERER} ^ Http://.*example2  com. [NC]
Rewriterule .* - [F]

Comme ci-dessus, noter sur la finition de chaque ligne "OU", à l'exception de la dernière.

Interdire l'IP

Il peut aussi arriver que vous faites bot intelligent, et à changer de rotation "agent utilisateur", afin d'avoir un accès continu à des pages du site. Lorsque ce phénomène se produit d'une manière à bloquer l'accès au bot "imaginative" est bloquer IP (verrouiller seulement si il existe un accès continu à partir de la même adresse IP). Toujours dans notre fidèle ".htaccess"Ajoutez les lignes suivantes:

Order allow,nier 192.168.44.201
refuser de 1.2.3.4
refuser de 5.6.7.8
permettre à tous

Dans cet exemple, nous bloquons trois adresses IP, avec la dernière ligne garantir l'accès à tous les autres. Mais il est également possible de bloquer l'accès à la racine de l'adresse (c'est. 192.168.*):

Order allow,nier 192.168.
refuser de 100.29.
refuser de 500.699.
permettre à tous

Avec ces règles, toutes les adresses IP qui commencent par "192.168." (et la suivante) seront bloqués.

Proposer toujours de créer un sauvegarder des ".htaccess", les choses ne vont pas toujours comme on le voudrait, et ne serait pas utile à toute personne n'ayant pas accès à leur serveur. L'hébergeur le plus commun offrir un soutien déposer ".htaccess", au cas où votre hébergeur propose pas un tel soutien croire, c'est le cas de cambiare hébergeur.

Content de cet article?

Inscrivez vous à notre fil rss!

Sur

Je garde ce blog comme un hobby par 2009. Je suis passionné de graphisme, la technologie, logiciel Open Source. Parmi mes articles ne sera pas difficile de trouver de la musique, et quelques réflexions personnelles, mais je préfère la ligne directe du blog principalement à la technologie. Pour plus d'informations me contacter.

Remplis sous: SEO, Web Laisser un commentaire
Commentaires (4) Trackbacks (0)
  1. vous, et nous pouvons refuser l'accès au lieu de toujours utiliser le DNS.. htaccess est une grande ressource..

    et bien sûr merci pour le commentaire!

  2. Nous pouvons également utiliser des DNS au lieu de la propriété intellectuelle pour le laisser dans le htaccess.

  3. Ciao LU,
    merci pour les commentaires, en fait je n'ai pas précisé le type de serveur.. Je pensais qu'il était utilisé apache (le plus utilisé). Puis généralement le fournisseur de services d'hébergement sur serveur apache fournit également un soutien à “.htaccess” (Je parle de la majeure hébergeur italien: Aruba, enregistrer et société).

    Je suis content que mes commentaires d'articles intéressants, mais dans la nuit, vous n'avez rien de mieux à faire que de lire mes articles sur htaccess?? ahah!!

  4. Série d'articles intéressants. N'oubliez pas de préciser que tout cela est vrai si le serveur web est Apache (Bien que la plupart des services d'hébergement fournit simplement Apache) Outre le fait que de toute évidence est activée (une autorisation) gestion de fichiers “.htaccess”.
    Un autre détail intéressant, il ya la possibilité de donner un nom autre que “.htaccess” fichiers de configurations particulières, bien que généralement dans les services d'hébergement ne peuvent pas être une configuration de grain si fin.

    😀


Laisser un commentaire

Aucun trackbacks pour l'instant