Avant de référencer son site, ce qu’il faut savoir

Les balises

La plupart des moteurs de recherches lisent les balises dans les fichiers HTML pour les référencer.
Ces balises doivent se trouver dans la section

de votre page web

En voici quelques-unee
< META name="description" content="Description de votre site">
200 caractères maxi.
Il faut de cela soit direct et parlant.
Sur certains moteurs de recherche, c’est ce Meta tag qui est utilisé pour résumer votre site.

< META name="keywords" content="liste de mots clefs séparés par une virgule">
1000 Caractères maxi.
Trouvez les mots justes et mettez-vous à la place d’une personne qui cherche sur le web.

< META name="author" content="Nom prenom">
Le nom de l’auteur du fichier (Webmaster)

< META name="identifier-URL" content="http://www.cc-pays-de-gex.fr">
Votre URL (important si votre page web est sauvegarde sur le disque dure de quelqu’un)

< META name="revisit-after" content="7 days">
Donne au robot la fréquence de mise à jour de la page

< META name="reply-to" content="webmaster@gratuitweb.org">
Permet de vous contacter si la page est sauvée sur le disque dur d’un internaute

< META name="copyright" content=" Copyright © date nom">
Comme son nom l’indique (cela ne protége de rien mais cela rappelle aux internautes que même le web possède des copyrights).

< title> Titre de votre page web < /title>
Le titre de la page web est aussi essentiel que l’objet dans un mail. Si celui-ci manque le moteur aura des problèmes pour classer la page.

< META HTTP-EQUIV="content-language" CONTENT="fr">
Indique que ce site est écrit en français

< META http-equiv="Content-Type" content="text/html ; charset=iso-8859-1">
Indique le code caractère de votre site (Chaque alphabet est codifié différemment puisque les lettres sont différentes)

< META name="robots" content="index, nofollow">
Donne des directives au robot de recherche
Index ou noindex (indexe la page ou ne l’indexe pas)
Follow ou nofollow (suit les liens ou ne les suit pas)
All ou non (indexe cette page et suit les liens ou ne rien faire)

< META name="generator" content="Nom de votre éditeur HTML">
En général ce meta tag en rempli automatiquement par votre éditeur

< META NAME="rating" CONTENT="General">
Définit le type de site
General : Tout public
Mature : Adulte
Restricted : Accès restreint
14 years : 14 ans

< META NAME="Date-Creation-yyyymmdd" CONTENT="">
Date de création de la page

< META NAME="Date-Revision-yyyymmdd" CONTENT="">
Date de modification de la page

< META NAME="Distribution" CONTENT="Global ou Local">
Type de diffusion du document
global : Largement diffusé
local : Diffusion restriente

< META HTTP-EQUIV="expires" CONTENT="Sat, 01 Apr 2000 13:15:00 GMT">
Donne une date de validité à la page, après cette date la page ne sera plus indexée dans la base de données du moteur.

< META HTTP-EQUIV="refresh" CONTENT="x ;URL="adresse">
Charge automatiquement après un délai de x secondes la page spécifiée dans URL

La / les page(s) d’accueil

Certains moteurs de recherche prennent les X premiers mots de votre page d’accueil pour décrire votre site.
Si une description du site dans votre page d’accueil ne vous convient pas vous pouvez toujours camoufler le texte en le mettant de la même couleur que le fond en petits caractères

Remarque :
- Une bonne page d’accueil doit pouvoir se charger rapidement (pour ne pas décourager les internautes) elle doit donc avoir une taille inférieure à 60ko images comprises.
- L’internaute de doit pas à avoir à utiliser les ascenseurs
- L’internaute doit trouver une présentation globale du site
- L’internaute doit pouvoir trouver une adresse email facilement pour contacter le webmaster
- Cette page doit être mise à jour régulièrement afin d’indiquer les mises à jour des sous-chapitres
- Bien vérifier les liens vers vos sous chapitres
Si vous avez des images dans votre page d’accueil, n’oubliez pas de remplir le ALT=
- Vérifier bien l’orthographe

La structure du site.

Il faut diviser votre site en dossiers et sous dossiers en fonction des chapitres et des sous chapitres de votre site. Le nom de chaque dossiers est important puisque la plupart des moteurs de recherche affichent l’URL complet du site et donc le nom des dossiers.
Chaque dossier devra aussi contenir un fichier index.html (fichier de chargement par défaut d’un site web) voir page d’accueil.

Fichier robot.txt

Il sert à indiquer aux robots des moteurs de recherche quelles pages ou quels répertoires ils ne doivent pas indexer.
Ce fichier doit se trouver à la racine du site

Il n’y a que 2 commandes :
user-agent : *
Permet de sélectionner les robot qui doivent utiliser se filtre. Le problème est de connaître le nom des robots. Le * signifie tous les robots.
Disalow : /
Permet d’interdire aux robots l’accès à une partie du site. " / " signifie tout le site, mais vous pouvez mettre n’importe quelles arborescences

Remarque :
Certains moteurs de recherche ne se préoccupent pas de ce fichier. Pour protéger vos données il vaux mieux utiliser un fichier " .htacces " par exemple.

Les mises à jour

Chaque moteur de recherche / annuaire à sa propre fréquence de mise à jour. Ils faut donc après chaque grand changement ou régulièrement se rappeler au bon souvenir des moteurs de recherche (au cas où).