Les métabalises
Organiser l'en-tête du document
Métabalises donc ?
Les balises META servent à placer des métadonnées (metadata) dans l’élément head de la page HTML, elles ne seront pas affichées sur la page.
Ces informations sont destinées aux outils susceptibles de les exploiter:
- aux navigateurs
- aux moteurs de recherche
- plus largement, à tous les outils d’indexation, c’est-à-dire tous les outils qui analysent vos pages pour y identifier diverses informations.
A quoi servent les métabalises ?
A beaucoup pour certains, à rien du tout pour d"autres.
Concernant le référencement de plus en plus de spécialistes les considèrent comme parfaitement inutiles.
En effet les informations qu'elles contiennent sont-elles utilisées ou pas par les robots ? Et comment sont-elles manipulées?
Les réponses à ces 2 questions n'existent pas pour la bonne raison que l'on ne sait pas comment les robots d'inexation fonctionnent (à part bien sûr ceux qui les ont programmés).
Les métadonnées utiles
title
Le contenu est utilisé de diverses manières:
- par le navigateur web, dans le titre de la fenêtre, les onglets, comme titre des marque-pages (favoris), etc.
- par les moteurs de recherche et divers outils, comme titre d’un résultat de recherche par exemple
Enfin, notez que son importance pour le référencement des pages est primordiale. Un élément title bien rédigé devrait, dans l’idéal:
- être informatif et/ou attrayant pour le visiteur
- refléter le contenu de la page
- contenir des mots-clé pertinents
- faire moins de 70 caractères (pas une règle absolue, mais Google par exemple coupe les titres trop longs entre
65 et 70 caractères dans les pages de résultat, et les titres trop longs diluent le poids des différents mots-clé)
html
A
A
G
i-l
<title>Site de la section Sciences-Informatique de l'ICTFF</title>
meta charset
Cette balise META n’est pas indispensable, les informations qu’elle donne devraient logiquement être
envoyées par le serveur web au moment où il envoie la page HTML au navigateur.
Redoubler cette information dans la page HTML
elle-même permet d’avoir une information sur l’encodage des caractères utilisé (UTF-8 ou ISO-8859-1 ou d’autres encore), ce qui s’avèrera très utile dans les cas suivants:
- le serveur web, mal configuré, n’envoie pas les informations sur l’encodage (le navigateur web va alors tenter de les trouver dans le code HTML de la page)
- dans tous les cas où la page HTML est un fichier local, ouvert directement par l’utilisateur et pas consulté depuis un serveur web comme
par exemple pour la documentation en HTML fournie avec un logiciel, pour une page d’information sur un CD ou DVD, lorsque l’utilisateur enregistre
une page web dans ses documents, ...
meta description
Cette META permet de fournir une description courte (deux à trois phrases courtes) de la page web. Cette description est utilisée
(dans certains cas) par les principaux moteurs de recherche, pour fournir le court texte d’aperçu des pages de résultats, ou bien par les réseaux sociaux (Facebook, Google+)
pour définir le paragraphe de texte associé au lien partagé.
Dans l’idéal, chaque page aura sa propre description.
Voici quelques conseils pour la rédaction de cette description:
- elle doit être unique, et pas dupliquée à partir d'une autre page
- elle doit refléter fidèlement le contenu de la page
- elle doit être attractive pour l’utilisateur dont le regard «scanne» une page de résultats de moteur de recherche
- elle doit reprendre les principaux mots-clé de la page et être plutôt brève (200 caractères, bien qu’il ne s’agisse pas d’une règle stricte)
- si on est en mal d'inspiration pour décrire la page, trois stratégies sontpossibles:
- ne pas utiliser la META du tout
- utiliser la META seulement pour certaines pages clé, ou uniquement pour la page d’accueil
- extraire un contenu des contenus disponibles en base de données, par exemple le texte d’accroche pour une page d’article ou le
début de la description du produit pour une page produit
- une page ne sera pas «pénalisée» par un moteur de recherche parce qu’elle n’utilise pas de META Description. Mais si vous n’en utilisez pas,
faites attention à ne pas utiliser la balise du tout, et évitez les balises sans contenu
html
A
A
G
i-l
<meta name="description" content="Apprendre la programmation pour le web au moyen de tutoriels" >
Les équivalents d’en-têtes HTTP (http-equiv)
Les en-têtes HTTP (HTTP headers) font partie d’un des standards fondamentaux du Web: l’HyperText Transfer Protocol.
Ce sont des métadonnées ou indications qu’un serveur web envoie à chaque fois qu’il envoie un fichier (page web, feuille de styles, image, etc.) à un navigateur web.
Voici à quoi peuvent ressembler les en-têtes HTTP envoyées avec un fichier HTML:
Cela fait pas mal d’informations. Vous reconnaissez peut-être la dernière: 200 OK (tout va bien). Si le fichier n’avait pas été disponible,
le serveur aurait pu renvoyer un 404 Not Found par exemple.
On trouve aussi l’en-tête Content-Type qui informe le navigateur sur le type de fichier
(ici text/html, mais pour d’autres fichiers on pourrait avoir text/plain, text/css, image/png, etc.); et qui donne également une information sur l’encodage des caractères.
Attention: ces informations sont prioritaires sur la META Content-Type, qui devrait normalement les reprendre à l’identique lorsqu’elle est utilisée.
On retrouve aussi l’en-tête Content-Language, qui précise la langue principale du document; dans l’exemple ci-dessus, il indique que le public visé lit
le français du Canada (québécois).
Il faut éviter meta refresh.
html
A
A
G
i-l
<meta http-equiv="Content-Language" content="fr-CA">
<meta http-equiv="Cache-Control" content="max-age=600" >
<meta http-equiv="Expires" content="Wed, 30 Feb 2009 17:00:59 GMT" >
Les indications données aux robots d’indexation
Vous pouvez utiliser les balises META pour donner des indications aux robots
d’indexation des moteurs de recherche (indications qu’ils seront libres de suivre ou pas, mais les principales sont bien appliquées).
On utilisera pour cela la META Robots:
html
A
A
G
i-l
<meta name="robots" content="commande1, commande2, commande3">
Demander aux robots d’indexer vos pages
Inutile de demander aux robots d’indexation d’indexer vos pages: c’est leur comportement par défaut!
Ainsi les deux lignes suivantes, en plus d’être équivalentes, sont tout à fait inutiles:
Elles illustrent toutefois le principe de fonctionnement de cette balise META: on utilise une balise META, et on y liste un certain nombre d’options prédéfinies,
séparées par des virgules.
html
A
A
G
i-l
<meta name="robots" content="index, follow, archive">
<meta name="robots" content="all">
Restreindre l’indexation et les données affichées en page de résultat
Voici un ensemble de commandes pour restreindre l’indexation:
- noindex: pas d’indexation de la page
- nofollow: ne pas transmettre le potentiel de positionnement de la page
- noarchive: ne pas afficher de lien «En cache» dans les pages de résultat
- none: raccourci pour noindex, nofollow, noarchive
À cela se rajoutent quelques directives, souvent propres à un moteur donné, telles que:
- noodp: ne pas utiliser les descriptions de l’Open Directory Project dans les pages de résultat (MSN, Google, Yahoo!)
- noydir: ne pas reprendre les descriptions de l’annuaire Yahoo! dans les pages de résultat (Yahoo!)
- nosnippet: ne pas utiliser de description ou d’extrait dans les pages de résultats, donc utiliser le titre de page
(et dans certains cas les sitelinks) uniquement (Google, Yahoo!)
Il est aussi possible d’adresser les différentes directives à un moteur de recherche donné, plutôt qu’à tous les moteurs de recherche.
Pour cela, on remplace le mot-clé robots par le nom du robot d’indexation du moteur visé.
Par exemple:
html
A
A
G
i-l
<meta name="Googlebot" content="directives pour Google Search">
<meta name="Slurp" content="directives pour Yahoo! Search">
<meta name="MSNbot" content="directives pour Live Search">
meta inutiles et obslètes
Les meta suivantes ne servent à rien, les moteurs de recherche et autres robots d'indexation les méprisenr, rien de moins.
Une petite liste:
- meta keywords
- meta generator
- meta author
- meta copyright
- meta revisit-after
- meta revisit
html
A
A
G
i-l
<meta name="keywords" content="informatique, php, jquery, css, html, tuto, tutoriels,ictff," >
<meta name="generator" content="monCMS">
<meta name="author" content="Perry l'Ornythoringue">
<meta name="copyright" content="©WebSocities and co">
<meta name="revisit-after" content="14 days">
<meta name="revisit" content="7 days">