Informatique


Les métabalises

Organiser l'en-tête du document

Métabalises donc ?

Les balises META servent à placer des métadonnées (metadata) dans l’élément head de la page HTML, elles ne seront pas affichées sur la page. Ces informations sont destinées aux outils susceptibles de les exploiter:

A quoi servent les métabalises ?

A beaucoup pour certains, à rien du tout pour d"autres.

Concernant le référencement de plus en plus de spécialistes les considèrent comme parfaitement inutiles. En effet les informations qu'elles contiennent sont-elles utilisées ou pas par les robots ? Et comment sont-elles manipulées? Les réponses à ces 2 questions n'existent pas pour la bonne raison que l'on ne sait pas comment les robots d'inexation fonctionnent (à part bien sûr ceux qui les ont programmés).

Les métadonnées utiles

title

Le contenu est utilisé de diverses manières:

Enfin, notez que son importance pour le référencement des pages est primordiale. Un élément title bien rédigé devrait, dans l’idéal:

html

A
A
G
i-l

 <title>Site de la section Sciences-Informatique de l'ICTFF</title>

meta charset

Cette balise META n’est pas indispensable, les informations qu’elle donne devraient logiquement être envoyées par le serveur web au moment où il envoie la page HTML au navigateur. Redoubler cette information dans la page HTML elle-même permet d’avoir une information sur l’encodage des caractères utilisé (UTF-8 ou ISO-8859-1 ou d’autres encore), ce qui s’avèrera très utile dans les cas suivants:

html

A
A
G
i-l

 <meta charset="utf-8">

meta description

Cette META permet de fournir une description courte (deux à trois phrases courtes) de la page web. Cette description est utilisée (dans certains cas) par les principaux moteurs de recherche, pour fournir le court texte d’aperçu des pages de résultats, ou bien par les réseaux sociaux (Facebook, Google+) pour définir le paragraphe de texte associé au lien partagé. Dans l’idéal, chaque page aura sa propre description. Voici quelques conseils pour la rédaction de cette description:

html

A
A
G
i-l

 <meta name="description" content="Apprendre la programmation pour le web au moyen de tutoriels" >

Les équivalents d’en-têtes HTTP (http-equiv)

Les en-têtes HTTP (HTTP headers) font partie d’un des standards fondamentaux du Web: l’HyperText Transfer Protocol. Ce sont des métadonnées ou indications qu’un serveur web envoie à chaque fois qu’il envoie un fichier (page web, feuille de styles, image, etc.) à un navigateur web.

Voici à quoi peuvent ressembler les en-têtes HTTP envoyées avec un fichier HTML:

Cela fait pas mal d’informations. Vous reconnaissez peut-être la dernière: 200 OK (tout va bien). Si le fichier n’avait pas été disponible, le serveur aurait pu renvoyer un 404 Not Found par exemple.

On trouve aussi l’en-tête Content-Type qui informe le navigateur sur le type de fichier (ici text/html, mais pour d’autres fichiers on pourrait avoir text/plain, text/css, image/png, etc.); et qui donne également une information sur l’encodage des caractères. Attention: ces informations sont prioritaires sur la META Content-Type, qui devrait normalement les reprendre à l’identique lorsqu’elle est utilisée.

On retrouve aussi l’en-tête Content-Language, qui précise la langue principale du document; dans l’exemple ci-dessus, il indique que le public visé lit le français du Canada (québécois).

Il faut éviter meta refresh.

html

A
A
G
i-l

 <meta http-equiv="Content-Language" content="fr-CA">
 <meta http-equiv="Cache-Control" content="max-age=600" >
 <meta http-equiv="Expires" content="Wed, 30 Feb 2009 17:00:59 GMT" >

Les indications données aux robots d’indexation

Vous pouvez utiliser les balises META pour donner des indications aux robots d’indexation des moteurs de recherche (indications qu’ils seront libres de suivre ou pas, mais les principales sont bien appliquées). On utilisera pour cela la META Robots:

html

A
A
G
i-l

 <meta name="robots" content="commande1, commande2, commande3">

Demander aux robots d’indexer vos pages

Inutile de demander aux robots d’indexation d’indexer vos pages: c’est leur comportement par défaut! Ainsi les deux lignes suivantes, en plus d’être équivalentes, sont tout à fait inutiles:

Elles illustrent toutefois le principe de fonctionnement de cette balise META: on utilise une balise META, et on y liste un certain nombre d’options prédéfinies, séparées par des virgules.

html

A
A
G
i-l

 <meta name="robots" content="index, follow, archive">
 <meta name="robots" content="all">

Restreindre l’indexation et les données affichées en page de résultat

Voici un ensemble de commandes pour restreindre l’indexation:

À cela se rajoutent quelques directives, souvent propres à un moteur donné, telles que:

Il est aussi possible d’adresser les différentes directives à un moteur de recherche donné, plutôt qu’à tous les moteurs de recherche. Pour cela, on remplace le mot-clé robots par le nom du robot d’indexation du moteur visé.
Par exemple:

html

A
A
G
i-l

 <meta name="Googlebot" content="directives pour Google Search">
 <meta name="Slurp" content="directives pour Yahoo! Search">
 <meta name="MSNbot" content="directives pour Live Search">

meta inutiles et obslètes

Les meta suivantes ne servent à rien, les moteurs de recherche et autres robots d'indexation les méprisenr, rien de moins.
Une petite liste:

html

A
A
G
i-l
 <meta name="keywords" content="informatique, php, jquery, css, html, tuto, tutoriels,ictff," >
 <meta name="generator" content="monCMS">
 <meta name="author" content="Perry l'Ornythoringue">
 <meta name="copyright" content="©WebSocities and co">
 <meta name="revisit-after" content="14 days">
 <meta name="revisit" content="7 days">