SEO
De Wiki.
Pré-requis fondamentaux
Validation dans Webmaster Tools
Ajouter et valider le site dans le panel Webmaster Tools de Google.
Utiliser le compte du client si fourni. Sinon, utiliser le compte Couleur Citron, ou encore créer un nouveau compte.
La vérification se fait par upload d'un fichier de signature (fourni par Google) sur le serveur. Renommer ce fichier en google.html, ce qui lui permettra de passer à travers les règles de url-rewriting et de servir à vérifier les multiples adresses associées à un même site.
Installation Analytics
Ajouter le script de taggage Analytics de Google.
Utiliser le compte du client si fourni. Sinon, utiliser le compte Couleur Citron, ou encore créer un nouveau compte.
Passage en production
Les sites en pré-productions sont tenus hors de l'index des moteurs par:
- un fichier robots.txt prohibant accès et indexation,
- les instructions noindex, nofollow dans le meta tag robots
Ces restrictions doivent être levées lors du passage en production.
Les instructions noindex, nofollow se réglent au niveau cms_site et nécessitent une regénération complète des pages pour être effectives.
Robots.txt
Le fichier robots.txt définit les sections soumises à indexation par les moteurs de recherche.
Ce fichier est maintenu de façon automatique par le CMS, il n'est donc pas nécessaire de le remplir. Dans le cas typique robots.txt est un fichier vide.
Toutefois, si des URL spécifiques (fin d'événements, pages mortes) doivent y figurer, elles pourront être ajoutées manuellement à robots.txt.
Sitemap.xml
De la même façon que le fichier robots.txt, le fichier sitemap.xml ne doit pas être créé manuellement, il est servi dynamiquement par le serveur.
Là encore, on pourra manuellement modifier le fichier de base sitemap.php pour lui ajouter des instructions faisant défaut dans la version dynamique (dans 99% de cas, ce recours n'est pas nécessaire).
De plus, la génération dynamique inclut une partie générique (CMS) et une partie métier (spécifique client).
- pour la partie CMS : /include/cms-inc/utils/sitemap.inc.php,
- pour la partie métier : /include/modules/[répertoire du site]/sitemap.inc.php
Page 404
ErrorDocument 404 /content/stela/404.php
Balises metas
Balises Open graph
Balise Cannonical
Déclaration de domaines à rediriger,
au niveau mod-rewrite
au niveau webmaster tools
Plan de redirection
Plan du Site
Diagnostics
Erreurs de crawl
Ratio pages indexées / pages publiques total
Validité sémantique des pages
Remonter dans la page les contenus pertinents à l'indexation
Validité Code xHTML/HTML5
Ouverture / fermeture des balises
ex :
<script> non fermés
etc.
Des attributs alt manquantes
ex :
<img src="/custom/img/fr/logo_airbus.png" border="0" />
Mauvaise casse
ex :
<form id="form_personnalisation" action="/index.php" method="POST">
Caractères interdits
ex : ampersand
Associations & fondations
Doublons d'ID
ex :
<input type="hidden" id="fondateur_id" value="2" /> ... <input type="hidden" id="fondateur_id" value="34" />
Erreurs de syntaxe - fautes de frappe
ex : tile
<a href="/content/fr/Contact/" tile="Contactez-nous">Contactez-nous</a>
Vérifier les apostrophes typographiques
ex :
Nous n’avons
(remplacer par ' ou le htmlentity correspondant)
Cohérence html4 / xhtml / html5
Vérifier que des balises d'un autre namespace ne traînent pas dans le code source
ex :
< BR> ( html4 )
Attributs manquants
ex :
balise <script>
NB : ignorer les erreurs relatives aux namespaces des balises opengraph, vimeo et google +1