Comment fonctionnent les moteurs de recherche ?
Les moteurs de recherche fonctionnent grâce à trois fonctions principales :
- L’exploration : Ils parcourent Internet à la recherche de contenu, en examinant le code/contenu de chaque URL qu’ils trouvent.
- L’indexation : Stocker et organiser le contenu trouvé au cours du processus d’exploration. Une fois qu’une page est dans l’index, elle est en course pour avoir un affichage comme résultat aux requêtes pertinentes.
- Classement : Fournir les éléments de contenu qui répondront le mieux à la requête d’un chercheur. Ce qui signifie que le classement des résultats est du plus pertinent au moins pertinent.
Qu’est-ce que le crawling des moteurs de recherche ?
Le crawling est le processus de découverte; par lequel les moteurs de recherche envoient une équipe de robots (appelés crawlers ou spiders). Pour trouver du contenu nouveau et mis à jour. Le contenu peut varier – il peut s’agir d’une page web. D’une image. D’une vidéo. D’un PDF, etc. – mais quel que soit le format, la découverte du contenu se fait par des liens.
Googlebot commence par récupérer quelques pages Web, puis suit les liens de ces pages pour trouver de nouvelles URL. En suivant ce chemin de liens. Le robot d’exploration est capable de trouver du nouveau contenu et de l’ajout à son index son nom; Caffeine – une base de données massive d’URL découvertes – pour faire la récupération plus tard lorsqu’un chercheur cherche des informations auxquelles le contenu de cette URL correspond.
Qu’est-ce qu’un index de moteur de recherche ?
Les moteurs de recherche traitent et stockent les informations qu’ils trouvent dans un index, une énorme base de données de tout le contenu qu’ils ont découvert et qu’ils jugent suffisamment bon pour faire une proposition aux chercheurs.
Classement des moteurs de recherche
Lorsqu’une personne effectue une recherche, les moteurs de recherche parcourent leur index à la recherche d’un contenu hautement pertinent, puis ordonnent ce contenu dans l’espoir de répondre à la requête de l’internaute. Cet ordonnancement des résultats de recherche en fonction de leur pertinence ce qu’on appelle classement. En général, on peut supposer que plus un site Web possède le bon classement, plus le moteur de recherche pense que ce site est pertinent pour la requête.
Il est possible de bloquer l’accès d’une partie ou de la totalité de votre site aux robots des moteurs de recherche, ou de demander aux moteurs de recherche de ne pas stocker certaines pages dans leur index. Bien qu’il puisse y avoir des raisons de procéder ainsi, si vous voulez que votre contenu soit trouvé par les chercheurs, vous devez d’abord vous assurer qu’il est accessible aux robots d’exploration et qu’il est indexable. Sinon, c’est comme s’il était invisible.
À la fin de ce chapitre, vous disposerez du contexte nécessaire pour travailler avec le moteur de recherche, plutôt que contre lui !