PageRank d’un site web : son fonctionnement !

PageRank d’un site web : son fonctionnement !

PageRank

Le PageRank 

 

Le PageRank est la formule d'étude des liens convergents au  système de classement des webpages utilisées pars Google, Yahoo, Bing, MSN ainsi que tous les autres outils de recherche. Il rythme de façon  quantitative la notoriété d'une webpage. Le PageRank demeure une indication au sein de l'algorithme ce dernier concèdent  de classifier les webpages parmi les engins de recherche. Ce principe fut conçu par l’intermédiaire de Larry Page, l'un des fondateurs de la firme Google. Cette expression demeure une appellation déposée.

 

Son fonctionnement

 

Le PageRank d'une webpage tend à être  plus élevé que la somme des PagesRanks des webpages qui s’orientent vers elle est haute.

Le fondement de base est de donner à chaque webpage un score proportionnel au nombre de fois que viendrait par cette webpage un internaute parcourant le fil du Web en cliquant de manière aléatoire, sur un des liens présent sur chaque webpage. Une page a un PageRank d'autant plus élevé qu'est élevée la somme des PageRanks des webpages qui s’orientent vers elle (elle incluse, avec des liens internes). Le PageRank est une mesure de centralité dans le milieu du web.

De manière formelle, le déplacement du visiteur est une marche incertaine sur le fil du net, soit le graphe dirigé inclus les sommets qui représentent les webpages et les arcs, les hyperliens. En imaginant que le visiteur choisisse chaque lien isolément des webpages vu au préalable (le naturalisme d'un tel postulat pouvant être mis en discussion), c’est le processus de Markov. Le PageRank est simplement la probabilité sédentaire d'une chaîne de Markov, soit  un vecteur de Perron-Frobenius de la matrice d'adjacence du graphe du Web1,2. La taille (énorme) de ce graphe et sa mutation dynamique (modifications des webpages et hyperliens, connexion ou non du serveur web…) rendent alors impossible un calcul droit de ce vecteur : des méthodes d'approximation sont mises en place.

Multiples corrections et améliorations sont mises en place, quelques-unes décrites dans un brevet, d'autres n’étant reconnus que par Google. Particulièrement, il est primordial d’assurer  que des modifications trop locales du graphe d’internet n'entraînent pas d'accroissement démesuré du PageRank de quelques webpages, ceci pour éviter que des visiteurs (comme les sites commerciaux) ne "gonflent" de manière artificielle leur PageRank.

 

Les visiteurs peuvent obtenir une estimation de classification de chaque webpage en regardant la zone PageRank de la barre d'outils Google, qui précise sa valeur allant de 0 à 10 (Échelle de logarithme). Il y a  aussi de multiples  outils pour l'obtenir sans aposter la toolbar. On peut noter que le pagerank présent dans la toolbar n'est plus rendu actuel, il est primordial de le reconnaître désormais. Alors, certaines entreprises privées comme Moz et Majestic SEO veulent s'en approcher par l’intermédiaire de leurs indicateurs pour avoir une idée du PageRank Réel et permettant aux référenceurs  de comparer les divers websites

 

La Propriété intellectuelle

 

 

PageRank

 

 

Le brevet premier (nommé Method for Node Ranking in a Linked Database), reconnu en janvier 1997 et mis en registre le 9 janvier 1998, appartient à l'Université Stanford, qui a donné la licence de cette technique à Google depuis  1998 (corrigée en 2000 et 2003), huit semaines  après sa création. C’est une licence exclusive jusqu'en 2011, le scoop prenant fin à cette dernière date.

Les recherches qui se sont achevés au développement de la technique du PageRank ont été sponsorisées partiellement par la National Science Fondation. Il est donc noté dans le brevet que le gouvernement a des droits sur cette invention.

Le calcul du PageRank peut donner lieu à un modèle et illustré à l'aide du théorème du point fixe.

 

La course aux liens

 

Les référenceurs génèrent quelquefois de façon massive des liens retour, grâce aux échanges de liens ou en consignant un website sur divers annuaires. Google avait auparavant une vision qualitative de la notoriété d'une webpage, cette manière permettait donc de booster de manière artificielle sa charge de popularité. Mais Google a répondu : d’abord  en intégrant des filtres, comme la Sandbox. Il voit et punis les campagnes massives des liens artificiels ; mais il intègre des essais qualitatifs à l'étude des liens.

Les principaux critères du score d'une webpage :

En fonction du  brevet Google, ces critères sont :

 

*les liens qui entrent et sortent ;

*les ancres ;

*le trafic joint à la webpage ;

*le comportement des visiteurs : choix de la webpage dans les suites ;

*le nom de domaine.

*Le TrustRank

 

L’article précis : TrustRank.

 

C'est un critère de pouvoir donné aux wepages, du fait que l'auteur à une qualité de sérieux et de résolution reconnue. Ce critère est lié aux websites gouvernementaux, aux sites de référence. La notion de TrustRank arrive de Yahoo! et non de Google, qui pourtant enlobe aussi un critère de loyauté dans le calcul du placement.

 

Le PageRank à thème

 

Le milieu du référencement dit  actuellement que Google a inclus des valeurs sémantiques à l’intérieur du calcul du PageRank. Le vote d'une webpage vers une autre, symbolisé par un lien, est impacté par le thème de la webpage qui émet. Le recueil de mots choisis influence la classification d'une webpage dans les résultats de l’ outil de recherche, mais également la valeur des liens qu'elle communique.

Nofollow

 

La valeur nofollow de l'attribut HTML a été déterminée par Google en 2005, hors des évolutions normatives du W3C. D’après Google, un lien ainsi nommé dans une webpage ne transmet pas de valeur de PageRank aux webpages ainsi liées. Le 15 juin 2009, Matt Cutts, responsable qualitatif de l'index Google, a avisé une modification de traitement des liens en nofollow. Ce genre  de lien sera  ignoré mais sera de manière indirecte pris en considération dans la formule de calcul. Cette modification de traitement est une réponse à l'usage excessif effectué par les référenceurs (PageRank Sculpting). De façon  générale, la nouvelle rédaction prend en considération tous les liens inclus dans une webpage (incluant les liens javascript ou de pub).

 

Futur PageRank

 

Un grand nombre d'outils offrent de calculer la future classification d'une webpage après le prochain passage du googlebot. Ces outils ne sont pas crédibles car ils se fondent que sur la valeur « RK » de la somme de contrôle de Google. La fonction de cette donnée n'est apprise que de Google et n'a rien à voir avec un prochain PageRank, excepté sur les analyses interpersonnelles.

 

La balise Canonical

 

La balise Canonical devant être incluse entre <head></head> favorise le tri entre diverses webpages qui ont le contenu identique et confier aux outils de recherche qu'une seule webpage à crawler. On va donc transférer la valeur des doubles à une seule webpage, la webpage canonique. La balise canonique peut également être choisi d'un site C vers un website D.

Vous souhaitez bénéficier d'une campagne de liens afin d’accroître la notoriété et le positionnement de votre site web, n'hésitez à nous contactez afin d'obtenir tous les renseignements nécessaires qui vous seront utiles.

[wpseo_map width="400" height="300" zoom="-1" map_style="roadmap" scrollable="1" show_route="0" show_state="0"][wpseo_address show_state="1" show_country="1" show_phone="1" show_phone_2="0" show_fax="1" show_email="1"]

Pas de commentaire.

Ajouter un commentaire

Vous devez être Connecté pour poster un commentaire.