Primero quiero empezar citando que el término “PageRank” es una marca registrada y patentada por Google desde el año de 1999 que acoge una familia de algoritmos, los mismo que son utilizados para asignar de forma numérica la importancia de los documentos en el internet o también denominados páginas web; indexados por un motor de búsqueda.
Como antecedentes PageRank tomó su modelo del Science Citation Index elaborado por Eugene Garfield para el Instituto de información científica (ISI) en los Estados Unidos durante la década del 50. El Science Citation Index pretende resolver la asignación objetiva de méritos científicos suponiendo que los investigadores cuyo factor de impacto como el número de publicaciones y/o referencias bibliográficas en otros trabajos científicos es más alto, y que colaboran en mayor medida con el desarrollo de su área de investigación. El índice de citación es un elemento determinante para seleccionar qué investigadores reciben becas y recursos de investigación.
¿Y cómo funciona?, pues “PageRank” confía en la naturaleza democrática de la web utilizando su vasta estructura de enlaces como un indicador del valor de una página en concreto. Google interpreta un enlace de una página A a una página B como un voto, de la página A, para la página B. Pero Google mira más allá del volumen de votos, o enlaces que una página recibe; también analiza la página que emite el voto. Los votos emitidos por las páginas consideradas «importantes», es decir con un PageRank elevado, valen más, y ayudan a hacer a otras páginas «importantes». Por lo tanto, el PageRank de una página refleja la importancia de la misma en Internet.
Esto tiene una importancia comercial para empresas y sitios que las representan; porque estos quieren aparecer entre los primeros resultados del buscador, se han diseñado métodos para manipular artificialmente el PageRank de una página. Entre estos métodos hay que destacar el “spam” un concepto muy familiar del correo electrónico que hoy en día usamos, y que consistente en añadir enlaces a una cierta página web en lugares como blogs, libros de visitas, foros de Internet entre otros, con la intención de incrementar el número de enlaces que apuntan a la página.
Para el año 2005 Google implementó un nuevo atributo para hiperenlaces rel=»nofollow», por supuesto que esto es para los más técnico; aquellos que manejan el código HTML (HyperText Markup Language), como un intento de luchar contra el spam. De esta forma cuando se calcula el peso de una página, no se tienen en cuenta los links que tengan este atributo.
Asi que podemos concluir que un hiperenlace a una página cuenta como un voto de apoyo. El PageRank de una página se define recursivamente y depende del número y PageRank de todas las páginas que la enlazan. Una página que está enlazada por muchas páginas con un PageRank alto consigue también un PageRank alto.
Si no hay enlaces a una página web, no hay apoyo a esa página específica. El PageRank de la barra de Google va de 0 a 10, donde diez es el máximo PageRank posible y son muy pocos los sitios que gozan de esta calificación, 1 es la calificación mínima que recibe un sitio normal, y cero significa que el sitio ha sido penalizado o aún no ha recibido una calificación de PageRank.
PageRank puede ser concebido como un modelo de comportamiento del usuario y ha demostrado ser mucho mejor en cuanto a los resultados, si conocemos como funciona, por ejemplo puede poner “YAMIL LAMBERT” en el motor de “google” (www.google.com) y los primeros resultados direccionan a mi Blog con una cuota de 50 visitantes diarios, además de otros sitios que lo enlazan.
Un resumen en video.
Como parte de mi Maestría en Comunicación Pública en CyT.
Fuente: Documento «Anatomía de un motor de búsqueda a gran escala de web hipertextual.», por Sergey Brin y Lawrence Page