El PageRank ya no es público pero aún cuenta


Cuando nace un niño, sus padres tienen todo perfectamente planeado para su futuro. Sin embargo, en muy poco tiempo se dan cuenta de que a su hijo no le gusta tocar el violonchelo o ir de pesca con la familia, sino más bien prefiere los tatuajes, los amigos de mala influencia y los deportes extremos.

Bueno, algo similar sucedió con PageRank, un brillante hijo de los fundadores de Google Larry Page (que dio su nombre al niño y jugó el concepto de una página web) y Sergey Brin. Ayudó a Google a convertirse en el gigante de las búsquedas que dicta las reglas para todos los demás, y al mismo tiempo creó una serie de situaciones complicadas que en algún momento se salieron de control.

Definición.

PageRank (o PR en abreviatura) es un algoritmo matemático que evalúa la calidad y la cantidad de enlaces a una página web. Esta evaluación lo ayuda a determinar una puntuación relativa de la importancia y autoridad de la página.

Por lo tanto, cada enlace de una página a otra cuenta como un voto, y el peso de este puntaje depende de las puntuaciones de las páginas que lo enlazan. Los puntajes de esas páginas, a su vez, dependen de los puntajes de las páginas que los vinculan, y así sucesivamente. El cálculo parece ser un dolor de cabeza, pero llegaremos a él un poco más tarde.

Barra de herramientas de Google.

Para abreviar, inicialmente Google hizo públicos estos puntajes con la ayuda de su Toolbar que mostraba las puntuaciones directamente en el navegador (por supuesto, era un valor aproximado). Los puntajes fueron solo de 0 a 10 y parecían estar en una escala logarítmica. El verdadero significado de esta escala es el siguiente:

Este paso generó mucha controversia, y ahora entiendo la intención actual de Google de evitar declaraciones directas al hablar sobre las señales de clasificación. Cada pieza de tales datos será mal entendida de todos modos.

Con el tiempo, Google estaba recortando el soporte de la Barra de Herramientas, y el 15 de abril de 2016 cerró oficialmente los datos del PageRank de la Barra de Herramientas al público convirtiéndolo en la verdadera receta secreta de sus mecanismos de clasificación.

Aunque PageRank no es público, todavía existe. Por lo tanto, me gustaría explicar cómo funciona, qué hace y por qué sigue siendo importante. Además, de saber cual es la alternativa al PR.

Cálculo del PageRank


Todo webmaster debe entender cómo funciona realmente el PageRank. Este conocimiento es esencial para la optimización, donde un SEO ve claramente qué se debe hacer exactamente para obtener un resultado, así como también lo que salió mal cuando los rankings cayeron.

El cálculo parece un poco complicado. Como recordará de mi prólogo, el puntaje del PageRank de cada página depende del puntaje de la página que lo vincula. Pero no podemos saber el puntaje de estas páginas hasta que lo calculemos. Entonces, aparentemente forma círculos y es imposible de calcular.

Sin embargo, no es tan malo. La puntuación del PageRank se puede calcular utilizando un algoritmo iterativo simple, y corresponde al vector propio principal de la matriz de enlace normalizada de la web. Significa que es posible calcular el puntaje de una página en particular sin conocer el valor de otras páginas que se vinculan a ella.

¿Porque? El asunto es que cada vez que ejecutamos el cálculo, obtenemos una estimación más cercana del valor final. Necesitamos recordar cada valor calculado y repetir los cálculos varias veces hasta que los números dejen de cambiar mucho.

Google vuelve a calcular los puntajes de PageRank después de cada rastreo de la Web. A medida que aumenta la cantidad de documentos en su índice reconstruido, la aproximación inicial de PageRank disminuye para todos los documentos. Además, se considera que PageRank favorece las páginas anteriores. Una página nueva, aunque sea buena, no puede tener muchos backlinks de calidad, por lo tanto, recibe una puntuación más baja.

La fórmula de PageRank también contiene un factor de damping (d). De acuerdo con la teoría del PageRank, hay un usuario imaginario que hace clic aleatoriamente en los enlaces, y en algún momento se aburre y finalmente deja de hacer clic. La probabilidad de que la persona continúe haciendo clic en cualquier paso es un factor de damping. Por lo tanto, este factor se introduce para evitar que algunas páginas tengan demasiada influencia. Como resultado, su voto total se amortigua multiplicándolo por 0.85 (un valor generalmente asumido).

También se considera que la suma normalizada (o el promedio) de todas las páginas web es igual a uno. Y la fórmula de PageRank establece que incluso si una página no tiene backlinks, obtendrá un pequeño puntaje de 0.15 (1 menos factor d).

Uno de los mejores artículos sobre el proceso de cálculo de PageRank y su máxima eficiencia es este de Lan Rogers. Nos da algunos ejemplos (jerarquía simple, inclusión de revisiones de páginas, bucles, interconexiones extensas, etc.) y los acompaña con observaciones y principios.

Las observaciones más importantes son:

  • Sobre backlinks. La página de inicio generalmente tiene el puntaje de PR más alto ya que tiene la mayoría de los enlaces entrantes. Sin embargo, si las páginas externas no se vinculan a ella, no emiten ningún voto y el puntaje PR promedio es menor. Por lo tanto, tiene sentido vincular los sitios externos a la página de inicio para que esos "votos" no se desperdicien.
  • Sin embargo:
    - Intentar abusar del cálculo de PR haciendo que la estructura de un sitio haga foco en la concentración de PR en la página de inicio simplemente no funciona y dañará su UX. Por lo tanto, puede arriesgar un poco su PR proporcionando una gran experiencia a sus usuarios que dará como resultado más relaciones públicas de las que realmente perdió.

  • Sobre la jerarquía. La jerarquía concentra los votos y el PageRank en una página.
  • Un sitio bien estructurado amplificará el efecto de cualquier PR contribuido.
  • Sobre enlaces internos. Los links internos minimizan el daño cuando se arriesga y se regalan votos mediante el enlace a sitios externos.
  • Sin embargo:
    - Si un grupo de páginas no contiene enlaces externos, la cantidad de enlaces internos no tiene ningún efecto en el puntaje PR promedio del sitio.

  • Sobre los enlaces de spam. Miles de páginas de spam que apuntan a su página principal se sumarán y le darán un buen puntaje de relaciones públicas. Sin embargo, una vez que Google lo detecta (y lo hace realmente rápido), su sitio ya no se encontrará en los SERP. Al mismo tiempo, muchas páginas (o al menos algunas) con contenido único que apunta a su página de inicio es la mejor receta.

Controversia del PageRank.


El PageRank es una invención genial que hace que Google sea tan eficiente y autoritario. Sin embargo, cada invención genial puede ser fácilmente pervertida, manipulada y utilizada con intenciones completamente diferentes.

Hablemos de las razones por las cuales el PageRank público fue ruinoso para la Web y por qué ha sido y sigue siendo importante.

Vicios de PageRank.
Google hizo público su PageRank para que la gente vea que este nuevo motor de búsqueda puede:

  1. encontrar esas páginas que los usuarios realmente buscan
  2. mostrar a los usuarios qué páginas son las mejores y más seguras

Luego el gigante de las búsquedas desarrolló su Toolbar para Internet Explorer (también respaldado por Firefox). La barra de herramientas mostraba una puntuación de PageRank (que va de 0 a 10) cuando el usuario la habilitaba.

Mientras que los usuarios comunes no estaban tan interesados en los puntajes de las páginas, los SEOs sintieron que esta era una gran oportunidad para hacer una diferencia para sus clientes. Esta obsesión de los SEOs con PageRank hizo que todos sintieran que esta señal de clasificación es más o menos la única importante. ¡A pesar del hecho de que las páginas con un puntaje PR más bajo pueden vencer a aquellos con un puntaje más alto!

¿Qué tuvimos entonces, como resultado a esta reacción?

  • Farm Links (Granjas de enlaces)

  • En tal situación, el nuevo mercado surgió para reaccionar ante esta demanda específica, y permitió que la manipulación de los puntajes PR. Sí, la era de las granjas de enlaces.

    Por supuesto, a Google no le gustó el desarrollo de esta situación. Comenzó a luchar. La acción más famosa fue contra la red SearchKing, que fue penalizada y eliminada de los resultados de Google. SearchKing presentó una demanda contra Google, pero Google ganó.

    Después de eso, la venta de enlaces pasó a la clandestinidad. Google aún logró encontrar esas redes, pero en realidad no importaba: cuando una red se cerró, tomaron su lugar otras nuevas. Dado que hay personas que están dispuestas a pagar por un aumento de PageRank, estos esquemas nunca dejarán de existir.

  • Link spam.

  • El PageRank público también desató enlaces de spam. Sí, comentarios spam con enlaces en todos los lugares imaginables. ¡Así que fue posible dejar cientos, miles de comentarios que tenían enlaces directamente al sitio en particular, y estos enlaces importaban! un sueño, no?

    Realmente no. Se convirtió en un dolor de cabeza que presionó a Google a una acción decisiva. Así, en 2005, se introdujo un atributo nofollow, un nuevo valor para el atributo rel del enlace HTML y los elementos de anclaje. Era una forma de evitar que dichos enlaces pasaran los votos del PageRank.

    Lamentablemente, aún no terminó el enlace de tipo spam. Sin embargo, una etiqueta nofollow es ampliamente utilizada hasta nuestros días por una serie de plataformas sociales importantes.

    Conclusión: incluso cuando Google mató a su Toolbar y el PageRank se volvió secreto, era obvio que no traería paz a la Web. Mientras las personas sepan que el mecanismo de clasificación de Google depende enormemente de los enlaces, los enlaces continuarán cultivándose y vendiéndose.

Importancia de PageRank.


No cabe la pregunta si PageRank es importante o no. ¡Por supuesto que lo es! Google está seguro de que PageRank sigue siendo importante. Ayuda al motor de búsqueda a determinar el material más confiable para una consulta en particular. Simplemente ya no es público. Volvió a ser su ingrediente secreto de la receta.

La fórmula de mayor valor de PageRank para su sitio es:

calidad (¡no cantidad!) de sus backlinks + eficacia de los enlaces internos

Significa que al optimizar, subconscientemente seguimos los requisitos para obtener una puntuación más alta en el PageRank.

Además, el mecanismo del PageRank es completamente general, por lo que puede aplicarse a cualquier gráfico o red en cualquier campo. Actualmente, la fórmula PR se utiliza en bibliometría, análisis de redes sociales y de información, y para la predicción y recomendación de enlaces. Incluso se usa para el análisis de sistemas de redes viales, biología, química, neurociencia y física.

Traducción de una porción de un artículo de Valerie Niechai