Algunas webs se hacen eco de que Google estaba usando un sistema de inteligencia artificial de aprendizaje automático, que ayuda a ordenar los resultados de búsqueda. Esto son las primeras noticias que se tienen sobre lo que se ha denominado RankBrain.
Los datos recopilados y que mostramos a continuación, han sido referidos de tres fuentes distintas: la noticia sobre RankBrain que Bloomberg anunció, la información obtenida de primera mano y nuestros conocimientos y suposiciones en lugares en los que Google no está proporcionando respuestas.
¿Qué es RankBrain?
Es el nombre de un sistema de inteligencia artificial de aprendizaje automático que ayuda a procesar los resultados de búsqueda. Veamos ahora algunas de las preguntas que podemos hacernos sobre esta nueva criaturita de Google.
- ¿A qué se denomina Aprendizaje Automático? Es un proceso por el cual unequipo se enseña a sí mismo a cómo hacer algo, en lugar aprenderlo por seres humanos o habiendo sido programado previamente.
- ¿Qué es la Inteligencia Artificial? La IA, para abreviar, aparece cuando se dota a un equipo de una inteligencia humana, en el sentido de aprender y ser enseñado, deconstruir el conocimiento y crear nuevas conexiones. En la práctica, la IA se utiliza para referirse a sistemas informáticos diseñados para aprender y conectar.
- ¿Existen diferencias entre IA y aprendizaje automático? En términos de RankBrain, parecen ser sinónimos. Se usan indistintamente, aunque también se puede encontrar que el aprendizaje automático describe el enfoque de la inteligencia artificial a utilizar.
- ¿RankBrain es la nueva manera en que Google clasifica los resultados de búsqueda? RankBrain tan solo forma parte del algoritmo de búsqueda general de Google. Es un programa que clasifica las miles de millones de páginas que conoce, y encuentra las más relevantes para consultas particulares.
- ¿Cuál es el nombre del algoritmo de búsqueda de Google? Este algoritmo general no ha tenido nunca un nombre formal, pero a mediados de 2013, Google lo renovó llamándolo Colibrí.
- ¿Entonces, RankBrain es parte de Colibrí, algoritmo de búsqueda de Google? Eso entendemos. Colibrí es el algoritmo de búsqueda global, comosi fuese el motor de un coche. El motor está compuesto de varias piezas: filtro de aceite, bomba de combustible, radiador… Del mismo modo, Colibrí tiene varias partes y RankBrain es una de las más nuevas. Colibrí tiene otras partes con nombres familiares para los SEO: Panda, Penguin y Payday (día de pago) para combatir el spam, Pidgeon (paloma) para mejorar los resultados locales, Top Heavy para degradar páginas de publicidad masiva y molesta, Movil Friendly para premiar las páginas responsive y Pirate para combatir la infracción de derechos de autor.
- ¿El algoritmo de Google no se llamaba PageRank? PageRank es otra parte del algoritmo general de Colibrí, y valora a las páginas basándose en los enlaces de otras páginas que le apuntan. PageRank es el primer nombre que Google le dio a una parte de su algoritmo de clasificación.
- ¿Qué señales usa Google para clasificar? Google utiliza las señales como ayuda para determinar cómo clasificar las páginas web. Por ejemplo, leyendo las palabras de una página Web, las palabras serán una señal. Si algunas palabras están en negrita, podría ser otra señal observada. Los cálculos de PageRank se utilizan también como una señal. Si una página es navegable desde el móvil, eso es otra señal. Todas estas señales se procesan en diversas partes dentro del algoritmo Colibrí, para acabar determinando las páginas que muestra Google como respuesta a diversas búsquedas.
- ¿Cuántas señales existen? Google ha dicho repetidas veces tener más de 200 grandes señales de clasificación que, a su vez podría tener hasta 10.000 sub-señales.
- ¿RankBrain es la tercera señal más importante? A partir de la nada, este nuevo sistema se ha convertido en lo que Google llama el tercer factor más importante para el ranking web.
- ¿Cuáles son las más importantes? Aunque nos mosquee, Google no nos lo dirá, obviamente. El artículo de Bloomberg no fue un accidente. Google quiere hacer un poco de relaciones públicas sobre su descubrimiento del aprendizaje automático. Nosotros creemos que los enlaces siguen siendo la señal más importante, la segunda señal más importante son las palabras, donde las palabras abarcarían todo, desde el texto en la web hasta la interpretación que hace Google de las búsquedas de los usuarios.
- ¿Qué hace exactamente RankBrain? Puede deducirse que RankBrain es un modo de interpretar las búsquedas de los usuarios, para encontrar páginas sin las palabras exactas introducidas en la búsqueda.
- ¿Google todavía no tenía modos de encontrar páginas más allá de la palabra exacta? Sí, hace mucho que Google encuentra páginas sin los términos exactos de búsqueda. Por ejemplo, hace muchísimos años, si hubieses buscado «mesa», Google podría no haber encontrado páginas con «mesas» porque técnicamente son dos palabras diferentes. Pero las palabras derivadas permitieron entender que “camisetas” deriva de “camiseta”. Google también consiguió inteligencias sinonímicas, por lo «zapatillas de deporte» podría significar «zapatos para correr». Incluso obtuvo algunas inteligencias conceptuales, para entender que hay páginas sobre la empresa «Apple» y la fruta apple.
¿Qué es El Gráfico de conocimiento?
El Gráfico del conocimiento, lanzado en 2012, fue una manera en que Google consiguió mayor conocimiento acerca de las conexiones entre las palabras. Más importante aún, aprendió a buscar «things, not strings», como Google lo describió.
Strings (cuerdas) significa buscar sólo cadenas de letras, como las páginas que coinciden con la ortografía de «Obama». Things (cosas) significa que buscar «Obama» probablemente signifique presidente estadounidense, Barack Obama, una persona real con conexiones a otras personas, lugares y cosas.
El Gráfico del conocimiento es una base de datos, de los hechos acerca de las cosas en el mundo y las relaciones entre ellos. Es por eso que se puede hacer una búsqueda del tipo «¿cuándo nació la esposa de Obama?» y obtener respuestas sobre Michele Obama sin utilizar su nombre.
Las nuevas búsquedas con el RankBrain
La métodos que Google usa para atinar en las consultas generalmente empiezan en algún trabajador del mundo, ya sea creando listas derivadas o de sinónimos, o creando las conexiones entre “las cosas” de la base de datos. Por supuesto que hay automatización, pero en gran medida depende de la mano humana.
El problema es que Google procesa tres mil millones de búsquedas al día. En 2007, Google anunció que entre el 20% y el 25% de esas consultas nunca se habían visto antes. En 2013, se redujo a 15%, que fue utilizado de nuevo en 2015. Pero el 15% de tres mil millones son todavía muchísimas consultas no realizadas: 450 millones al día.
Entre las búsquedas complejas están las búsquedas longtail, que son búsquedas con muchas palabras introducidas. RankBrain ayuda a interpretar estas consultas y traduce sus palabras para encontrar las mejores páginas para la búsqueda.
Google no ha proporcionado detalles sobre cómo RankBrain deduce cuáles son las mejores páginas. Pero probablemente, la clave sea la traducción de una búsqueda ambigua a una más específica, devolviendo mejores respuestas. Veamos ahora cuales son los orígenes y las funcionalidades de RankBrain.
- ¿RankBrain ayuda realmente? Rankbrain probablemente esté causando un gran impacto. Google es muy conservadora con lo que incorpora a su algoritmo para la obtención de los rankings. Hace pequeñas pruebas todo el tiempo, pero sólo lanza grandes cambios cuando existe un alto grado de confianza, en que las mejoras producidas por esos cambios, van a ayudar a los usuarios a encontrar contenidos más relevantes con las búsquedas realizadas. Integrar RankBrain es un cambio enorme, considerando que es la tercera señal más importante. Si RankBrain no estuviese ayudando al algoritmo de ranking, Google no lo hubiese lanzado.
- ¿Cuándo comenzó a utilizarse RankBrain? Google nos informó de que había un despliegue gradual de RankBrain a principios de 2015.
- ¿Qué consultas se ven afectadas? Google dijo a Bloomberg que «una fracción muy grande» de las consultas están siendo procesadas por RankBrain.
- ¿Este algoritmo está siempre aprendiendo? Todo el aprendizaje de RankBrain es offline. Aprende a predecir a través de lotes de historiales de búsqueda. Las predicciones se prueban y si funciona se lanza. Entonces se repite el ciclo de aprendizaje offline-prueba.
- ¿Y hace algo más? Generalmente, el modo de refinar una consulta no se ha considerado una señal de ranking. Las señales normalmente son factores vinculados a los contenidos (palabras, enlaces, un dominio seguro…) o al usuario, por ejemplo, la ubicación del usuario/búsqueda o el historial de navegación. Así que cuando Google habla de RankBrain como la tercera señal más importante, ¿habla de una señal de clasificación? Sí. Google confirmó que hay un componente donde RankBrain actúa directamente de alguna manera si una página está clasificada.
- ¿Cómo exactamente? ¿Hay algún tipo de «puntuación RankBrain» que evalúe la calidad? Tal vez, pero parece mucho más probable que simplemente, ayude en la clasificación de las páginas basándose en su contenido. RankBrain podría ser el mejor en resumir lo que es una página, entre los sistemas existentes de Google a día de hoy.
¿Cómo puedo aprender más acerca de RankBrain?
Google dijo que la gente que quiere aprender sobre la palabra «vectores» (la forma en que palabras y frases se pueden conectar matemáticamente).
Se puede incluso jugar con un proyecto de aprendizaje automático usando la herramienta word2vec de Google. Además, Google tiene un área entera con sus documentos de AI y de aprendizaje automático, como lo hace Microsoft. Pero existen múltiples especialistas, consultores y agencias SEO que están investigando constantemente.
Dejar un comentario
¿Quieres unirte a la conversación?Siéntete libre de contribuir