Ir al contenido principal

Cómo funcionan los motores de búsqueda

Si conoces el funcionamiento de los motores de búsqueda, podrás definir una mejor estrategia de SEO para generar tráfico hacia el sitio web de tu empresa.

How Search Engines Work Hero Illustration

Para entender qué es la optimización en motores de búsqueda (Search Engine Optimization, SEO), es útil aprender cómo funcionan los motores de búsqueda. El objetivo de estos motores de ayudarte a encontrar lo que buscas en Internet, y lo hacen evaluando los infinitos sitios y elementos web que conforman la World Wide Web para determinar cuáles se adecuan más a tu búsqueda.

La misma web es una colección de páginas y recursos interconectados a la que los usuarios acceden a través de una red global: Internet. Por supuesto, también puedes acceder a estos documentos visitando la URL de una página web (su dirección web) directamente. No obstante, lo más habitual es que las personas lleguen a un sitio web a través de un motor de búsqueda (o buscador). Y esto es una oportunidad muy valiosa para los propietarios de negocios.

¿Qué hace que funcione la web?

Las páginas web son documentos con formato HTML, un lenguaje de programación web que admite hipervínculos incrustados para conectar páginas entre sí. Este es el concepto más importante para entender cómo funciona la web.

Las páginas web incluyen contenido como texto, imágenes, formularios, vídeos, hipervínculos, etc. Este contenido es lo que buscan los usuarios, que acceden a una página web para leer, escuchar o ver algo, o para hacer cosas como comprar un producto o suscribirse a un boletín. La navegación de una página a otra se realiza mediante enlaces.

Estas acciones son posibles gracias al contenido programado en una página web. La naturaleza de Internet permite que sea muy fácil moverse por diferentes páginas, de una a otra, según lo que se quiera hacer.

¿Qué es un sitio web?

Un sitio web es una colección de páginas web que residen en el mismo dominio y, por lo general, son propiedad de una misma organización. A la página de inicio de Mailchimp, por ejemplo, se puede acceder a través de la URL https://mailchimp.com/.

En esta URL, "mailchimp.com" es el dominio. Si consultas otras URLs de este sitio web, verás que tienen el dominio en común. Por ejemplo:

  • https://mailchimp.com/resources/
  • https://mailchimp.com/why-mailchimp/

Mailchimp también usa enlaces para dirigir a los visitantes a otras áreas del sitio web. Por ejemplo, en el área de navegación disponible en la parte superior de cada página, puedes hacer clic para ir rápidamente a otra página del sitio. Esto es posible gracias a los enlaces internos, que son enlaces entre páginas de un mismo dominio.

Diferencia entre enlaces internos y externos

Los enlaces a un dominio diferente son enlaces externos. (Verás un enlace externo en la firma del autor, al final de este artículo).

Mailchimp incluye una sección de pie de página al final de cada página. De esta manera, facilita a los visitantes el acceso a páginas específicas mediante enlaces internos y externos. En este caso, los enlaces externos dirigen a perfiles de redes sociales.

La mayoría de los sitios web usan más enlaces internos que externos. Normalmente, todas las páginas de un sitio web enlazan a otras páginas del mismo sitio web, en una suerte de miniweb de documentos entrelazados.

Los enlaces internos conectan páginas relacionadas entre sí que se encuentran en el mismo dominio. Sin embargo, la potencia de la web reside en mayor medida en los enlaces externos. Estos crean conexiones a páginas web que existen y operan fuera de una misma organización, y ayudan a formar parte de la red de miles de millones de páginas disponibles en Internet.

Hay diversos motivos para usar un enlace externo, por ejemplo, para enlazar a la fuente de los datos estadísticos que incluiste en un artículo. De esta manera, además de aumentar la credibilidad de tu publicación, contribuirás a la red expansiva de la web.

Qué hace un motor de búsqueda

Los motores de búsqueda realizan tres tareas principales:

  1. Rastrear
  2. Indexar
  3. Ofrecer resultados de búsqueda

En términos sencillos, el rastreo consiste en acceder a páginas web en Internet. La indexación es el proceso de extraer significado del contenido de las páginas web y crear una base de datos relacional entre estas. Y ofrecer resultados de búsqueda es la acción de interpretar la consulta de búsqueda de un usuario y presentarle los resultados del índice que mejor respondan a esta.

Cómo funciona el rastreo

El rastreo de URLs es una tarea que realiza un programa informático, llamado rastreador o araña web. Su trabajo consiste en visitar páginas web y extraer el contenido HTML que encuentre. Los enlaces son unos de los principales elementos que busca un rastreador.

Cada página web tiene un identificador único: su URL. Introduce la URL en la barra de direcciones de tu navegador para acceder a la página web correspondiente. Las páginas web están formadas por contenido con marcado HTML.

Este en un lenguaje legible por computadora, por lo que un programa externo (como un rastreador) puede visitar una URL, extraer el HTML y acceder al contenido de manera estructurada. Cabe destacar que distingue entre texto e hipervínculos.

Cuando los rastreadores examinan el código HTML de una página como esta, que contiene el artículo que estás leyendo, detectan que cada párrafo está delimitado por un trozo de código llamado elemento de párrafo o p-tag, tanto al principio como al final. Este elemento identifica un bloque de texto, con una etiqueta p-tag que marca su inicio y otra que marca su fin. El código solo es visible si se utiliza la función de inspeccionar elemento en la página, pero el rastreador lo ve y entiende que esta página contiene texto escrito para que los visitantes lo lean.

Los rastreadores también ven e interpretan los enlaces, pues llevan código HTML. Los programadores codifican los enlaces con un elemento ancla al principio y al final. Además, los enlaces incluyen un atributo que proporciona el destino del hiperenlace y un texto ancla. El texto ancla es lo que ven los lectores, y suele mostrarse subrayado y en azul.

Para un rastreador es muy sencillo procesar este bloque de HTML y separar el texto del enlace. Sin embargo, en una sola página web, hay mucho más que un párrafo y un enlace. Si quieres ver este tipo de datos, visita una página web en tu navegador, haz clic con el botón derecho en cualquier punto de la pantalla y, después, haz clic en "Ver código fuente" o "Ver código fuente de la página". En la mayoría de las páginas, verás que hay cientos de líneas de código.

El rastreador, cada vez que encuentra una página web, analiza su código HTML, es decir, lo divide en componentes para seguir procesándolo. Después, extrae todos los enlaces que identifica en una página y programa su rastreo. De hecho, crea su propio bucle de retroalimentación:

Rastrear URL → Buscar enlaces a URLs → Programar rastreo de URLs → Rastrear URL

Así, puedes proporcionar a un rastreador una sola URL como fuente para iniciar el rastreo y este seguirá analizando hasta que no encuentre ninguna URL nueva que rastrear, lo cual podría pasar al cabo de miles o incluso millones de URLs.

En resumen, el rastreado es un método de detección. Los motores de búsqueda determinan qué hay en la web enviando rastreadores web para que encuentren páginas web usando los enlaces como indicadores del próximo sitio que deben analizar.

Por eso, los enlaces internos de tu sitio web son importantes: permiten que los rastreadores del motor de búsqueda descubran todas las páginas de tu sitio. Por su parte, los enlaces externos permiten que descubran otros sitios web mientras exploran la red de páginas interconectadas que conforman Internet.

Cómo funciona la indexación

Cuando rastrean la web, los motores de búsqueda crean un repositorio con las páginas web que encuentran, que luego usan para generar su índice.

Sería algo así como el índice que encontrarías en la parte trasera de un libro de texto. Si quisieses leer sobre la estructura celular, consultarías el índice de un libro de biología para encontrar las páginas donde se habla de ese tema. La indexación de páginas web tiene un funcionamiento similar.

Un índice es útil porque permite hacer búsquedas rápidas. Además, los motores de búsqueda como Google necesitan un método veloz para recuperar información y mostrar resultados de búsqueda, por lo que la indexación es crucial.

Los motores de búsqueda cogen cada página web que rastrean y analizan el documento HTML para extraer los enlaces. De esta manera, pueden almacenar la URL de destino a la que apunta cada enlace y el texto ancla usado. También recopilan todo el contenido de texto que encuentran y lo dividen en un conjunto de repeticiones de palabras.

Después, usan estos datos analizados para generar un índice invertido asignando la URL de la página web a cada una de las palabras de la página. Una vez que han almacenado una URL siguiendo estos pasos, estará indexada. Esto significa que podrá aparecer en un conjunto de resultados de búsqueda.

Para cada URL indexada, los motores de búsqueda almacenan todas las relaciones palabra-URL que consideran relevantes, junto con los demás metadatos que hayan recopilado sobre la página. Estos son los datos que usan a la hora de determinar qué URLs muestran en sus resultados de búsqueda.

Cómo se presentan los resultados de búsqueda

El rastreo y la indexación son tareas automáticas y continuas. El índice se actualiza en tiempo real. Este proceso de recopilación y almacenamiento de datos se produce de forma independiente en segundo plano, no se ve afectado por las personas que introducen una búsqueda.

Sin embargo, la presentación de resultados de búsqueda depende totalmente de lo que escriba el usuario al buscar. Si una persona busca "mejor servicio de televisión por streaming", el motor de búsqueda buscará coincidencias de cada palabra en los documentos de su índice.

Esta búsqueda de coincidencias en páginas indexadas da lugar a miles de millones de documentos, así que tiene que determinar cómo presentarte primero las mejores coincidencias. Aquí es cuando la cosa se complica y entra en juego el SEO. ¿Cómo deciden los motores de búsqueda, entre millones de resultados potenciales, cuáles mostrar? Usan un algoritmo de clasificación.

Los algoritmos son conjuntos de reglas que los programas informáticos siguen para hacer un proceso específico. Un algoritmo de clasificación consiste en un gran número de algoritmos y procesos que trabajan al unísono.

Los algoritmos de clasificación buscan factores como estos:

  • ¿La página contiene todas las palabras de la consulta de búsqueda?
  • ¿La página contiene determinadas combinaciones de las palabras (por ejemplo, "mejor" y "streaming")?
  • ¿Las palabras aparecen en el título de la página?
  • ¿Las palabras forman parte de la URL de la página?

Estos son ejemplos básicos, pero el algoritmo de clasificación tiene en cuenta cientos de factores para seleccionar los resultados que mostrará. Estos son los factores de clasificación.

El motivo por el que Google se convirtió en el motor de búsqueda dominante en todo el mundo es sencillo: su algoritmo de clasificación era mejor que los de sus rivales.

Hacer comprensible lo complejo

Los motores de búsqueda son estructuras extremadamente complicadas que procesan cantidades de datos ingentes cada día. Aplican algoritmos complejos para darles sentido a los datos y satisfacer a las personas que hacen búsquedas.

Miles de los mejores ingenieros de software del mundo trabajan en mejoras más granulares; por eso, muchas empresas como Google son responsables de los avances en algunas de las tecnologías más sofisticadas del planeta.

Las tecnologías como el aprendizaje automático, la inteligencia artificial y el procesamiento de lenguaje general seguirán teniendo mucho impacto en los resultados de búsqueda que se muestran. No es necesario que lo entiendas en toda su complejidad, pero, si aplicas algunas de las mejores prácticas básicas, conseguirás que tu sitio web sea más fácil de encontrar con las palabras y frases que buscan tus clientes.

 Escrito por Patrick Hathaway para Mailchimp. Patrick es el cofundador de Sitebulb, una herramienta de auditoría técnica de SEO.

Comparte este artículo