Como o rankeamento funciona
O rankeamento de URLs é uma tarefa realizada por um programa de computador conhecido como rastreador ou aranha. O trabalho do rastreador é visitar páginas da Web e extrair o conteúdo HTML que encontra. Uma das principais coisas que um rastreador procura são os links.
Cada página da Web tem um identificador único, seu URL. Digite o URL na barra de endereços do seu navegador e você irá para a página da Web. As próprias páginas consistem em conteúdo marcado em HTML.
HTML é uma linguagem legível por máquina; portanto, um programa externo como um rastreador pode visitar uma URL, extrair o HTML e acessar o conteúdo de maneira estruturada. Importante, ele pode diferenciar entre texto e hiperlinks.
Quando os rastreadores examinam o código HTML de uma página como esta, que contém o artigo que você está lendo, eles descobrem que cada parágrafo é destacado por um pedaço de código chamado elemento de parágrafo ou p-tag no início e no final. Isso identifica um bloco de texto de parágrafo - a tag p no início abre o elemento de parágrafo e a tag p no final o fecha. Embora você não veja esse código a menos que inspecione a página, o rastreador o vê e entende que essa página contém conteúdo de texto projetado para que os visitantes leiam.
Os links também são visíveis e interpretados pelos rastreadores devido ao seu código HTML. Os programadores codificam links com um elemento âncora no início e no final. Os links também incluem um “atributo” que fornece o destino do hiperlink e um “texto âncora”. O texto âncora é o texto vinculado visto pelos leitores, geralmente exibido em navegadores em azul com sublinhado.
É uma tarefa simples para um rastreador processar esse bloco de HTML e separar o texto do link. No entanto, em uma única página da Web, há muito mais do que um parágrafo e um link. Para ver esse tipo de dados, visite qualquer página da Web em seu navegador, clique com o botão direito do mouse em qualquer lugar da tela e clique em “Visualizar fonte” ou “Visualizar fonte da página”. Na maioria das páginas, você encontrará centenas de linhas de código.
Para cada página da Web que um rastreador encontrar, ele analisará o HTML, o que significa que ele divide o HTML em suas partes componentes para processar ainda mais. O rastreador extrai todos os links que encontra em uma determinada página e os agenda para rankeamento. Na verdade, ele constrói um pequeno ciclo de feedback:
URL de rankeamento → Encontrar links para URLs → Agendamento URLs para rankeamento → URL de rankeamento
Assim, você pode fornecer a um rastreador um único URL como fonte para iniciar o rankeamento, e ele continuará até que pare de encontrar novos URLs para rastrear - isso pode ser milhares ou até milhões de URLs mais tarde.
Em suma, o rankeamento é um método de descoberta. Os mecanismos de pesquisa determinam o que há por aí enviando rastreadores da Web para encontrar páginas da Web usando links como indicações para o próximo local a ser procurado.
É por isso que os links internos em seu site são importantes, pois permitem que os rastreadores dos mecanismos de pesquisa descubram todas as páginas do seu site. Por meio de links externos, eles descobrirão outros sites à medida que exploram a rede de páginas interconectadas que compõem a Internet.