• 1
  • 2
  • 3
  • 4
  • 5

Notícias sobre o mercado de webdesign e seo

Caffeine o novo Índice do Google

A 8 de Junho de 2010 o Google anunciou mais uma alteração no seu índice - O Google Caffeine.  Mais uma tentativa de melhorear os resultados das pesquisas aproximando-se cada vez mais dos resultados em tempo real.

Estas são as palavras de um engenheiro de software da Google explicando este novo sistema de indexação de páginas web.

 

"Hoje estamos anunciando a conclusão de um novo sistema de indexação de web chamado Caffeine. O Caffeine apresenta resultados de 50 por cento mais frescos para pesquisas na web que o nosso último índice, e é a maior colecção de conteúdo web que temos oferecido. Quer se trate de uma notícia, um blog ou um post do fórum, agora você pode encontrar links para conteúdos relevantes muito mais cedo após a sua publicação do que era possível antes.

Algum conhecimento prévio para aqueles que não constroem motores de busca, como nós: quando você pesquisa no Google, você não está pesquisando a web ao vivo. Em vez disso você está procurando o índice do Google para a web que, como um índice de um livro, ajuda a localizar exatamente a informação que você precisa.

Então, por que vamos construir um novo sistema de indexação de busca? Conteúdo na web está florescendo. Não é só crescer em tamanho e números, mas com o advento do vídeo, imagens, notícias e atualizações em tempo real, a página web média é mais rica e complexa. Além disso, as expectativas das pessoas para a pesquisa são mais elevados do que costumavam ser. Os pesquisadores querem encontrar o conteúdo mais recente e relevante, os editores esperam para ser encontrado no instante em que eles publicam.

Para acompanhar a evolução da web e satisfazer a crescente confiança do usuário, nós construímos o CAffeine. A imagem abaixo ilustra como o anterior sistema de indexação em comparação com o Caffeine.

Google Caffeine - novo sistema de indexação de buscas do Google

O nosso índice antigo tinha várias camadas, algumas das quais foram atualizadas a um ritmo mais rápido do que outros, a camada principal vai actualizar a cada duas semanas. Para atualizar uma camada do índice antigo, seria analisar toda a web, o que significava que havia um atraso significativo entre o momento em que encontramos uma página a o momento em que a mesma foi  disponibilizada na web.

Com o Caffeine, analisamos a web em pequenas porções e actualizamos o nosso índice de pesquisa numa base contínua, a nível mundial.  À medida que encontramos novas páginas, ou novas informações sobre as páginas existentes, podemos acrescentar estas directamente ao índice. Isso significa que você pode encontrar informações mais frescas do que nunca, não importa quando ou onde elas foram publicadas.

O Caffeine permite-nos indexar páginas web a uma escala enorme. Na verdade o Caffeine processa centenas de milhares de páginas em paralelo a cada segundo. Se esta fosse uma pilha de papel que iria crescer três milhas em altura a cada segundo. O Caffeine ocupa quase 100 milhões de gigabytes de armazenamento numa base de dados e adiciona novas informações a uma taxa de centenas de milhares de gigabytes por dia. Você precisaria de 625 mil dos maiores iPods para armazenar tanta informação, se estes fossem todos alinhados daria mais de 40 quilómetros.

Construímos o Caffeine com o futuro em mente. Não só é mais fresco, é uma base sólida que torna possível para nós, construir um ainda mais rápido e completo motor de busca em escala com o crescimento da informação on-line, e fornece ainda mais relevantes resultados de pesquisa para o utilizador. Portanto, fique atento e procure por mais melhorias nos meses vindouros."

Partilhe

Site ou página?

No que diz respeito aos motores de busca, para nós, cada site dos nossos clientes não não é um site mas vários - tantos quantas as páginas que tem. Confuso? Não fique. A optimização também passa por aí. Se cada página do seu site for tratada como um site independente tem mais hipóteses de ser indexado para vários critérios de pesquisa.

Artigos