O Google anunciou no seu blog GOOGLEBLOG em junho de 2010, o início das operações do Caffeine, seu novo sistema de indexação da web e afirma resultados das buscas serão 50% mais atualizados em comparação com a tecnologia anterior, quer se trate de uma notícia, um blog ou um post no fórum, agora pode-se encontrar links para conteúdos relevantes muito cedo após a sua publicação que era possível antes.
Ainda no GOOGLEBLOG, a empresa explica por que investiu em um novo sistema de indexação. "O conteúdo na web está crescendo de uma forma absurda", conta a engenheira de software Carrie Grimes. "E cresce não apenas em tamanho e números mas com o advento de vídeo, imagens, notícias e atualizações de tempo real."
A Google conta que, com o velho sistema de indexação baseado em camadas, alguns índices eram atualizados mais lentamente que outros, dependendo de sua posição nas camadas. "A camada principal poderia ser atualizada a cada duas semanas", explica.
O sistema Caffeine analisa a web em "pequenos pedaços" e atualiza o índice de busca de forma contínua, ou seja, quando encontra novas páginas, ou novas informações em páginas existentes, elas são inseridas diretamente no índice, assim os resultados de buscas torna-se mais frescos.
A cada segundo, explica a empresa, o sistema de indexação do Caffeine processa "centenas de milhares de páginas em paralelo". O Caffeine ocupa um banco de dados com cerca de 100 milhões de gigabytes, e acrescenta novas informações a uma taxa de “centenas de milhares de gigabytes por dia”.
Nenhum comentário:
Postar um comentário