Comentários
Deixe aqui os seus comentários e sugestões acerca do projecto.
A sua opinião é valiosa.
O seu endereço de correio electrónico não será publicado.
Obrigado.
ComentáriosDeixe aqui os seus comentários e sugestões acerca do projecto. A sua opinião é valiosa. O seu endereço de correio electrónico não será publicado. Obrigado. velocidade de recolha
Enviado por
Admin
em
2009-05-28 10:40
Bom dia agradecemos o seu comentário, o qual mereceu a nossa melhor atenção.
A razão pela qual o batedor do arquivo tem uma velocidade de recolha maior do que, por exemplo o batedor do Google, é porque recolhe exaustivamente todos os conteúdos dos sítios web para fins de preservação, enquanto que o Google apenas necessita de recolher conteúdos textuais para serem indexados. Outra razão, é porque se houver um grande intervalo entre a recolha dos conteúdos de um sítio web, corremos um risco maior de realizarmos uma cópia incoerente porque o sítio web foi alterado durante a recolha, o que resultará por exemplo em páginas arquivadas com imagens em falta ou ligações quebradas entre páginas. O AWP tem a máxima preocupação em não afectar os sítios web visitados. Até à data, dos cerca de 360 000 sítios web que estamos a arquivar apenas recebemos 2 queixas. Embora não seja uma opção standard do Robots Exclusion Protocol, o batedor do AWP respeita a directiva Crawl-delay (http://en.wikipedia.org/wik[…]ndard#Crawl-delay_directive) que permite que os responsáveis pelos sítios web determinem qual o intervalo mínimo recomendado entre pedidos realizados pelos batedores. Não obstante do exposto, se nos fornecer o endereço do seu sítio web e qual o intervalo entre pedidos que considera aceitável para o seu caso, iremos analisar a situação e tomar as medidas adequadas. Obrigado pelo seu interesse no Arquivo da Web Portuguesa. /Daniel Gomes facilidade de consulta
Enviado por
maria antonia gomes
em
2009-12-19 21:23
Embora seja uma leiga na tecnologia da Informática, achei interessante consultar o vosso site, de fácil acesso a quem não domina este assunto.
|
Arquivo-web-crawler (compatible; heritrix/1.12.1 +http://arquivo-web.fccn.pt)