Fornecimento de conteúdos históricos da Web portuguesa
Poderá contribuir para a preservação da web portuguesa fornecendo conteúdos históricos que tenha em sua posse.
O Arquivo da Web Portuguesa (AWP) faz recolhas periódicas desde Janeiro de 2008.
A única maneira de conseguirmos preservar conteúdos publicados em data anterior, é obtendo-os a partir de entidades externas que os tenham guardado ao longo do tempo.
Caso detenha conteúdos de interesse para a comunidade portuguesa e pretenda fornecê-los ao Arquivo da Web Portuguesa, contribuindo assim para a sua preservação, por favor contacte-nos.
O AWP considera que todos os conteúdos publicados sob o domínio .PT pertencem à Web portuguesa e como tal serão arquivados. No entanto, poderão ser abertas excepções para conteúdos de manifesto interesse que estejam alojados sob outros domínios.
Devo fornecer apenas conteúdos antigos?
Estamos interessados em todos os conteúdos que já não estejam disponíveis na Web, independentemente da sua data de publicação.
A Web é extremamente dinâmica e a informação nela publicada "passa à história" rapidamente.
A partir do momento que um conteúdo deixa de estar disponível publicamente na Web, torna-se impossível arquivá-lo.
Assim sendo, mesmo realizando recolhas periódicas da Web portuguesa, existem conteúdos interessantes que não conseguimos arquivar porque deixam de estar disponíveis antes de conseguirmos recolhê-los.
Os conteúdos que nos possa vir a fornecer podem ser, por exemplo, cópias de segurança que tenha feito do seu sítio web ao longo do tempo.
Como fornecer os conteúdos?
O sistema do AWP guarda os conteúdos arquivados em formato ARC e idealmente os conteúdos seriam fornecidos neste formato.
No entanto, é natural que a maioria das pessoas não o utilize para guardar os seus ficheiros, pelo que aceitamos conteúdos em qualquer formato.
Posteriormente, a equipa do AWP encarregar-se-á de realizar a conversão dos ficheiros fornecidos para formato ARC, para que possam ser integrados no sistema.
Contudo, para facilitar esta tarefa agradecemos que seja fornecida a máxima informação adicional possível acerca dos conteúdos, principalmente:
- o endereço do sítio web. No caso de serem vários, agrupar os conteúdos de cada sítio web em directorias;
- o endereço original de cada conteúdo (URL). Se estiver a fornecer uma cópia local dos conteúdos de um sítio web mantenha os nomes originais dos ficheiros. Caso se tratem de conteúdos que gravou a partir da Web forneça os seus endereços originais. Poderá incluir um ficheiro com a correspondência entre os nomes dos ficheiros e os seus endereços originais (ex. C:\fccn\index.html, http://www.fccn.pt);
- a data de publicação de cada conteúdo. Indicar as datas em que os conteúdos foram publicados ou em que foram guardados, mesmo que sejam aproximadas. Caso esteja a gravar conteúdos de um computador para um DVD por exemplo, tenha o cuidado de manter as datas originais dos ficheiros;
- o tipo de cada conteúdo (MIME). Tenha o cuidado de manter as extensões originais dos ficheiros (ex. .gif, .html, .jpg). Se possível envie-nos os cabeçalhos HTTP completos de cada conteúdo. É particularmente importante fornecer o tipo para os conteúdos que tenham sido gerados dinamicamente e não contenham extensões no nome dos ficheiros.
Não hesite em contactar-nos
O fornecimento e integração de conteúdos externos é um processo com alguma complexidade.
Estamos ao dispor para esclarecer qualquer dúvida. Não hesite em contactar-nos.
Lista de contribuidores
Expressamos o nosso agradecimento às seguintes entidades pelo fornecimento de conteúdos para o Arquivo da Web Portuguesa:
- Dinis Manuel Alves: partilhou um compêndio de peças jornalísticas da sua autoria publicadas na Web portuguesa entre 1997 e 2003.
- José Magalhães: autor do livro "Novo roteiro prático da Internet : o ciberespaço ao alcance de todos" que continha um CD-ROM com conteúdos da Web portuguesa em 1996.
- Biblioteca Nacional: conteúdos arquivados em 2005 no âmbito do projecto RECOLHA.
- Grupo XLDB da Universidade de Lisboa: fornecimento e conversão para formato ARC de 5 das 10 recolhas da Web portuguesa que foram realizadas entre 2002 e 2006 no âmbito do projecto tumba!.
- Internet Archive: fornecimento de 1,9 TB de conteúdos recolhidos a partir do domínio .PT entre 2000 e 2007.