Ferramentas Pessoais
  •  
Você está aqui: Entrada

Arquivo da Web Portuguesa

O Arquivo da Web Portuguesa (AWP) é um projecto da Fundação para a Computação Científica Nacional que tem como principal objectivo a preservação da informação publicada na web de Portugal.

Após 1 ano, apenas cerca de 20% de um conjunto de endereços da web ainda apontam para um conteúdo válido (Ntoulas, 2004). Ou seja, após 1 ano é provável que 8 em cada 10 dos Favoritos que guardou no seu browser se tenham perdido.

Este projecto da Fundação para a Computação Científica Nacional (FCCN) visa a criação de um sistema de arquivo de conteúdos da web portuguesa, que terá como missão recolher periodicamente, armazenar e preservar a informação publicada.

A primeira fase do desenvolvimento do Arquivo teve início em Janeiro de 2008 e prevê-se que termine no prazo de 2 anos. Contudo, a manutenção de um sistema desta natureza e a preservação da informação arquivada é uma tarefa que deverá ser perpetuada posteriormente.

A Web possibilita que cada um de nós disponibilize informação e que esteja se torne acessível a todos, sem necessidade de recurso a editoras e meios de impressão tradicionais. Diariamente, são publicados milhões de conteúdos na web como por exemplo, textos, fotografias ou vídeos. A quantidade de informação que é publicada exclusivamente na web tem vindo a aumentar rapidamente nos últimos anos. No entanto, passado relativamente pouco tempo, a grande maioria desta informação deixa de estar acessível online e perde-se irremediavelmente. 

Surge assim o interesse no arquivo e preservação da informação publicada na Web para que o conhecimento nela contido esteja acessível às gerações futuras.

O que é a Web portuguesa?

Entende-se por Web portuguesa, todos os conteúdos alojados sob o domínio .pt.

Numa primeira fase, pretende-se arquivar apenas conteúdos alojados sob este domínio nacional, embora posteriormente se possam vir a abranger todas as páginas escritas em língua portuguesa.

Para que serve o Arquivo da Web?

Os serviços a serem prestados pelo Arquivo da Web Portuguesa ultrapassam o âmbito histórico-cultural da preservação de informação digital. A existência de um Arquivo da Web de Portugal poderá:

  • Contribuir para a expansão do uso do português enquanto língua para comunicação na Web;
  • Disponibilizar conteúdos de interesse às diversas comunidades científicas, por exemplo, na área da História, Sociologia ou Processamento Computacional da Língua Portuguesa;
  • Contribuir para o desenvolvimento da capacidade local de tratamento e prospecção de informação publicada na Web, reduzindo a dependência nacional de serviços estrangeiros;
  • Fornecer provas em casos judiciais que tenham como base informação publicada na Web.

O Arquivo da Web Portuguesa e os outros arquivos da web

O Internet Archive recolhe e arquiva conteúdos Web à escala mundial. No entanto, é difícil para uma única organização fazer um arquivo exaustivo de todos os conteúdos publicados na Web, porque esta está em permanente mutação e muitos conteúdos desaparecem antes de poderem ser recolhidos para arquivo.

Acontecimentos históricos de grande importância como o Furacão Katrina originaram acções de arquivo extra-ordinárias por parte do Internet Archive, para que este acontecimento que marcou a história dos Estados Unidos da América ficasse documentado o mais exaustivamente possível.

No entanto, a documentação de acontecimentos históricos de relevância nacional para Portugal não é prioritária para o Internet Archive.

As comunidades de vários países, sensibilizadas para a urgência da preservação da informação publicada na Web de interesse nacional desencadearam iniciativas formais de preservação e catalogação da informação digital. 

Decorrem em paralelo iniciativas de arquivo focadas em diferentes conteúdos e todas partilham o objectivo de preservar o conhecimento disponível na Web. Mas mesmo existindo estas várias iniciativas em curso, é difícil conseguir preservar a maioria da informação publicada na Web, devido à sua grande dimensão e ao curto intervalo de tempo em que a informação está disponível para poder ser arquivada.

O arquivo da web requer um esforço à escala mundial.

Nós vamos trabalhar para fazer a nossa parte, contamos com a vossa colaboração.

 

 

FCCN - Fundação para a Computação Científica Nacional POSC - Programa Operacional Sociedade do Conhecimento UMIC - Agência para a Sociedade do Conhecimento UE - União Europeia - FEDER - Fundo Europeu de Desenvolvimento Regional