Ferramentas Pessoais
  •  
Você está aqui: Entrada Sobre o Arquivo Objectivos

Objectivos

Apresenta os principais objectivos do projecto da FCCN para a criação de um Arquivo da Web Portuguesa.

 

Objectivos do Arquivo da Web Portuguesa

A criação de um Arquivo da Web Portuguesa representa um marco histórico e uma aposta de Portugal nas suas gerações futuras. Com a criação de uma infra-estrutura que suporte recolhas periódicas da web portuguesa, seu arquivo e acesso a longo prazo, pretendemos disponibilizar os seguintes serviços:

  • Pesquisa histórica por termo: permitirá identificar páginas arquivadas ao longo dos anos que contenham determinadas palavras;
  • Pesquisa histórica por endereço da web (URL): permitirá identificar várias páginas arquivadas ao longo dos anos referenciadas por um determinado URL;
  • Novo motor de pesquisa sobre a web portuguesa: o arquivo irá permitir pesquisar sobre várias recolhas da web portuguesa, a disponibilização de um serviço de pesquisa apenas sobre a recolha mais recente, como acontece nos motores de busca actuais, é uma mais-valia para a comunidade portuguesa;
  • Colecções históricas de conteúdos web para fins de investigação: a web contém informação sobre os mais diversos assuntos sendo o reflexo dos nossos dias. Investigadores das mais diversas áreas usam-na como fonte de informação para os seus estudos, que vão da Sociologia à Informática. A disponibilização de colecções da web permitirá que estes investigadores possam processar informação localmente nos seus computadores sem terem de realizar recolhas da web;
  • Relatórios periódicos de caracterização da web de Portugal: o desenho de sistemas para processamento de dados provenientes da web depende das suas características gerais. Por exemplo, quanto espaço em disco seria necessário para criar um repositório de todas as imagens da web portuguesa? Os relatórios a emitir permitirão responder a estas questões e fornecerão medidas indicadoras da difusão das tecnologias de informação em Portugal;
  • Sistema de salvaguarda da informação arquivada (rARC): será um mecanismo distribuído que permitirá a um utilizador da Internet disponibilizar espaço em disco no seu computador para armazenar uma cópia de segurança de parte dos dados arquivados, recorrendo à instalação de uma pequena aplicação no seu computador. Pretende-se assim que em caso de falha do arquivo central, a colecção de conteúdos arquivados possa ser recuperada a partir das cópias de segurança distribuídas pelos utilizadores. Assim sendo, qualquer indivíduo ou instituição poderá colaborar para a preservação da web portuguesa;
  • Infra-estrutura para processamento paralelo dos dados arquivados: irá permitir que investigadores, mesmo sem serem especialistas em sistemas informáticos distribuídos, executem os seus programas sobre os dados web arquivados usando várias máquinas do projecto em paralelo.
Colateralmente, pretendemos também com este projecto atingir os seguintes objectivos:
  • Formação de recursos humanos na área de arquivo da web que possibilitem a manutenção do sistema no futuro;
  • Exportação do saber-fazer e tecnologia de arquivo da web para outros países, nomeadamente os de língua portuguesa;
  • Contribuição para o aumento do número de registos sob o domínio nacional .PT, uma vez que o arquivo histórico gratuito da informação publicada sob este domínio constituiria uma motivação adicional para os registradores;
  • Publicação de artigos científicos e técnicos que permitam a partilha dos conhecimentos adquiridos e obtenção de retorno acerca do trabalho desenvolvido.
FCCN - Fundação para a Computação Científica Nacional POSC - Programa Operacional Sociedade do Conhecimento UMIC - Agência para a Sociedade do Conhecimento UE - União Europeia - FEDER - Fundo Europeu de Desenvolvimento Regional