Personal tools
  •  
You are here: Home Colaborar Participação institucional

Participação institucional

Instituições de cariz científico e cultural poderão contribuir para o desenvolvimento do Arquivo da Web Portuguesa.

Arquivar e preservar a web é uma tarefa ambiciosa que exige evoluções permanentes, estamos ao dispor da comunidade para parcerias na nossa área de experiência.

O projecto de Arquivo da Web Portuguesa inclui tarefas de investigação e desenvolvimento. Dada a abrangência do projecto e os novos desafios que terão de ser superados, a colaboração com organizações externas à FCCN poderá ser benéfica para ambas as partes.

Em seguida, apresentam-se algumas tarefas que poderão ser executadas no âmbito de trabalhos académicos e de investigação:

  • Análise de requisitos. Para criar um sistema de arquivo da web útil à comunidade é necessário perceber quais são as necessidades e expectativas dos seus utilizadores. O Arquivo da Web poderá servir cidadãos comuns ou investigadores de várias áreas, como historiadores, linguistas ou sociólogos, que terão interesses e requisitos diferentes em relação ao sistema. A realização de estudos que permitam identificar perfis de utilização de um arquivo histórico da web seria muito valiosa.
  • Análise de estatísticas acerca da web de Portugal. Periodicamente serão gerados relatórios de caracterização da web de Portugal. A existência de massa crítica adicional para interpretação dos resultados obtidos e realização de investigações mais aprofundadas sobre fenómenos identificados é importante.
  • Avaliação dos sistemas desenvolvidos. Todos os sistemas desenvolvidos serão exaustivamente testados antes de serem lançados ao público. A avaliação é uma das etapas do método científico e a participação de pessoas com elevado sentido crítico é crucial para detectar pontos a melhorar, por exemplo, ao nível da usabilidade e segurança dos sistemas.
  • Recuperação de informação textual sobre colecções históricas. Além de arquivar a informação publicada na web é crucial mantê-la acessível. Os algoritmos actualmente utilizados pelos motores de busca focam-se apenas na pesquisa sobre uma recolha da web e não consideram a existência de uma colecção de conteúdos criada incrementalmente ao longo do tempo. A pesquisa de informação sobre arquivos históricos da web é um problema complexo e a investigação para a sua resolução começa agora a dar os primeiros passos.
  • Pesquisa de imagens. Uma imagem vale mil palavras, mas por vezes nem com mil palavras conseguimos encontrar a imagem que queremos. Os motores de busca sobre a web procuram imagens baseando-se nos textos que lhe estão associados. No entanto, esta associação entre textos e imagens não é linear e por vezes produz resultados indesejados. O estudo de mecanismos eficientes que permitam extrair ou associar texto a imagens da web poderia originar um serviço de pesquisa adicional para o nosso projecto.  O Arquivo da Web irá conter uma grande quantidade de imagens que permitirá desenvolver e avaliar novos algoritmos de pesquisa de imagens usando dados reais.   
  • Pesquisa de vídeos. A quantidade de vídeos disponíveis na Web tem crescido nos últimos anos. Informação que era publicada na forma textos, como por exemplo manuais de utilização, é cada vez mais publicada sob a forma de vídeos. No entanto, os serviços de pesquisa actuais são limitados, pois apenas permitem pesquisar sobre os textos associados aos vídeos e não permitem pesquisar sobre a informação contida nos mesmos. Além disso, os resultados referenciam vídeos integrais o que obriga os utilizadores a visualizarem a totalidade de um vídeo, mesmo quando apenas estão interessados na informação comunicada em alguns segundos. É assim mais moroso e difícil identificar uma informação relevante num vídeo do que num texto. A criação de algoritmos que permitam pesquisar informação contida nos vídeos é uma área interessante.
  • Interfaces de utilização adequadas à consulta da informação arquivada. A usabilidade das interfaces de utilização de sistemas de informação tem provado repetidamente ser um factor chave para o sucesso de um projecto. O estudo de uma interface de utilização e camada intermédia que permitam aceder à informação web arquivada é uma tarefa que apresenta inúmeros desafios, implicando trabalho de investigação e testes com utilizadores reais.

Se trabalhar em alguma destas áreas e estiver interesse em colaborar com o Arquivo da Web, não hesite em contactar-nos. Caso a sua organização tenha preocupações ao nível da preservação da cultura e história de Portugal poderá também aderir ao projecto rARC disponibilizando espaço para o armazenamento de cópias de segurança do arquivo da web portuguesa.

FCCN - Fundação para a Computação Científica Nacional POSC - Programa Operacional Sociedade do Conhecimento UMIC - Agência para a Sociedade do Conhecimento UE - União Europeia - FEDER - Fundo Europeu de Desenvolvimento Regional