Participação institucional
Instituições de cariz científico e cultural poderão contribuir para o desenvolvimento do Arquivo da Web Portuguesa.
Arquivar e preservar a web é uma tarefa ambiciosa que exige evoluções permanentes, estamos ao dispor da comunidade para parcerias na nossa área de experiência.
O projecto de Arquivo da Web Portuguesa inclui tarefas de investigação e desenvolvimento. Dada a abrangência do projecto e os novos desafios que terão de ser superados, a colaboração com organizações externas à FCCN poderá ser benéfica para ambas as partes.
Em seguida, apresentam-se algumas tarefas que poderão ser executadas no âmbito de trabalhos académicos e de investigação:
- Análise de requisitos. Para criar um sistema de arquivo da web útil à comunidade é necessário perceber quais são as necessidades e expectativas dos seus utilizadores. O Arquivo da Web poderá servir cidadãos comuns ou investigadores de várias áreas, como historiadores, linguistas ou sociólogos, que terão interesses e requisitos diferentes em relação ao sistema. A realização de estudos que permitam identificar perfis de utilização de um arquivo histórico da web seria muito valiosa.
- Análise de estatísticas acerca da web de Portugal. Periodicamente serão gerados relatórios de caracterização da web de Portugal. A existência de massa crítica adicional para interpretação dos resultados obtidos e realização de investigações mais aprofundadas sobre fenómenos identificados é importante.
- Avaliação dos sistemas desenvolvidos. Todos os sistemas desenvolvidos serão exaustivamente testados antes de serem lançados ao público. A avaliação é uma das etapas do método científico e a participação de pessoas com elevado sentido crítico é crucial para detectar pontos a melhorar, por exemplo, ao nível da usabilidade e segurança dos sistemas.
- Recuperação de informação textual sobre colecções históricas. Além de arquivar a informação publicada na web é crucial mantê-la acessível. Os algoritmos actualmente utilizados pelos motores de busca focam-se apenas na pesquisa sobre uma recolha da web e não consideram a existência de uma colecção de conteúdos criada incrementalmente ao longo do tempo. A pesquisa de informação sobre arquivos históricos da web é um problema complexo e a investigação para a sua resolução começa agora a dar os primeiros passos.
- Pesquisa de imagens. Uma imagem vale mil palavras, mas por vezes nem com mil palavras conseguimos encontrar a imagem que queremos. Os motores de busca sobre a web procuram imagens baseando-se nos textos que lhe estão associados. No entanto, esta associação entre textos e imagens não é linear e por vezes produz resultados indesejados. O estudo de mecanismos eficientes que permitam extrair ou associar texto a imagens da web poderia originar um serviço de pesquisa adicional para o nosso projecto. O Arquivo da Web irá conter uma grande quantidade de imagens que permitirá desenvolver e avaliar novos algoritmos de pesquisa de imagens usando dados reais.
- Pesquisa de vídeos. A quantidade de vídeos disponíveis na Web tem crescido nos últimos anos. Informação que era publicada na forma textos, como por exemplo manuais de utilização, é cada vez mais publicada sob a forma de vídeos. No entanto, os serviços de pesquisa actuais são limitados, pois apenas permitem pesquisar sobre os textos associados aos vídeos e não permitem pesquisar sobre a informação contida nos mesmos. Além disso, os resultados referenciam vídeos integrais o que obriga os utilizadores a visualizarem a totalidade de um vídeo, mesmo quando apenas estão interessados na informação comunicada em alguns segundos. É assim mais moroso e difícil identificar uma informação relevante num vídeo do que num texto. A criação de algoritmos que permitam pesquisar informação contida nos vídeos é uma área interessante.
- Interfaces de utilização adequadas à consulta da informação arquivada. A usabilidade das interfaces de utilização de sistemas de informação tem provado repetidamente ser um factor chave para o sucesso de um projecto. O estudo de uma interface de utilização e camada intermédia que permitam aceder à informação web arquivada é uma tarefa que apresenta inúmeros desafios, implicando trabalho de investigação e testes com utilizadores reais.
Se trabalhar em alguma destas áreas e estiver
interesse em colaborar com o Arquivo da Web, não hesite em contactar-nos. Caso a sua organização tenha preocupações ao nível da preservação da cultura e história de Portugal poderá também aderir ao projecto rARC disponibilizando espaço para o armazenamento de cópias de segurança do arquivo da web portuguesa.