Participação institucional
Instituições de cariz científico e cultural poderão contribuir para o desenvolvimento do Arquivo da Web Portuguesa.
- Índice
Arquivar e preservar a web é uma tarefa ambiciosa que exige evoluções permanentes, estamos ao dispor da comunidade para parcerias na nossa área de experiência.
O projecto de Arquivo da Web Portuguesa inclui tarefas de investigação e desenvolvimento. Dada a abrangência do projecto e os novos desafios que terão de ser superados, a colaboração com organizações externas à FCCN poderá ser benéfica para ambas as partes.
Publicámos uma lista de propostas de projectos de colaboração que poderão ser realizados no âmbito de trabalhos de investigação e desenvolvimento.
Adicionalmente, apresentam-se em seguida algumas tarefas que poderão ser executadas no âmbito de trabalhos académicos e de investigação.
Se trabalhar em alguma destas áreas e estiver interesse em colaborar com o Arquivo da Web, não hesite em contactar-nos. Caso a sua organização tenha preocupações ao nível da preservação da cultura e história de Portugal poderá também aderir ao projecto rARC disponibilizando espaço para o armazenamento de cópias de segurança do arquivo da web portuguesa.
Análise de requisitos
Para criar um sistema de arquivo da web útil à comunidade é necessário perceber quais são as necessidades e expectativas dos seus utilizadores. O Arquivo da Web poderá servir cidadãos comuns ou investigadores de várias áreas, como historiadores, linguistas ou sociólogos, que terão interesses e requisitos diferentes em relação ao sistema. A realização de estudos que permitam identificar perfis de utilização de um arquivo histórico da web seria muito valiosa.
Análise de estatísticas acerca da web de Portugal
Periodicamente serão gerados relatórios de caracterização da web de Portugal. A existência de massa crítica adicional para interpretação dos resultados obtidos e realização de investigações mais aprofundadas sobre fenómenos identificados é importante.
Avaliação dos sistemas desenvolvidos
Todos os sistemas desenvolvidos serão exaustivamente testados antes de serem lançados ao público. A avaliação é uma das etapas do método científico e a participação de pessoas com elevado sentido crítico é crucial para detectar pontos a melhorar, por exemplo, ao nível da usabilidade e segurança dos sistemas.
Recuperação de informação textual sobre colecções históricas
Além de arquivar a informação publicada na web é crucial mantê-la acessível. Os algoritmos actualmente utilizados pelos motores de busca focam-se apenas na pesquisa sobre uma recolha da web e não consideram a existência de uma colecção de conteúdos criada incrementalmente ao longo do tempo. A pesquisa de informação sobre arquivos históricos da web é um problema complexo e a investigação para a sua resolução começa agora a dar os primeiros passos.
Pesquisa de imagens
Uma imagem vale mil palavras, mas por vezes nem com mil palavras conseguimos encontrar a imagem que queremos. Os motores de busca sobre a web procuram imagens baseando-se nos textos que lhe estão associados. No entanto, esta associação entre textos e imagens não é linear e por vezes produz resultados indesejados. O estudo de mecanismos eficientes que permitam extrair ou associar texto a imagens da web poderia originar um serviço de pesquisa adicional para o nosso projecto. O Arquivo da Web irá conter uma grande quantidade de imagens que permitirá desenvolver e avaliar novos algoritmos de pesquisa de imagens usando dados reais.
Pesquisa de vídeos
A quantidade de vídeos disponíveis na Web tem crescido nos últimos anos. Informação que era publicada na forma textos, como por exemplo manuais de utilização, é cada vez mais publicada sob a forma de vídeos. No entanto, os serviços de pesquisa actuais são limitados, pois apenas permitem pesquisar sobre os textos associados aos vídeos e não permitem pesquisar sobre a informação contida nos mesmos. Além disso, os resultados referenciam vídeos integrais o que obriga os utilizadores a visualizarem a totalidade de um vídeo, mesmo quando apenas estão interessados na informação comunicada em alguns segundos. É assim mais moroso e difícil identificar uma informação relevante num vídeo do que num texto. A criação de algoritmos que permitam pesquisar informação contida nos vídeos é uma área interessante.
Interfaces de utilização adequadas à consulta da informação arquivada
A usabilidade das interfaces de utilização de sistemas de informação tem provado repetidamente ser um factor chave para o sucesso de um projecto. O estudo de uma interface de utilização e camada intermédia que permitam aceder à informação web arquivada é uma tarefa que apresenta inúmeros desafios, implicando trabalho de investigação e testes com utilizadores reais.