P-Found

Universidade de Coimbra

Logotipo do Centro de Neurociências e Biologia Celular

Centro de Neurociências e Biologia Celular  

P-Found: Computação GRID e armazenamento distribuído de dados de simulações de dobragem e desdobragem de proteínas

Outros participantes: Universidade do Minho, Faculdade de Ciências e Tecnologia da Universidade de Coimbra, Critical Software, S.A., University of Ulster - School of Biomedical Sciences (UU-SBS)

Investigador responsável: Rui Manuel Pontes Meireles Ferreira Brito

Financiamento: 166.000€

Recentemente, a identificação de várias doenças humanas e animais como doenças devidas a alterações nos mecanismos de dobragem proteica, e a necessidade de compreender a informação presente nos genomas, pôs em evidência o problema da dobragem proteica, isto é, o processo de aquisição de estrutra tridimensional de uma proteina a partir da sequência linear de amino-ácidos. Depois de várias décadas de esforços, este é ainda um problema por resolver.

Julga-se hoje que a desdobragem parcial de proteínas é responsável por iniciar processos amiloidogénicos. Estes processos estão na origem de doenças como Alzheimer, Parkinson e BSE (encefalopatia espongiforme bovina) e várias outras doenças neurodegenerativas adquiridas ou hereditárias. Assim, o estudo detalhado de acontecimentos de dobragem ou desdobragem proteica é central no desenvolvimento de estratégias terapêuticas racionais contra estas doenças.

Simulações computacionais baseadas em dinâmica molecular ou outros métodos são úteis na exploração destes acontecimentos de dobragem e desdobragem proteica. Apesar de estas simulações serem muito dispendiosas em recursos computacionais, hoje em dia os resultados destas simulações não estão disponíveis fora dos grupos que as realizam. Tendo isto em consideração, propusemos recentemente a criação de uma plataforma global com o objectivo de partilhar, comparar e analizar simulações de dobragem e desdobragem de proteínas – o sistema P-found (www.p-found.org).

Contudo, devido ao volume de dados envolvido nestas simulações é de vital importância optimizar o uso de recursos computacionais para realizar as simulações (computação GRID), minimizar a transferência de largos volumes de dados com a criação de uma base de dados distribuída (GRID de dados) e implementar procedimentos para enviar computação para os locais de armazenamento dos dados (computação GRID). Estes são os objectivos principais do presente projecto. Para os realizar constituímos uma equipa com biofísicos moleculares, cientistas da computação e bioinformáticos, da academia e da indústria, de Portugal e do estrangeiro.

Dos contactos mantidos até agora com grupos dos Estados Unidos e Europeus, acreditamos que chegou o tempo de uma iniciativa destas ter sucesso. Construímos já um protótipo de uma base de dados centralizada – o repositório P-found – mas o nosso objectivo é transformá-la numa base de dados distribuída globalmente acessível.

Adicionalmente, a existência deste recurso e a possibilidade de aplicar metodologias de análise de dados para comparar e contrastar múltiplas simulações de desdobragem de proteínas pertencentes a diversas classes estruturais ou comparar variantes proteicas amiloidogénicas e não-amiloidogénicas, pode permitir a produçao de novo conhecimento e novas formas de compreender o problema da dobragem proteica e a sua relação com a saúde e a doença.