Será a dinâmica facial um identificador biométrico?
Quando pensamos em Marcel Marceau, a imagem que a maioria de nós cria será a do seu personagem mais famoso – o palhaço Bip, com o seu rosto branco, sobrancelhas arqueadas e lábios vermelhos. Retire-se a maquilhagem, e quantos conseguirão identificar, numa fotografia, Marcel Marceau, o homem por detrás do palhaço? Poucos. Mas bastará que Marceau (o próprio) reproduza as expressões do palhaço Bip para imediatamente ser reconhecido. Por outro lado, se outra pessoa tentar imitar as expressões de Bip, dificilmente será confundido com Marcel Marceau, mesmo estando maquilhado.
A equipa de Jorge Batista, no Instituto de Sistemas e Robótica da Universidade de Coimbra, debruça-se precisamente sobre este problema: será que os processos de dinâmica facial são característicos de cada pessoa? Ou seja, será que cada um de nós tem uma “assinatura” facial na forma como expressa as suas emoções ou como articula a dicção de uma palavra ou frase? É um problema ainda em aberto na área da psicofísica: se a informação de dinâmica facial complementa o reconhecimento de identidade baseado em aparência ou se o reconhecimento da identidade será apenas dependente de um destes estádios.
No ISR abordam o problema através da utilização da visão por computador no estudo da informação facial. O seu mais recente projeto financiado pela FCT, teve como objetivo a criação de um sistema computacional de reconhecimento de identidade a partir da dinâmica facial, em tempo real. A introdução de uma 4ª dimensão – o tempo – é precisamente uma das contribuições inovadoras deste projeto de dois anos. Existem várias bases de dado de dinâmica facial em duas dimensões (2D), e algumas também em 3D, mas poucas em 4D, e nenhuma com as características da que os investigadores de Coimbra criaram.
Para a construção da base de dados em 4D a equipa desenvolveu um sistema de múltiplas câmaras que permitiram reconstruir em tridimensionalidade a superfície do rosto de quase 100 voluntários (estudantes universitários) enquanto exprimiam uma de nove expressões: ira, desprezo, repugnância, medo, alegria, tristeza, surpresa e neutro, e ainda a frase “Yes we can“. A base de dados contém quase 40 000 imagens, que retratam os processos de deformação da face ao longo do tempo. Para cada imagem é definido um conjunto de pontos constantes no espaço e no tempo, que são ajustados a cada frame. A representação visual deste conjunto de pontos é uma rede, com os nós localizados em pontos específicos da face: no contorno dos olhos, da boca, do nariz, do rosto.
Ao contrário do que acontece com outras bases de dados, a do ISR é densamente registada e estabelece uma correspondência de cada ponto facial ao longo do tempo. Ou seja, sabe-se como o ponto correspondente ao cantinho do olho, por exemplo, se movimentou ao longo do tempo, porque se fez o chamado registo. Ter uma base de dados registada envolve marcação do conjunto de pontos em milhares e milhares de imagens – um processo moroso – mas torna a sua utilização muito mais proveitosa e eficaz.
Com a informação da base de dados, a equipa do ISR está já a tentar responder a uma das questões que orientam o projeto: se a dinâmica de deformação tridimensional da face humana é uma característica individual.
Segundo Jorge Batista “O trabalho realizado no âmbito de um doutoramento, pegou nesta informação (da base de dados) (…) e, verificámos que sim, (…) conseguimos mostrar que existe uma taxa de reconhecimento de identidade bastante significativa usando unicamente a informação da deformação temporal da face.”
De facto, a base de dados permite uma “taxa de sucesso superior a 90% na eficiência de reconhecimento de identidade”, o que abre caminho para que outros investigadores possam construir sobre esta baseline de resultados, para os melhorar e aplicar a estudos específicos.
Jorge Batista descreve o seguinte cenário, “No futuro, a biometria será uma combinação de vários processos, incluindo a dinâmica facial nos processos de reconhecimento e identificação. Se tivermos uma solução em que a pessoa consegue chegar a uma câmara, e (…) basta dizer o nome e (o sistema) verifique se como a forma como a face se deformou quando a pessoa diz o próprio nome é característica dessa pessoa, é algo mais que se adiciona à componente de reconhecimento da voz e da retina, por exemplo”.
Alinhar rostos
Para a elaboração desta base de dados foi necessário desenvolver uma série de metodologias que permitissem uma aprendizagem da textura e forma da face a partir de um conjunto de imagens características, de modo que a rede de pontos tenha a capacidade de se ajustar automaticamente, e de forma correta, a qualquer rosto – mesmo um que não exista na base de dados.
São processos de alinhamento de face (face alignment, em inglês) – uma área em que a equipa do ISR tem já uma vasta experiência – e para o qual existe também grande potencial de aplicabilidade.
Um das possíveis aplicações da alinhamento de faces é a monitorização da atenção visual de condutores, por exemplo. Começam já a existir sistemas deste tipo instalados em automóveis. Um projeto anterior da equipa, também financiado pela FCT, incluía também a monitorização da frequência do piscar dos olhos do condutor – um reconhecido sintoma de cansaço.
Os processos de alinhamento de face podem também ser aplicados à criação de um face-mouse: um rato de computador controlado por movimentos do rosto. Esta aplicação é de reconhecido interesse para vítimas de lesões da espinal medula ou outros tipos de paralisia dos membros, pois permitir-lhes-ia utilizar livremente o computador.
Os resultados produzidos nestes dois anos de projeto lançaram fortes bases para colaborações e investigações futuras, da própria equipa e da restante comunidade de visão por computador, pois a base de dados de dinâmica facial 4D criada será colocada em acesso aberto a todos os investigadores que a queiram utilizar.