O reconhecimento facial deixou de ser um assunto de ficção científica e passou com segurança para o mundo real, sendo hoje uma das aplicações mais populares do software de análise de imagem . Muitas pessoas consideram isso uma tecnologia sinistra, com vários casos de uso em vigilância e coleta de informações.
No entanto, a maioria das aplicações moveis acionáveis de reconhecimento facial está além do que a maioria das pessoas associa. Ironicamente, muitas delas estão sendo desenvolvidas para nos proteger de intrusos. Por exemplo, o controle de acesso é um dos usos mais comuns do reconhecimento facial. Se você está desbloqueando seu smartphone apenas olhando para ele, então entende a conveniência de tal tecnologia. Muito em breve você pode até mesmo retirar dinheiro de um caixa eletrônico simplesmente permitindo que ele o reconheça.
Qualquer que seja sua aplicação de reconhecimento facial, é importante entender a complexidade da tecnologia para fazer a chamada certa. Você não quer desperdiçar seus recursos em um conceito que não criará valor real para você e sua empresa.
Em essência, a tecnologia é possibilitada por uma infinidade de algoritmos matemáticos que dividem as imagens em pixels / pontos de dados e tentam entender esses dados recém-adquiridos através de várias manipulações.
Claro, esta é uma explicação extremamente simplificada. Algoritmos de reconhecimento facial são variados em robustez e aplicações. Cada um deles tem suas vantagens e desvantagens, bem como uma variedade de etapas de pré-processamento de dados. O reconhecimento facial no seu smartphone funciona de maneira diferente do reconhecimento facial em câmeras de rua. Alguns algoritmos funcionam melhor com um pequeno conjunto de imagens, enquanto outros exigem uma ampla variedade para um bom desempenho.
Como funciona o reconhecimento facial?
Para que o software de reconhecimento facial identifique características faciais exclusivas, ele precisa executar várias tarefas. Existem inúmeras definições para os sistemas de reconhecimento facial e o que elas abrangem, tudo se resume às seguintes etapas:
Detecção de rosto: primeiro, o sistema deve identificar a parte da imagem ou o vídeo que representa a face.
Pré-processamento: os dados devem ser transformados em um formato monolítico normalizado (as imagens devem ter a mesma resolução, níveis de zoom, brilho, orientação). Também é freqüentemente chamado de normalização de recursos.
Extração de recursos: o sistema precisa extrair dados das imagens faciais, identificando os bits de dados mais relevantes e ignorando todo o “ruído”. Ele também é chamado de codificação.
Só então reconhecimento facial
Reconhecimento facial: o processo real de correspondência de recursos de dados exclusivos para cada indivíduo. O princípio subjacente aqui é chamado de classificação de objetos.
Esta é uma versão muito simplificada de um sistema de reconhecimento facial que usa algoritmos para realizar todas essas transformações. Cada uma dessas etapas inclui processos adicionais. Você também estará trabalhando com alguns algoritmos em conjunto. Por exemplo, o estágio de detecção de rosto usa um algoritmo separado para identificar características faciais.
Durante todas essas manipulações, existem vários problemas inerentes ao tipo de dados usados, que também não são fáceis de serem superados. Esses problemas moldam o fluxo de trabalho para reconhecimento facial e todas as várias etapas de detecção/pré-processamento/normalização de faces envolvidas. Vamos listar alguns destes problemas abaixo.
Iluminação: as diferenças na iluminação podem afetar a eficiência do reconhecimento.
Pose: a pose exata que a pessoa está fazendo durante a captura de imagem.
Idade: características faciais mudam com o tempo, especialmente porque certas partes de nossos rostos continuam crescendo ao longo de nossas vidas.
Oclusão: características faciais parcialmente encobertas podem afetar negativamente o processo de reconhecimento: óculos de sol, penteados que parcialmente escondem características faciais, pêlos faciais.
Resolução: se as imagens forem tiradas de várias origens e normalizadas, é provável que você tenha que alterar as resoluções de algumas delas, o que afetará negativamente sua qualidade.
Para lidar com esses problemas, um pipeline de reconhecimento facial específico pode empregar alguns algoritmos e técnicas para normalizar os dados e melhorar os recursos de reconhecimento.
Existem inúmeros algoritmos de reconhecimento facial. Alguns deles são mais antigos; alguns são mais novos. É importante notar que a eficiência deles também dependerá dos tipos de dados/imagens com os quais você trabalhará.
Uma reflexão para o futuro
O reconhecimento facial ainda é uma tecnologia nova. Muito do trabalho feito no campo é experimental. Muitas vezes, você verá pessoas tentando melhorar os métodos que eles viram em uma publicação acadêmica com a esperança de melhorar a precisão e a velocidade do processo. É por isso que mesmo grandes empresas sofrem com falhas no reconhecimento facial. Por exemplo, um estudo recente do MIT mostrou que a tecnologia de reconhecimento facial da Microsoft tinha um viés para mulheres com tons de pele mais escuros, resultando em uma taxa de erro de mais de 20%. A Microsoft tomou medidas para aliviar esses problemas desde então.
Essa é outra razão pela qual as empresas de tecnologia estão investindo no reconhecimento facial. Estão apoiando publicamente a P&D nesse domínio. Por exemplo, a IBM lançou recentemente um enorme conjunto de dados baseado em imagens que pode ser usado para treinar algoritmos de aprendizado de máquina/redes neurais para lidar melhor com problemas de reconhecimento facial. A falta de bons conjuntos de dados de treinamento é um problema para a tecnologia, e é por isso que as falhas como no caso da Microsoft, continuam se revelando.
Respostas de 2