O desafio foi projetado para testar a eficácia das atuais tecnologias biométricas de voz em amostras de fala capturadas em ambientes reais
Os resultados mais recentes do Desafio de Reconhecimento de Voz de Celebridades VoxCeleb 2023 chegaram, com a ID R&D conquistando o primeiro lugar nas métricas de função de custo de detecção (DCF) e taxa de erro igual (EER)1.
VoxCeleb 2023 é um banco de dados de voz de celebridades utilizado para pesquisa e análise em várias áreas, como reconhecimento de voz, síntese de fala e tecnologias de IA. É uma fonte confiável de amostras de voz de alta qualidade, que abrange uma ampla variedade de celebridades de diferentes áreas, como cinema, música e entretenimento.
O desafio foi organizado por pesquisadores da Universidade de Oxford, do Instituto Avançado de Ciência e Tecnologia da Coreia (KAIST), da Universidade Carnegie Mellon e da AWS.
O objetivo deste desafio é investigar até que ponto os métodos atuais podem reconhecer speakers a partir de falas obtidas “in nature”, capturadas em ambientes reais. O conjunto de dados é composto por vídeos online de entrevistas com celebridades, com uma ampla variedade de qualidade, número de palestrantes e condições de ruído de fundo em uma variedade de ambientes de gravação.
A segunda trilha do desafio avalia a eficácia da autenticação biométrica de voz independente de fala (ou seja, sem senhas). A ID R&D submeteu seu software IDVoice para avaliação e obteve as notas máximas.
A vitória da ID R&D é particularmente importante porque demonstra o desempenho do seu software em condições que poderiam ser esperadas em conversas do mundo real, como com a tecnologia emergente de chatbot generativa alimentada por IA.
“O VoxCeleb é um desafio rigoroso que exige o reconhecimento do orador sem senhas em conversas em ambientes imprevisíveis”, comenta Konstantin Simonchik, diretor científico e cofundador da ID R&D. “Nosso sucesso pode ser atribuído em parte ao uso de todos os recursos disponíveis para alcançar os melhores resultados. Esta vitória é particularmente importante para a ID R&D porque demonstra o desempenho de nossa tecnologia em condições que poderiam ser esperadas em conversas do mundo real, como com a tecnologia emergente de chatbot generativa alimentada por IA.”
A ID R&D também recebeu recentemente uma patente para um sistema para detectar deepfakes e ataques de falsificação contra sistemas biométricos de voz. Confira na matéria: ID R&D patents new method for detecting voice spoof attacks and deepfakes publicada na BiometricUpdate.
“Fiel ao nosso nome, a pesquisa é uma prioridade estratégica na ID R&D, e nossos produtos são construídos com base na investigação e descoberta de novas maneiras de reduzir a fraude sem sobrecarregar os usuários”, diz Alexey Khitrov ao BiometricUpdate. “Esta patente mais recente exemplifica o papel da nossa investigação em sermos pioneiros no mercado com soluções que tornam o acesso a serviços digitais mais seguro e fácil para milhões de pessoas em todo o mundo.”
Os resultados foram anunciados no Workshop VoxSRC na Interspeech 2023 em Dublin na semana passada. A 24ª Conferência INTERSPEECH foi realizada de 20 a 24 de agosto de 2023 no Centro de Convenções de Dublin, Irlanda com o tema “Processamento da linguagem falada: abrindo novas possibilidades“. A INTERSPEECH é a maior e mais abrangente conferência mundial sobre ciência e tecnologia do processamento da linguagem falada.
[1] DCF: A função de custo de detecção é uma medida de quão bem um sistema de reconhecimento biométrico pode distinguir entre um usuário verdadeiro e um impostor. Quanto menor o DCF, melhor o desempenho do sistema. EER: A taxa de erro igual é a taxa em que o sistema de reconhecimento biométrico identifica corretamente 50% dos impostores. Quanto menor a EER, melhor o desempenho do sistema.
A P&D de ID R&D está comprometida em fornecer uma experiência do cliente segura e contínua. Para isso, desenvolveu um conjunto exclusivo de tecnologias que eliminam métodos de autenticação complicados. Assista o Vídeo.
Sobre ID R&D
ID R&D, uma empresa Mitek, é um fornecedor premiado de biometria de voz e facial baseada em IA e detecção de liveness. Com uma das mais fortes equipas de P&D da indústria, a ID R&D fornece consistentemente capacidades biométricas inovadoras e de primeira classe que elevam o nível em termos de usabilidade e desempenho. Nossos produtos alcançaram resultados superiores em desafios líderes do setor, testes de terceiros e implementações no mundo real em mais de 70 países. As soluções da ID R&D estão disponíveis para fácil integração para mobile, web, mensageiros, e canais telefônicos, bem como em smart speakers set-top boxes, e outros dispositivos IoT. A ID R&D está sediada em Nova Iorque, NY. Saiba mais em www.idrnd.ai.
Outros Artigos da ID R&D, leia aqui!
Estudo de caso: o impacto de uma atualização do liveness ativo para passivo
O gerenciamento de ID digital desarticulado cria vulnerabilidade de IA generativa
ID R&D e Anonybit analisam a ameaça deepfake à biometria e como mitigá-la
Acompanhe como o reconhecimento facial, impressões digitais, de íris e voz e o comportamento das pessoas estão sendo utilizados para garantir a identificação digital precisa para mitigar fraudes e proporcionar aos usuários conforto, mobilidade e confiança. Crypto ID é, sem dúvida, o maior canal brasileiro sobre identificação digital. Leia outros artigos aqui!