Pesquisadores usaram modelos de inteligência artificial treinados com humanos para tentar entender a linguagem canina

Porto Velho, RO - Quem ama animais com certeza já quis um dia poder falar com eles e entender o que eles estavam dizendo. Por ser um tópico bem interessante, os cientistas estão usado cada vez mais ferramentas de inteligência artificial (IA) para conseguirem traduzir a linguagem canina.

Com esses modelos de inteligência artificial, a linguagem canina pode identificar se o latido de um cachorro quer dizer brincadeira ou agressão. Além disso, esses modelos também podem conseguir outras informações dessas vocalizações feitas pelos animais, como por exemplo, idade, raça e sexo.

Conforme o estudo feito pelo Instituto Nacional de Astrofísica, Óptica e Eletrônica (INAOE) do México, foi descoberto que os modelos de inteligência artificial treinados originalmente para a fala humana também podem ser usados como partida no treinamento de novos sistemas para a linguagem animal.

Inteligência artificial e linguagem canina

“Usando modelos de processamento de fala inicialmente treinados em fala humana, nossa pesquisa abre uma nova janela sobre como podemos aproveitar o que construímos até agora no processamento de fala para começar a entender as nuances dos latidos de cães”, disse Rada Mihalcea, a Professora Colegiada Janice M. Jenkins de Ciência da Computação e Engenharia e diretora do Laboratório de IA da U-M.

“Há muito que ainda não sabemos sobre os animais que compartilham este mundo conosco. Avanços em IA podem ser usados para revolucionar nossa compreensão da comunicação animal, e nossas descobertas sugerem que talvez não precisemos começar do zero”, continuou.

Dentre os obstáculos para criar modelos de inteligência artificial que traduzam a linguagem dos animais existe a falta de dados que estão publicamente disponíveis. Ao contrário dos vários recursos e oportunidades na gravação da fala humana, conseguir fazer a coleta dos dados de animais é mais difícil.

“Vocalizações animais são logisticamente muito mais difíceis de solicitar e gravar. Eles devem ser gravados passivamente na natureza ou, no caso de animais de estimação domésticos, com permissão dos proprietários”, disse Artem Abzaliev, autor principal e estudante de doutorado da U-M em ciência da computação e engenharia.

Por conta dessa falta de dados utilizáveis é difícil desenvolver técnicas capazes de analisar as vocalizações dos cachorros. E as existentes são limitadas por conta da falta de material de treinamento. Esses desafios são superados pelos pesquisadores pela reutilização de um modelo que já existe e foi projetado originalmente para a fazer a análise da fala humana.

Observações



Através disso, os pesquisadores puderam aproveitar os modelos que formam a espinha dorsal das várias tecnologias habilitadas para voz, como a voz para textos e tradução de idiomas. Esses modelos são projetados para entender e diferenciar as nuances da fala humana, como tom, altura e sotaque, e transformá-las em algo que um computador possa usar na identificação das palavras que foram ditas, reconhecer quem está falando, entre outras coisas.

“Queríamos ver se poderíamos aproveitar essa capacidade para discernir e interpretar os latidos de cães”, pontuou Abzaliev.

Para isso, eles usaram vocalizações de 74 cachorros de raças, idades e sexos diferentes, obtidas em contextos variados. A equipe foi liderada por Humberto Pérez-Espinosa, um colaborador do INAOE, que usou as gravações para mudar um modelo de aprendizado de máquina.

O modelo de inteligência artificial escolhido pelos pesquisadores foi o modelo de representação de fala chamado Wav2Vec2, originalmente treinado com vozes humanas. Através desse modelo, eles conseguiram gerar representações dos dados acústicos dos cachorros e fazer uma interpretação deles.

Como resultado, eles viram que o Wav2Vec2 não apenas foi bem sucedido em quatro tarefas de classificação, como também superou outros modelos que tinham sido treinados especificamente para a linguagem canina.

Fonte: Fatos Desconhecidos