Es difícil determinar si el audio en el que se le escucha a Martí Batres orquestar una cargada en contra de Omar García Harfuch fue creado con Inteligencia Artificial o si es un mensaje real que de alguna manera llegó a manos de operadores políticos a favor del ex secretario de seguro de la CDMX.
Si bien, en redes sociales ya se han difundido otros audios con las voces de Clara Brugada, Marcelo Ebrard, Claudia Sheinbaum y hasta del presidente Andrés Manuel López Obrador, la mayoría delatan su falsedad por elementos como problemas para ligar las frases, pausas y cortes repentinos, o por ser fragmentos de declaraciones fácilmente identificables.
Esto no es tan sencillo con el audio atribuido a Martí Batres, que él mismo señaló que era obra de la Inteligencia Artificial.
La narración en el audio con la voz de Batres es bastante fluido y al revisar el espectro de onda en programas especializados en sonido no se observan cambios en el tono y ritmo de voz, características muy comunes en archivos creados con Inteligencia Artificial, ni tampoco pausas o cortes en seco.
Sin embargo, al pasar el audio original en aplicaciones para identificar archivos creados con Inteligencia Artificial, como AI Spy y AI Speech Classifier, los resultados arrojan que hay más del 90% de probabilidad de que sea falso.
Debaten sobre autenticidad de audio de Martí Batres
El debate en redes sociales en torno a este audio sigue abierto, quiénes opinan que es real argumentan la fluidez de la voz, las respiraciones y muletillas que se escuchan, también dicen que el contexto que se marea corresponde por completo a la situación que se vive en la Ciudad de México y la elección del candidato a Jefe de Gobierno por Morena.
Mientras que las personas que respaldan la postura de Martí Batres y creen que es falso, señalan que hay elementos técnicos en el espectro de onda que no son naturales y que hoy en día existen páginas y aplicaciones gratuitas o de paga que pueden hacer un trabajo similar.
La periodista Pamela Cerdeira realizó un ejercicio para replicar el contenido del audio en la aplicación IMyFone. Transcribió en texto lo que se dice en el archivo viral y usó un fragmento original de un discurso de Martí Batres para que la inteligencia artificial pudiera replicar la voz.
El resultado sí arrojó una voz muy similar a la de Martí Batres, pero con una narración robótica, sin entonación y con pausas repentinas. Muy diferente al audio viral.
Por otro lado, el usuario @AlbertoEscorcia, del blog Lo que Sigue, que hace análisis y seguimiento del uso de herramientas digitales con fines políticos, examinó el archivo y dijo que era falso.
Además, creó uno nuevo en la app PlayHT para demostrar cómo se pudo clonar la voz de Martí Batres, pero no utilizó una transcripción de la narración original para poder comprarla, cómo sí lo hizo Pamela Cerdeira. Su réplica apenas dura unos 4 segundos.
¿Se pueden identificar fotos, videos o audios creados con Inteligencia Artificial?
Las fotos y videos manipulados con Inteligencia Artificial son fáciles de detectar, a veces a simple vista saltan detalles que delatan que el contenido fue alterado.
En el caso de las fotos, esos detalles son recortes mal hechos en los contornos de objetos y personas, errores en dedos y dientes, extremidades desproporcionadas o pieles suavizadas, que dan aspecto de ser más una animación que una fotografía.
Existen herramientas en línea que ayudan a determinar si una imagen fue hecho con inteligencia artificial, como SynthID, creada por Google; o también está AI or Not, ambas son gratis.
Para los vídeos, normalmente las ediciones con IA son del tipo deep fake, es decir, ponen el rostro de una persona en la de otra.
Este tipo de herramientas, al menos las disponibles para todo público, no son perfectas y los errores son fáciles de detectar. Los trabajos profesionales cuestan mucho dinero y solo costeables para la industria audiovisual, cómo el cine y la televisión.
Aun así, Deepware y Sensity AI son herramientas que permiten analizar un video con sospechas de ser un deep fake.
Para los audios, la tarea es más difícil porque se tienen que analizar aspectos difíciles de percibir y únicamente detectables en el espectro de onda, para este tipo de archivos algunas opciones son AI Spy y AI Speech Classifier, también de libre uso.
Te puede interesar:
- Usar Inteligencia Artificial para desnudar gente sí es un delito.
- Deepfake. Apps para cambiar la cara de alguien en una foto.