Comunicarnos con los delfines será posible gracias a un modelo de IA desarrollado por Google
“Un modelo de entrada y salida de audio que procesa secuencias de sonidos naturales de delfines para identificar patrones, estructurar y predecir posibles sonidos posteriores en una secuencia”, así funciona DolphinGemma, un modelo de Inteligencia Artificial (IA) desarrollado por Google, que ayuda a los científicos a estudiar cómo se comunican estos cetáceos.
DolphinGemma utiliza tecnologías de audio específicas de Google como el tokenizador SoundStream, que representa los sonidos de los delfines para luego ser procesados por una arquitectura de modelo adaptada a secuencias.
Este modelo funciona de forma similar a los grandes modelos lingüísticos para el lenguaje humano que predicen la siguiente palabra o elemento en una oración. Para ello cuenta con unos 400 millones de parámetros y tiene el tamaño óptimo para ejecutarse directamente en los teléfonos Pixel, de Google, utilizados en campo por el Proyecto Delfín Salvaje (WDP, por sus siglas en inglés).
Este modelo se basa en la información de Gemma, la colección de modelos abiertos, ligeros y de vanguardia de Google, creados con la misma investigación y con tecnología que impulsa el modelo Gemini, entrenado con la base de datos acústica de delfines salvajes monitoreados en el Atlántico.
Lee también: ¿Qué hay detrás de Jianwei Xun y su libro escrito con Inteligencia Artificial?
Al identificar patrones de sonido recurrentes, grupos y secuencias fiables, el modelo puede ayudar a los investigadores a descubrir estructuras ocultas y posibles significados en la comunicación natural de los delfines.
Con el tiempo, estos patrones, complementados con sonidos sintéticos creados por los investigadores para referirse a objetos con los que juegan los delfines, sería posible establecer un vocabulario compartido con ellos para mantener una comunicación interactiva.
En colaboración con el Instituto Tecnológico de Georgia, Google también desarrolló el sistema CHAT (Telemetría de Aumento Auditivo para Cetáceos), una computadora submarina diseñada para establecer un vocabulario compartido más simple.
El concepto se basa en asociar silbidos sintéticos novedosos (creados por CHAT, que se asemejan a los sonidos naturales de los delfines) con objetos específicos que los delfines disfrutan, como sargazo, pastos marinos o bufandas que usan los investigadores.
Los investigadores esperan que los delfines aprendan a imitar los silbidos para solicitar estos objetos. Con el tiempo, a medida que se comprendan mejor los sonidos naturales de los delfines, también podrán incorporarse al sistema.
Para lograrlo, se requiere permitir una interacción bidireccional en el que CHAT debe escuchar la mímica con precisión en medio del ruido del océano, identificar qué silbato fue imitado en tiempo real, informar al investigador (a través de auriculares conductores óseos que funcionan bajo el agua) qué objeto “solicitó” el delfín, permitir que el investigador ofrezca el objeto correcto, reforzando la conexión.
Por ahora no se sabe con exactitud qué dicen los delfines, pero los investigadores aseguran que “con suerte y con DolphinGemma sea posible”.