¿Hemos descifrado la IA?

Nosotros hacemos robots. Personajes humanos realistas que impresionan a las personas y hacen deleitar a una multitud desprevenida.

Podrías pensar que hemos creado inteligencia artificial. Sin embargo, los robots no son IA y la IA no se trata solo de robots.

La IA suele ser solo un código de ordenador, que no es tan espectacular como nuestros personajes realistas. Pero se utiliza para el reconocimiento de voz y el reconocimiento facial y de objetos, con los que se pueden programar nuestros robots.

La IA pura, del tipo que se muestra en películas como Her, Blade Runner y 2001: Una odisea del espacio, lamentablemente aún no existe..

¿Pero vuestros robots se sienten lo suficientemente reales?

Si has hablado con uno de nuestros robots, es posible que hayas disfrutado de una excelente conversación. Pero en realidad probablemente estabas hablando con un humano a través de nuestro innovador software de telepresencia, TinMan<link to TinMan page>. La inteligencia humana seguirá superando a la inteligencia artificial siempre.

Todos nuestros robots se ejecutan en el mismo marco de software Tritium<link to Tritium page>, que podemos personalizar con nuevos programas para que cada interacción robot-humano se sienta única.

Reconocimiento de voz

¿Pueden oír nuestros robots? Bueno, podemos agregar reconocimiento automático de voz (RAV) a nuestros robots, que convierte el sonido en texto. No es posible interpretar el sarcasmo, el tono de voz o el contexto, pero el RAV puede ayudar a crear interacciones increíbles entre las personas y nuestros robots.

Nuestra solución de software favorita actual para ASR es el Google Cloud Speech-to-Text API, un servicio basado en la nube que se paga por minuto. Tiene muy buena precisión y compatibilidad con varios idiomas. 

Visión por ordenador

¿Pueden ver nuestros robots? No hemos creado una alternativa para el ojo humano, pero la visión por ordenador (VO) puede ayudar a nuestros robots a reconocer una cara u otros objetos en una imagen.

Nuestro software favorito para esto es Visage, una opción con licencia de pago desarrollada por Visage Technologies AB en Suecia. Esto permite a nuestros robots localizar rostros en una imagen y adivinar la edad, el género y las expresiones faciales, pero no reconocerán a las personas.

Si tienes un programa de VO en particular que deseas utilizar, podemos hacerlo funcionar en nuestro marco Tritium.<link to Tritium page>.

Conversación

Existen soluciones para bot conversacionales, pero no suelen ser tan impresionantes como para atraer a una multitud. Simplemente no está cerca de crear una interacción con un humano real a través de un robot. Es por eso que elegimos utilizar el software de telepresencia, TinMan<link to TinMan page>, que permite que nuestros robots sean operados por humanos.

Podemos proporcionar una versión preinstalada de ChatScript de Bruce Wilcox que tiene licencia del MIT y es de uso gratuito. Pero en nuestro software TinMan es donde se encuentra la verdadera magia.

Calidad de voz

Una ceja levantada de nuestros robots puede valer más que mil palabras. Pero cuando se trata de cómo suenan nuestros robots, podemos darte tres opciones:

  1. voces humanas grabadas que son generalmente las más impresionantes;
  1. voces sintetizadas por ordenador que te brindan más flexibilidad;
  1. voces sintetizadas tanto humanas como sintetizadas, mezcladas según sea necesario.

¿Buscas algo más?

Cuéntanos sobre tus ideas para generar interacción y buscaremos cómo darles vida. O si tienes uno de nuestros robots y deseas probar tus propias ideas, la API está abierta para que las experimentes. 

de este sitio web.