Haben wir AI geknackt?

Wir machen Roboter. Lebensechte menschliche Charaktere, die verblüffen und ein ahnungsloses Publikum in Begeisterung versetzen.

Man könnte meinen, wir hätten künstliche Intelligenz geschaffen. Aber Roboter sind nicht KI und KI hat nicht nur mit Robotern zu tun.

KI ist meist nur Computercode, der nicht so dramatisch ist wie unsere lebensechten Charaktere. Aber es wird zur Spracherkennung und Gesichts-/Objekterkennung verwendet, mit denen unsere Roboter programmiert werden können.

Reine KI – wie sie in Filmen wie Her, Bladerunner und 2001 dargestellt wird: A Space Odyssey – gibt es leider noch nicht.

Aber Ihre Roboter fühlen sich so real an?

Wenn Sie mit einem unserer Roboter gesprochen haben, haben Sie vielleicht ein tolles Gespräch erlebt. Aber Sie haben wahrscheinlich tatsächlich mit einem Menschen über unsere innovative Telepräsenz-Software TinMan gesprochen. Menschliche Intelligenz ist künstlicher Intelligenz immer noch überlegen.

Alle unsere Roboter laufen auf demselben Tritium-Software-Framework, das wir mit neuen Programmen anpassen können, so dass sich jede Roboter-Mensch-Interaktion einzigartig anfühlt.

Spracherkennung

Können unsere Roboter hören? Nun, wir können unsere Roboter mit einer automatischen Spracherkennung (ASR, engl. Automated Speech Recognition) ausstatten, die Geräusche in Textstrings umwandelt. Es ist nicht möglich, Sarkasmus, Tonfall oder Kontext zu interpretieren. ASR kann jedoch helfen, unglaubliche Interaktionen zwischen Menschen und unseren Robotern zu schaffen.

Unsere derzeit bevorzugte Softwarelösung für ASR ist die Google Cloud Speech-to-Text API, ein minutenweise bezahlter Cloud-basierter Dienst, der sehr gute Genauigkeit und Mehrsprachenunterstützung bietet.

Computer vision

Können unsere Roboter sehen? Wir haben keine Alternative für das menschliche Auge geschaffen, aber Computer Vision (CV) kann unseren Robotern helfen, ein Gesicht oder andere Objekte in einem Bild zu erkennen. 

Unsere bevorzugte Software hierfür ist Visage, eine kostenpflichtige Lizenzoption, die von Visage Technologies AB in Schweden entwickelt wurde. Dies ermöglicht unseren Robotern, Gesichter in einem Bild zu lokalisieren und Alter, Geschlecht und Gesichtsausdruck zu schätzen. Sie werden jedoch keine Personen erkennen.

Wenn Sie ein bestimmtes CV-Programm verwenden möchten, können wir es auf unserem Tritium-Framework laufen lassen

Konversation

Chatbot-Lösungen gibt es zwar. Sie ziehen jedoch keine Massen an. Sie kommen einfach nicht an Interaktion mit einem echten Menschen durch einen Roboter heran. Deshalb haben wir uns für die Telepräsenz-Software TinMan entschieden, mit der unsere Roboter von Menschen bedient werden können.

Wir können eine vorinstallierte Version von Bruce Wilcoxs ChatScript zur Verfügung stellen, die MIT-lizenziert und frei verwendbar ist. Die wahre Magie liegt jedoch in unserer TinMan-Software

Sprachqualität

Eine hochgezogene Augenbraue unserer Roboter kann mehr als tausend Worte wert sein. Wenn es jedoch darum geht, wie unsere Roboter klingen, können wir Ihnen drei Optionen anbieten:

  1. Aufgenommene menschliche Stimmen, die im Allgemeinen am eindrucksvollsten sind.
  1. Computer-synthetisierte Stimmen, die Ihnen mehr Flexibilität bieten.
  1. Sowohl menschliche als auch computer-synthetisierte Stimmen, je nach Bedarf gemischt.

Benötigen Sie sonst noch etwas?

Erzählen Sie uns von Ihren Ideen zur Interaktion und wir werden uns bemühen, diese mit Leben zu erfüllen. Wenn Sie einen unserer Roboter haben und Ihre eigenen Ideen ausprobieren möchten, können Sie mit der API experimentieren

dieser Website zu