क्या हमने AI को क्रैक किया है?

हम रोबोट करते हैं। वास्तविक जीवन के ऐसे मानवीय पात्र जो आश्चर्यचकित कर देते हैं और पहले से ऐसा न सोचने वाली भीड़ के माध्यम से प्रसन्नता का कारण बनते हैं। 

आप सोच सकते हैं कि हमने आर्टिफिशियल इंटेलिजेंस (कृत्रिम बुद्धिमत्ता) पैदा की है। फिर भी रोबोट AI नहीं हैं और AI केवल रोबोट के बारे में नहीं होती है।

AI आमतौर पर सिर्फ कंप्यूटर कोड होता है, जो हमारे सजीव पात्रों की तरह नाटकीय नहीं होता है। लेकिन इसका प्रयोग वाक् पहचान और चेहरे/वस्तु की पहचान के लिए किया जाता है, जिनके लिए हमारे रोबोटों को प्रोग्राम किया जा सकता है।

शुद्ध AI – Her, Bladerunner और 2001 जैसी फिल्मों में दर्शाया गया प्रकार: A Space Odyssey – दुख की बात है कि अभी तक अस्तित्व में नहीं है।

लेकिन आपके रोबोट इतना वास्तविक महसूस कराते हैं?

यदि आपने हमारे किसी रोबोट से बात की है तो हो सकता है कि आपने शानदार बातचीत का आनंद लिया हो। लेकिन आप वास्तव में शायद हमारे नवीन टेलीप्रेज़ेंस सॉफ़्टवेयर, TinMan<TinMan> के माध्यम से किसी इंसान से बात कर रहे थे। मानवीय बुद्धिमत्ता अभी भी कृत्रिम बुद्धिमत्ता को हर बार हरा देगी। 

हमारे सारे रोबोट एक ही Tritium सॉफ्टवेयर फ्रेमवर्क पर चलते हैं<Tritium>, जिसे हम नए कार्यक्रमों के साथ अनुकूलित कर सकते हैं ताकि हर रोबोट-मानव वार्तालाप अनूठा महसूस हो। 

 बातचीत को पहचानना

क्या हमारे रोबोट सुन सकते हैं? तो, हम अपने रोबोट में ऑटोमेटिड स्पीच रेकिग्नेशन (ASR) शामिल कर सकते हैं, जो ध्वनि को पाठ की श्रृंखला में परिवर्तित करता है। व्यंग्य, स्वर या संदर्भ की व्याख्या करना संभव नहीं है, लेकिन फिर भी ASR लोगों और हमारे रोबोट के बीच अविश्वसनीय बातचीत सृजित करने में मदद कर सकता है।

ASR के लिए हमारा वर्तमान पसंदीदा सॉफ्टवेयर समाधान Google क्लाउड स्पीच-टू-टेक्स्ट APIहै, जो मिनट-दर-मिनट क्लाउड आधारित सेवा है जिसमें बेहद शानदार सटीकता और बहु ​​भाषा सहयोग है। 

 कंप्यूटर विजन

क्या हमारे रोबोट देख सकते हैं? हमने मानव आंख के लिए कोई विकल्प नहीं बनाया है, लेकिन कंप्यूटर विज़न (CV) हमारे रोबोट को किसी छवि में किसी चेहरे या अन्य वस्तुओं को पहचानने में मदद कर सकती है। 

इसके लिए हमारा पसंदीदा सॉफ्टवेयर है Visage जो कि स्वीडन में Visage Technologies AB द्वारा विकसित एक पे-फॉर लाइसेंसशुदा विकल्प है। यह हमारे रोबोटों को किसी एक तस्वीर में चेहरों का पता लगाने और उम्र, लिंग और चेहरे के भावों का अनुमान लगाने में सक्षम बनाता है, लेकिन वे व्यक्तियों को नहीं पहचान पाएंगे।

यदि आपके पास एक विशेष CV प्रोग्राम है जिसका आप उपयोग करना चाहते हैं तो हम इसे अपने Tritium फ्रेमवर्क पर चला सकते हैं।

वार्तालाप

Chatbot समाधान मौजूद हैं लेकिन वे भीड़ को नहीं खींचते। वे रोबोट के माध्यम से वास्तविक मनुष्य से बातचीत करने के करीब नहीं आते। यही कारण है कि हम टेलीप्रेजेंस सॉफ्टवेयर, TinMan का इस्तेमाल करना पसंद करते हैं, जो मानव संचालित होने के लिए हमारे रोबोटों को सक्षम बनाता है।

हम Bruce Wilcox’s ChatScript का एक पूर्व-स्थापित संस्करण प्रदान कर सकते हैं जो MIT लाइसेंस प्राप्त है और इस्तेमाल के लिए नि:शुल्क है। लेकिन हमारा TinMan सॉफ्टवेयर ही वह सॉफ्टवेयर जो वास्तविक जादू करता है। 

ध्वनि की गुणवत्ता

हमारे रोबोट की उभरी हुई भौं एक हजार शब्दों के बराबर हो सकती है। लेकिन जब हमारे रोबोट की आवाज की बात आती है, तो हम आपको तीन विकल्प दे सकते हैं:

  1. रिकॉर्ड की गई मानवीय आवाजें जो आम तौर पर सबसे ज्यादा प्रभावशाली होती हैं
  1. कंप्यूटर समन्वित आवाजें (synthesised voices) जो आपको अधिक लचीलापन देती हैं।
  1. मानव और कंप्यूटरदोनों ने आवाजों को समन्वित किया, आवश्यकता के अनुसार मिश्रित किया गया

किसी अन्य चीज़ की तलाश में हैं?

बातचीत संबंधी अपने विचारों के बारे में हमें बताएं और हम उन्हें साकार करने की कोशिश करेंगे। या यदि आपके पास हमारा कोई रोबोट है और आप अपने विचारों को आजमाना चाहते हैं तो API आपके प्रयोग करने के लिए खुला है।