दोस्तों आप लोग Google Assistance, Microsoft Cortana, Apple Siri के बारे में जरुर सुना होगा, लेकिन क्या आप जानते है की यह सभी टेक्नोलॉजी speech recognition system और Voice recognition system पर काम करता है. अब आप यह सोचते होंगे की यह Voice/ speech recognition system होता क्या है और यह कैसे काम करता है.आज हम आप लोगो को इसी के बारे में बताने वाले है, कि यह टेक्नोलॉजी काम कैसे करती है और इसका इतिहास क्या है.
Voice / Speech Recognition System Kya Hai?
यह एक कंप्यूटर सॉफ्टवेर और हार्डवेयर का मिक्स रूप है जिसमे मानव के आवाज़ को समझाने और उसके हिसाब से उसका जवाब देने की काबिलियत होती है.
इस टेक्नोलॉजी का इस्तेमाल करने पर आपको अपने मोबाइल या कंप्यूटर को ऑपरेट करने के लिए किसी भी माउस या कीबोर्ड की जरुरत नहीं पड़ती है. आप केवल अपने आवाज़ के द्वारा की मोबाइल या कंप्यूटर को कमांड दे सकते है. यदि आपको कोई अप्प को ओपन करना हो तो आप उसे voice कमांड के जरिये ओपन भी कर सकते है जैसे यदि आप को फेसबुक को ओपन करना हो तो आप उसे open facebook कहेंगे तो वह फेसबुक अप्प को ओपन कर देगा.
1962 में shoebox नाम के कंपनी ने इसे redevelop किया, और अब यह इंग्लिश के कुछ शब्दों को भी समझाने लगा. कम्पनी ने पुन: इसे विकसित किया जिससे यह इंग्लिश के 9 consonant और Vowel को समझने की काबिलियत आ गई.
1971 में U. S Defense department ने जब यह देखा तो उसने Speech Recognition Technology पर अपना एक रिसर्च प्रोग्राम शुरू किया. Carnegie Mellon ने Harpy नाम के एक सॉफ्टवेर को डेवेलोप किया जो 1011 वर्ड को बहुत ही आसानी से समझ सकता था. उन्होंने एक ऐसा सिस्टम भी खोजा जो लॉजिकल sentence को बड़ी ही आसानी से समझ सकता था. लेकिन इनकी सबसे बडी खामी यह थी की यह सभी एक speech pattern पर करते थे.
1980 के दशक में markov model नाम का एक Speech Recognition System बने गया, जो साउंड को समझाने के लिए डिजिटल डाटा का उपयोग करता था. और 1987 में इसी टेक्नोलॉजी की मदद से Julie नामक doll बनाया गया, जो बच्चो से बात भी करती थी, लेकिन इसमे यह खामी थी की एक शब्द को बोलने के बाद कुछ ब्रेक लेना पडता था.
1990 के दशक में dragon नाम की एक कंपनी ने Dragon Dictate नाम का एक सॉफ्टवेयर बनाया, यह दुनिया का पहला Voice / Speech Recognition Software था जिसे आम आदमी भी इस्तेमाल कर सकता था. 1997 में कम्पनी ने इसमे और भी सुधार किये और इसका नाम Dragon Naturally Speaking रखा यह 100 शब्दों को समझ सकता था.
2000 के दशक में गूगल ने iPhone के लिए Google Voice Search Application बनाया जो मानव के द्वारा बोली गई बातो का जवाब डाटा सेन्टरमें स्टोर डाटा से मैच करके देता था. 2010 में google ने एंड्राइड के लिए Personalized Recognition application बनाया, और इसके जरिये voice queries को रिकॉर्ड करना शुरू कर दिया.और उसने लगभग 230 बिलियन वर्ड का एक डेटाबेस तैयार कर कर लिया है. और Google Assistant नाम से अपने सॉफ्टवेर को लांच भी कर चूका है.जिसे आप लोग अपने android mobile में इस्तेमाल भी करते होंगे.
google को देख कर Apple में भी बिना देरी किये पर्सनल assistant को डेवेलोप किया जिसका नाम siri है. इन दोनों कम्पनी की कामयाबी को देखते हुए microsoft ने भी एक सॉफ्टवेर डेवेलोप किया जिसका नाम cortana है.
ADC ट्रांसलेटर कंप्यूटर या मोबाइल में आये हुए एनालॉग सिग्नल को छोटे छोटे सैंपल में विभाजित कर देता है. और उन्हें डिजिटल फॉर्मेट में कन्वर्ट कर देता है. उसके बाद उन साउंड से नॉइज़ को फ़िल्टर करके उस नॉइज़ को रिमूव करता है.इसके बाद उन साउंड को नार्मल करके कांस्टेंट लेवल तक ले जाता है. क्योकि हर ब्यक्ति के बोलने का तरीका अलग अलग होता है.
इसके बाद इन साउंड को छोटे छोटे हिस्से जैसे सेकंड के हजारवें हिस्से में बिभाजित किया जाता है. और अंत में इन छोटे छोटे हिस्सों को सिस्टम में स्टोर डिजिटल सिग्नल के साथ मैच किया जाता है. जैसे की यदि आप ने बोला GO, तो यह सिस्टम इसे सारे प्रोसेस करने के बाद मेमोरी में स्टोर डाटा से मैच कराएगी की तो G सिग्नल G के साथ मैच होगा, और O सिग्नल O के साथ मैच होगा. और हमारा कंप्यूटर तुरंत हमें इसका आउटपुट GO दिखा देता है.
Tags
Computer
kyahai
Mobile
इस टेक्नोलॉजी का इस्तेमाल करने पर आपको अपने मोबाइल या कंप्यूटर को ऑपरेट करने के लिए किसी भी माउस या कीबोर्ड की जरुरत नहीं पड़ती है. आप केवल अपने आवाज़ के द्वारा की मोबाइल या कंप्यूटर को कमांड दे सकते है. यदि आपको कोई अप्प को ओपन करना हो तो आप उसे voice कमांड के जरिये ओपन भी कर सकते है जैसे यदि आप को फेसबुक को ओपन करना हो तो आप उसे open facebook कहेंगे तो वह फेसबुक अप्प को ओपन कर देगा.
History Of Voice Recognition Technology In Hindi
1952 में bell laboratory में audery नाम के एक वैज्ञानिक ने voice/ speech recognition सिस्टम को बनाया लेकिन यह सिर्फ अंको पर ही काम करता था.1962 में shoebox नाम के कंपनी ने इसे redevelop किया, और अब यह इंग्लिश के कुछ शब्दों को भी समझाने लगा. कम्पनी ने पुन: इसे विकसित किया जिससे यह इंग्लिश के 9 consonant और Vowel को समझने की काबिलियत आ गई.
1971 में U. S Defense department ने जब यह देखा तो उसने Speech Recognition Technology पर अपना एक रिसर्च प्रोग्राम शुरू किया. Carnegie Mellon ने Harpy नाम के एक सॉफ्टवेर को डेवेलोप किया जो 1011 वर्ड को बहुत ही आसानी से समझ सकता था. उन्होंने एक ऐसा सिस्टम भी खोजा जो लॉजिकल sentence को बड़ी ही आसानी से समझ सकता था. लेकिन इनकी सबसे बडी खामी यह थी की यह सभी एक speech pattern पर करते थे.
1980 के दशक में markov model नाम का एक Speech Recognition System बने गया, जो साउंड को समझाने के लिए डिजिटल डाटा का उपयोग करता था. और 1987 में इसी टेक्नोलॉजी की मदद से Julie नामक doll बनाया गया, जो बच्चो से बात भी करती थी, लेकिन इसमे यह खामी थी की एक शब्द को बोलने के बाद कुछ ब्रेक लेना पडता था.
1990 के दशक में dragon नाम की एक कंपनी ने Dragon Dictate नाम का एक सॉफ्टवेयर बनाया, यह दुनिया का पहला Voice / Speech Recognition Software था जिसे आम आदमी भी इस्तेमाल कर सकता था. 1997 में कम्पनी ने इसमे और भी सुधार किये और इसका नाम Dragon Naturally Speaking रखा यह 100 शब्दों को समझ सकता था.
2000 के दशक में गूगल ने iPhone के लिए Google Voice Search Application बनाया जो मानव के द्वारा बोली गई बातो का जवाब डाटा सेन्टरमें स्टोर डाटा से मैच करके देता था. 2010 में google ने एंड्राइड के लिए Personalized Recognition application बनाया, और इसके जरिये voice queries को रिकॉर्ड करना शुरू कर दिया.और उसने लगभग 230 बिलियन वर्ड का एक डेटाबेस तैयार कर कर लिया है. और Google Assistant नाम से अपने सॉफ्टवेर को लांच भी कर चूका है.जिसे आप लोग अपने android mobile में इस्तेमाल भी करते होंगे.
google को देख कर Apple में भी बिना देरी किये पर्सनल assistant को डेवेलोप किया जिसका नाम siri है. इन दोनों कम्पनी की कामयाबी को देखते हुए microsoft ने भी एक सॉफ्टवेर डेवेलोप किया जिसका नाम cortana है.
Voice / Speech Recognition System Kaam Kaise Karta Hai?
आप सब लोग तो यह जानते ही होंगे की जब हम लोग कुछ बोलते है तो एक वेव उत्पन्न होता है. मोबाइल या कंप्यूटर उन वेव्स को ADC ट्रांसलेटर के द्वारा डिजिटल सिग्नल में कन्वर्ट कर देता है.ADC ट्रांसलेटर कंप्यूटर या मोबाइल में आये हुए एनालॉग सिग्नल को छोटे छोटे सैंपल में विभाजित कर देता है. और उन्हें डिजिटल फॉर्मेट में कन्वर्ट कर देता है. उसके बाद उन साउंड से नॉइज़ को फ़िल्टर करके उस नॉइज़ को रिमूव करता है.इसके बाद उन साउंड को नार्मल करके कांस्टेंट लेवल तक ले जाता है. क्योकि हर ब्यक्ति के बोलने का तरीका अलग अलग होता है.
इसके बाद इन साउंड को छोटे छोटे हिस्से जैसे सेकंड के हजारवें हिस्से में बिभाजित किया जाता है. और अंत में इन छोटे छोटे हिस्सों को सिस्टम में स्टोर डिजिटल सिग्नल के साथ मैच किया जाता है. जैसे की यदि आप ने बोला GO, तो यह सिस्टम इसे सारे प्रोसेस करने के बाद मेमोरी में स्टोर डाटा से मैच कराएगी की तो G सिग्नल G के साथ मैच होगा, और O सिग्नल O के साथ मैच होगा. और हमारा कंप्यूटर तुरंत हमें इसका आउटपुट GO दिखा देता है.
Conclusion
अब अप यह जान गए होंगे की Voice/ Speech Recognition System kya hota hai? yah kaise kaam karta hai? aur iska itihas kya hai? मुझे उम्मीद है की मेरा यह पोस्ट आप लोगोको जरुर पसंद आया होगा. यह पोस्ट कैसा लगा हमें कमेन्ट बॉक्स के जरिये जरुर बताये.Subscribe Our Newsletter