ভয়েস এবং টেক্সট অ্যাসিস্ট্যান্ট অ্যাপ স্পিচ রিকগনিশন এআই-এর মাধ্যমে যেকোনো ভাষা শিখতে পারে।
এই অ্যাপটি আপনাকে ইন্টারনেট বা LAN এর মাধ্যমে আপনার ভয়েস কমান্ড পাঠাতে দেয়। এটি যাচাইয়ের জন্য TCP এবং টোকেন ব্যবহার করে।
আপনি স্পিচ রিকগনিশন এআই-এর জন্য একটি পাঠ্য ক্যোয়ারীও লিখতে পারেন।
বৈশিষ্ট্য:
- ওয়ার্ড রাউটিং: যদি একটি বাক্যাংশ সনাক্ত করা হয়, পুরো স্বীকৃত বার্তাটি অন্য সার্ভার সকেটে ফরোয়ার্ড করে (আইপি + পোর্ট)
- শব্দ কমান্ড: যদি একটি বাক্যাংশ সনাক্ত করা হয়, অন্য একটি কমান্ড একটি সার্ভার সকেটে পাঠানো হয় (আইপি + পোর্ট)
- শব্দ প্রতিক্রিয়া: যদি একটি বাক্যাংশ সনাক্ত করা হয়, একটি সঠিক উত্তর বার্তা ক্লায়েন্টকে ফেরত পাঠানো হয় (অ্যান্ড্রয়েডের জন্য আইপি মাইক)
- ওয়েবহুক: আপনি "হোম অ্যাসিস্ট্যান্ট"-এ একটি অটোমেশন ট্রিগার করতে পারেন
- শেল কমান্ড: আপনি একই কমান্ড ব্যবহার করতে পারেন যেমন উইন্ডোজে "কমান্ড প্রম্পট" বা লিনাক্সে "কনসোল"।
- ট্রান্সফার লার্নিং: আগের অভিজ্ঞতার কারণে যদি ভোকাবুলারি পরিবর্তন করা হয় তবে নিউরাল নেটওয়ার্ক দ্রুত নিজেকে পুনরায় প্রশিক্ষিত করবে। অথবা আপনি নতুন অতিরিক্ত ডেটা সহ নিউরাল নেটওয়ার্কের প্রশিক্ষণ চালিয়ে যেতে পারেন। শেষ লুকানো স্তর পরিবর্তন, যোগ বা সরানো হলে এটি কাজ করে।
- উচ্চ কর্মক্ষমতা: নিউরাল নেটওয়ার্ক ফিড ফরোয়ার্ড (স্পিচ রিকগনিশন) এবং ব্যাকপ্রপ (প্রশিক্ষণ) এর জন্য সমান্তরাল থ্রেডে প্রতিটি স্তরে নিউরন চালায়।
এই অ্যাপটি মাইক বোতাম (আইকন) চাপলে অডিও রেকর্ড করা শুরু করে।
যখন মাইক বোতামটি প্রকাশিত হয়, তখন রেকর্ডিংটি স্পিচ রিকগনিশন এআই-তে পাঠানো হয়। অ্যাপটির মাধ্যমে সাড়া পাওয়া যাচ্ছে। এটি কথা বলতে পারে, যা একটি বিকল্প।
আপনি সার্ভারের আইপি ঠিকানা, সার্ভারের পোর্ট, টোকেন এবং পটভূমির রঙ সেট আপ করতে পারেন।
স্পিচ রিকগনিশন এআই সম্পর্কে আরও তথ্য এখানে পাওয়া যাবে:
https://github.com/viktorvano/SpeechRecognitionAI