কোভিড-১৯ পরিস্থিতির কারণে এখন শিক্ষা কিংবা কর্মক্ষেত্রে যোগাযোগের মাধ্যম হয়ে উঠেছে ভিডিও কনফারেন্স। কিন্তু যাঁরা কথা বলতে পারেন না? তাঁরা কীভাবে মানিয়ে নিচ্ছেন এই পরিস্থিতিকে? অঙ্গভঙ্গির মাধ্যমে ‘সাইন ল্যাঙ্গুয়েজ’-এ কথা বললেও, ভিডিও কলে বক্তাদের ভিড়ে অনেক সময়ই উপেক্ষিত থেকে যাচ্ছেন তাঁরা। তবে এই সমস্যারই সমাধান খুঁজে বার করল গুগল। গুগলের কৃত্রিম বুদ্ধিমত্তাই এবার শনাক্ত করবে সাইন ল্যাঙ্গুয়েজ ব্যবহারকারীদের।
ভিডিও কল চলাকালীন কোনো ব্যক্তি অঙ্গভঙ্গির মাধ্যমে যোগাযোগ করতে চাইলে গুগল তাঁকে চিহ্নিত করবে অ্যাক্টিভ ইউজার হিসাবে। স্ক্রিনে ভেসে উঠবে সেই চিহ্ন। ফলে বাকিরা সহজেই বুঝতে পারবেন, কথা বলতে চাইছেন সেই ব্যক্তি। গুগল মিট কিংবা ডুও ছাড়াও যে কোনো ভিডিও কনফারেন্সিং অ্যাপ্লিকেশনের সঙ্গেই প্লাগ-ইন হিসাবে যুক্ত করা যেতে পারে এই প্রযুক্তি।
অঙ্গভঙ্গি অনুমান করার জন্য প্রথমে পসনেট নামে একটি মডেলের ওপর ভিত্তি করেই পরীক্ষা চালায় গুগল। এই মডেল ভিডিওকে ভেঙে নেয় ছোটো ছোটো ফ্রেমের স্থিরচিত্রে। তারপর ব্যবহারকারীর চোখ, নাক, মুখ, হাতের অবস্থানকে বিশ্লেষণ করে ফ্রেম ধরে। নির্বাচন করে ওই ব্যক্তি সত্যিই কোনো ভাব প্রকাশ করতে চাইছেন কিনা, সে ব্যাপারে।
কিন্তু কীভাবে কাজ করে এই প্রযুক্তি? ২০ কিলো হার্জের বেশি কম্পাঙ্কের শব্দতরঙ্গের ব্যবহারে বক্তা নির্ধারণ করছে গুগল। ভিডিও কল চলাকালীন অবিরাম এই তরঙ্গের শব্দ নির্গত হবে ডিভাইস থেকে। বক্তা অঙ্গভঙ্গি করলে সেই শব্দ প্রতিফলিত হয়েই নির্ধারণ করবে তাঁকে। তবে আল্ট্রাসোনিক হওয়ায় অন্যদের বক্তব্যের ক্ষেত্রে কোনো প্রভাব ফেলবে না এই শব্দতরঙ্গ।
গুগলের এই প্রযুক্তি ৮০ শতাংশ ক্ষেত্রেই সফল হয়েছে এখনও অবধি। কিছুদিনের মধ্যেই এই সফলতার হার পৌঁছবে ৯১ শতাংশে। এমনই ইঙ্গিত দিয়েছেন গুগলের গবেষকরা। বর্তমানে গবেষণার স্তরে থাকলেও খুব শীঘ্রই যে এই প্রযুক্তির সংযোজন হতে চলেছে ভিডিও কনফারেন্স অ্যাপগুলিতে, তা বলাই বাহুল্য...
Powered by Froala Editor
আরও পড়ুন
গুগলের ডুডলে ভারতীয় নৃত্যশিল্পীর মুখ, অভিনয়েও জিতেছেন অজস্র মানুষের মন