ওপেনএআই-এর জিপিটি-৪ও-এর পিছনে যে বিস্ময়কর প্রতিভা, তিনি পুনের প্রফুল্ল ধারিওয়াল।
যে ভারতীয় বিস্ময়কর প্রতিভাকে ছাড়া ওপেনএআই-এর জিপিটি-৪ও (ও এম এন আই) সম্ভব ছিল না, তিনি হলেন পুনের প্রফুল্ল ধারিওয়াল। তিনি ওপেনএআই এবং জিপিটি-৪ও-তে ‘ওমনি’ দলের নেতৃত্ব দেন। জিপিটি-৪ ও হল ওপেনএআই এলএলএম ( LLM) প্রযুক্তি পোর্টফোলিওর ফ্ল্যাগশিপ মডেল। ‘ও’ শব্দের অর্থ ‘ওমনি’ এবং এটি কেবল এক ধরনের বিপণন অতিরঞ্জন ব্যাপার নয়। বরং পাঠ্য, দৃষ্টি এবং অডিওর জন্য মডেলের একাধিক পদ্ধতির একটি রেফারেন্স।
ওপেনএআই-এর সিইও স্যাম অল্টম্যান সাম্প্রতিক এক্স-এ (পূর্বে টুইটার) পোস্টটির আগে পুনের এই স্থানীয় বাসিন্দা সম্পর্কে বিশ্ব খুব কমই জানত।
কে এই প্রফুল্ল ধারিওয়াল ?
পদার্থবিজ্ঞান-রসায়ন-গণিত (পিসিএম) গ্রুপে ৩০০ এর মধ্যে ২৯৫ এর উল্লেখযোগ্য স্কোর দ্বারা তাঁর দ্বাদশ শ্রেণির পারফরম্যান্স উজ্জ্বল পারফরম্যান্স । মহারাষ্ট্র টেকনিক্যাল কমন এন্ট্রান্স টেস্ট (এমটি-সিইটি)-এ ১৯০ এবং জয়েন্ট এন্ট্রান্স পরীক্ষায় ৩৬০-এর মধ্যে ৩৩০ নম্বর পেয়ে তিনি প্রবেশিকা পরীক্ষায়ও জি- মেইনস (JEE-Mains). দক্ষতা অর্জন করেছিলেন।
২০১৩ সালে মহারাষ্ট্র রাজ্য মাধ্যমিক ও উচ্চ মাধ্যমিক শিক্ষা পর্ষদ কর্তৃক প্রতিষ্ঠিত বার্ষিক আবাসাহেব নারাভানে স্মারক পুরস্কারেও তাঁকে ভূষিত করা হয়। (MSBSHSE).
২০০৯ সালে তিনি ভারত সরকারের কাছ থেকে ন্যাশনাল ট্যালেন্ট সার্চ স্কলারশিপ লাভ করেন। একই বছর, তিনি চীনে আন্তর্জাতিক জ্যোতির্বিজ্ঞান অলিম্পিয়াডে স্বর্ণপদকও জিতেছিলেন। ২০১২ এবং ২০১৩ সালে, তিনি যথাক্রমে আন্তর্জাতিক গাণিতিক অলিম্পিয়াড এবং আন্তর্জাতিক পদার্থবিজ্ঞান অলিম্পিয়াডে স্বর্ণ পদক জিতেছিলেন।
ম্যাসাচুসেটস ইনস্টিটিউট অফ টেকনোলজিতে (এমআইটি) ২০১৭ সালে ৫.০/৫.০ এর নিখুঁত জিপিএ সহ স্নাতক ডিগ্রি অর্জন করেছেন।
ডি ই (D.E)-তে কোয়ান্টিটেটিভ অ্যানালিস্ট ইন্টার্ন পিন্টারেস্ট (Pinterest)-এ সফটওয়্যার ইঞ্জিনিয়ারিং ইন্টার্ন হিসাবে প্রফুল্ল ধারিওয়ালের সংক্ষিপ্ত কর্মজীবন ছিল। শ গ্রুপ, এবং এম. আই. টি-র সেন্টার ফর ব্রেইন, মাইন্ড অ্যান্ড মেশিনস এবং কম্পিউটার ভিশনস গ্রুপ উভয়ের স্নাতক গবেষক হিসাবেও কিছুদিন কাজ করেছেন।
ধারিওয়াল ২০১৬ সালের মে মাসে ওপেনএআই-এ একজন গবেষণা ইন্টার্ন হিসাবে যোগদান করেন এবং উৎপাদক মডেল এবং তত্ত্বাবধানহীন শিক্ষার উপর কাজ করে সংস্থায় গবেষণা বিজ্ঞানী হিসাবে বেড়ে ওঠেন। তিনি জিপিটি-৩, টেক্সট-টু-ইমেজ প্ল্যাটফর্ম ড্যাল-ই ২, মিউজিক জেনারেটর জুকবক্স এবং রিভারসিবল জেনারেটিভ মডেল গ্লো-এর অন্যতম সহ-স্রষ্টা।
জিপিটি-৪ও যা করতে পারে সে গুলি নিম্নলিখিত অন্তর্ভুক্ত রয়েছেঃ
জিপিটি-৪ও ‘ওমনি’ মানে “জেনারেটিভ প্রি-ট্রেইন্ড ট্রান্সফরমার ৪ ওমনি”। এটি একটি শক্তিশালী এআই মডেল যা একটি বড় পাঠ্য, অডিও এবং চিত্র ডেটাসেটের উপর প্রশিক্ষিত। এটি জিপিটি-৪ও ওমনিকে কেবল মানুষের ভাষা বুঝতে এবং তৈরি করতে দেয় না। কথ্য শব্দ এবং চাক্ষুষ বিন্যাসে উপস্থাপিত তথ্যের প্রক্রিয়া এবং প্রতিক্রিয়াও বর্ণিত করে।
- জিপিটি-৪ও পাঠ্য প্রজন্মের ব্যবহারের ক্ষেত্রে যেমন সংক্ষিপ্তকরণ এবং জ্ঞান-ভিত্তিক প্রশ্ন ও উত্তরের ক্ষেত্রে ব্যবহার করা যেতে পারে। মডেলটি যুক্তি করতে, জটিল গণিত সমস্যা সমাধান করতে এবং কোডিং করতেও সক্ষম।
- জিপিটি-৪ও মডেল একটি নতুন দ্রুত অডিও ইনপুট প্রতিক্রিয়া প্রবর্তন করে যা-ওপেনএআই-এর মতে-৩২০ মিলিসেকেন্ডের গড় প্রতিক্রিয়া সময় সহ মানুষের অনুরূপ। মডেলটি একটি এআই-জেনারেটেড ভয়েস দিয়েও সাড়া দিতে পারে যা মানুষের মতো শোনাচ্ছে।
- রিয়েল-টাইম ইন্টারঅ্যাকশন। জিপিটি-৪ও মডেলটি কোনও বাস্তব লক্ষণীয় বিলম্ব ছাড়াই রিয়েল-টাইম মৌখিক কথোপকথনে জড়িত হতে পারে।
- জ্ঞান-ভিত্তিক প্রশ্নোত্তরঃ পূর্ববর্তী সমস্ত জিপিটি-৪ মডেলের ক্ষেত্রে যেমন হয়েছিল, জিপিটি-৪ও একটি জ্ঞানের ভিত্তিতে প্রশিক্ষিত হয়েছে এবং প্রশ্নের উত্তর দিতে সক্ষম।
- ভাষা এবং অডিও প্রসেসিংঃ জিপিটি-৪ও-এর ৫০টিরও বেশি বিভিন্ন ভাষা পরিচালনা করার উন্নত ক্ষমতা রয়েছে।
- কণ্ঠস্বরের সূক্ষ্মতাঃ জিপিটি-৪ও সংবেদনশীল সূক্ষ্মতার সাথে ভাষণ তৈরি করতে পারে।
- অডিও বিষয়বস্তু বিশ্লেষণঃ মডেলটি কথ্য ভাষা তৈরি এবং বুঝতে পারে, যা ভয়েস-অ্যাক্টিভেটেড সিস্টেম, অডিও কন্টেন্ট বিশ্লেষণ এবং ইন্টারেক্টিভ গল্প বলার ক্ষেত্রে প্রয়োগ করা যেতে পারে।
- ছবি এবং ভিডিও বিশ্লেষণঃ ব্যবহারকারীদের ভিজ্যুয়াল কন্টেন্ট আপলোড করার অনুমতি দেয় যা জিপিটি-৪ও বুঝতে পারবে, ব্যাখ্যা করতে এবং বিশ্লেষণ প্রদান করতে সক্ষম হবে।
- তথ্য বিশ্লেষণঃ ব্যবহারকারীদের ডেটা চার্টে থাকা ডেটা বিশ্লেষণ করতে সক্ষম করতে পারে। জিপিটি-৪ও বিশ্লেষণ বা প্রম্পট-এর উপর ভিত্তি করে ডেটা চার্ট তৈরি করতে পারে।
Comments (0)