02-08-2026 22:18:40 pm

বিজ্ঞান - Bigyan

বাংলা ভাষায় বিজ্ঞান জনপ্রিয়করণের এক বৈদ্যুতিন মাধ্যম
An online Bengali Popular Science magazine

https://bigyan.org.in

AI গবেষণা বনাম AI ব্যবহার

ডঃ আবির দাস

(IIT (KGP))

শৌর্য সেনগুপ্ত

(UIUC)

কৌশিক মিত্র

(Google)

03 Jun 2026

Link: https://bigyan.org.in/ai-researcher-ai-user

ai-%e0%a6%97%e0%a6%ac%e0%a7%87%e0%a6%b7%e0%a6%a3%e0%a6%be-%e0%a6%ac%e0%a6%a8%e0%a6%be%e0%a6%ae-ai-%e0%a6%ac%e0%a7%8d%e0%a6%af%e0%a6%ac%e0%a6%b9%e0%a6%be%e0%a6%b0

এক AI গবেষকের দৈনন্দিন কাজটা কিরকম? এর উত্তর কয়েক বছর আগে একরকম ছিল, AI-এর অভাবনীয় উন্নতির ফলে এখন সেটা পাল্টে গেছে। এক AI গবেষকের সাথে আড্ডায় তার কিছুটা আভাস পাওয়া গেল। তিন অংশে প্রকাশিত এই আলোচনার তৃতীয় অংশে আমরা জিজ্ঞেস করছি AI নিয়ে গবেষণা করা মানে কী, বা কী ধরনের গবেষণাপ্রশ্ন এখনো অমীমাংসিত রয়েছে। সেই গবেষণার ফলে সমাজে কী প্রভাব আসতে পারে, সেই প্রশ্নটাও জিজ্ঞেস করছি আমরা।

কৌশিক (বিজ্ঞান): আপনি যে ধরনের নিউরাল নেটওয়ার্ক নিয়ে কাজ করেন তাতে সাধারণত কতগুলো প্যারামিটার থাকে?

(একটা মডেলকে ট্রেন করা বা প্রশিক্ষণ দেওয়ার সময় প্যারামিটার বাড়িয়ে কমিয়ে মডেলটাকে ঠিক দিকে পরিচালিত করা হয়। অনেক প্যারামিটার থাকলে তাকে ঠিক দিকে পরিচালিত করার অনেকগুলো উপায় আছে।)

আর একটা মডেলকে ট্রেন করতে আসলে কী করতে হয়? কম্পিউটারে কোনো একটা কমান্ড (command) দিয়ে দেন এবং 10 দিন পর কম্পিউটার ট্রেন হয়ে আউটপুট দেয়, এরকম কিছু?

আবির: অতটা বড় আকারে মডেল ট্রেন করা আমাদের পক্ষে সম্ভব নয়। বাণিজ্যিকভাবে ব্যবহারে হয়তো এতটা সময় দেওয়া যায়। ওরা জিপিইউ-এর মাধ্যমে প্যারালাল কম্পিউটেশন (parallel computation) করতে পারে। আমাদের গবেষণার কাজে আমাদের যেটা করতে দু-দিন বা সাতদিন লাগে, ওরা সেটা একদিনে করে ফেলে।

যখন ডীপ লার্নিং প্রথম শুরু হয়, যে মডেলটা এর জন্ম দেয়, AlexNet, তাতে প্রায় ছ-কোটি প্যারামিটার নিয়ে কাজ করা হতো। ছ-কোটি একটা বিশাল বড় সংখ্যা! তারপরই খুব বিখ্যাত হয় ভি.জি.জি (VGG বা Visual Geometry Group), তাতে 13.8 কোটি প্যারামিটার ছিল। আর এই সময় থেকে কিন্তু সংখ্যাটা কমানোর চেষ্টাও শুরু হয়। কারণ বেশি প্যারামিটার ব্যবহার করলে প্রচুর মেমরি এবং কম্পিউটেশন ক্ষমতার দরকার হয়, সেসবের খরচ আছে। তারপর GoogleNet বলে একটা নতুন নেটওয়ার্ক আসে, যার আটষট্টি লক্ষ প্যারামিটার ছিল।

2012-15 দিকের ঘটনা এসব। এখন যদিও অনেক বেশি প্যারামিটার এসে গেছে। ধরো, একশো কোটির ঘরে প্যারামিটার সংখ্যা সেসবের। ট্রান্সফরমার (transformer) বা নতুন যেসব এসেছে, সেগুলোর কথা বলছি।

অতএব, এগুলোকে ট্রেন করতে ঘণ্টা নয়, দিনের ঘরে হিসেব রাখতে হয়।

নিউরাল নেটওয়ার্ক-এর একেকটা নোড-এ, অর্থাৎ উপরের গোল্লাগুলোতে, ওজন আর পক্ষপাত (weight and bias) বাড়িয়ে কমিয়ে নেটওয়ার্ক-টাকে প্রশিক্ষণ দেওয়া হয়। সব নোড-এর ওজন আর পক্ষপাত মিলিয়ে প্যারামিটার সংখ্যা।

আপনার দৈনিক গবেষণাপদ্ধতিটা তাহলে কেমন? আপনি কি কোনো নেটওয়ার্ক প্রশিক্ষণ শুরু করে অপেক্ষা করতে থাকেন?

হ্যাঁ অনেকটা ঐরকম। কিরকম প্রশিক্ষণ হচ্ছে, তার উপর নজর রাখতে হয়।

নিউরাল নেটওয়ার্ক বানানোর ব্যাপারটা নিয়ে একটু বলি। শুরুর দিকে অনেকে মজা করে একটা কথা বলতো। 2012-এর আগে লোকে নাকি শুধুমাত্র “ফিচার ইঞ্জিনিয়ারিং” (feature engineering) করতো। একটু সহজ করে উদাহরণ দিতে হলে বলা যায়, ধরো একটা বিড়ালকে চিনতে চাই। সেটার ফিচার (feature) বা বৈশিষ্ট্যগুলো কী, সেটা হয়তো কোনো একটা গ্র্যাজুয়েট স্টুডেন্ট চিহ্নিত করলো। তারপর চিহ্নিত করা ডেটা মেশিনকে দেওয়া হলো। পুরনো মেশিন লার্নিং পদ্ধতিতে এই ধরনের ফিচার বলে দেওয়াটা অত্যন্ত জরুরি ছিল।

ডীপ লার্নিং আসার পর এই ফিচারগুলো সে নিজেই শিখে নেয়। সনাতন মেশিন লার্নিং মডেলগুলো ফিচার-এর উপর কাজ করতো, আর একটা গবেষক বা তার ছাত্রকে বসে বসে বার করতে হতো কোন ফিচারগুলো বলে দিলে কাজের হবে। তারপর মেশিন কিছু প্রচলিত পদ্ধতি (যেমন SVM বা random forest) ব্যবহার করতো সেই ফিচারগুলোর উপর। কিন্তু ডীপ লার্নিং সরাসরি ছবি বা ভিডিওর ওপরেই কাজ করে এবং ফিচারগুলো নিজেই খুঁজে নেয়।

এই নিয়ে অনেকে মজা করে বলে, আগে ছিল “ফিচার ইঞ্জিনিয়ারিং”, এখন হয়েছে “নেটওয়ার্ক ইঞ্জিনিয়ারিং”। কারণ এখন সমস্যা হলো নেটওয়ার্কের আকার এবং গঠন ঠিক করা। যেমন তাতে কতগুলো স্তর (layer) থাকবে বা তার প্যারামিটার কত হবে, এগুলো ঠিক করা।

এই “নেটওয়ার্ক ইঞ্জিনিয়ারিং”-এর একটা উদাহরণ দিই। একটা কনভলুশনাল নিউরাল নেটওয়ার্ক (convolutional neural network) নেওয়া যাক। এখানে “ফিল্টার” (filter) বলে একটা ব্যাপার হয় যেটা ইনপুট-এর একাংশের উপর কিছু গণনা করে ফিচার বার করার চেষ্টা করে। সেই ফিল্টার কত বড় হবে, নেটওয়ার্কে কতগুলো স্তর থাকবে, এক একটা স্তরে কতগুলো করে ফিল্টার থাকবে — এই ব্যাপারগুলো পাল্টে পাল্টে একটা নেটওয়ার্ক কতটা কাজ করছে, সেটা অনেকটা পরিবর্তন করা যায়। এই কাজটাকেই “নেটওয়ার্ক ইঞ্জিনিয়ারিং” বলে।

এই কাজটা কিন্তু অনেকে করে দিয়েছে। বহু পরীক্ষিত কিছু মডেল বাজারে আছে। এখন আমি যদি বলি, আমি নিউরাল নেটওয়ার্ক বানাই, তাহলে সেটা ভুল বলা হবে। আমি ওই বহু পরীক্ষিত মডেলগুলোর কোনো একটা নিই এবং আমার কাজে ব্যবহার করি। যেটা বললাম প্রি-ট্রেনিং (pretraining), সেরকম প্রি-ট্রেন করা মডেল রয়েছে যেটাকে লোকে বিশাল ডেটাসেট-এর (dataset) উপর প্রশিক্ষণ দিয়ে রেখেছে, অর্থাৎ তার মধ্যে কিছুটা শিক্ষা ঢোকানো আছে। আমি সেটাকে আমার কাজে লাগাই।

এবার আমরা একটু গবেষণা সমস্যার দিকে আসি। এই শাখাগুলোতে এখনো অমীমাংসিত সমস্যা কী কী? ধরো যেগুলোতে তোমার মনে হচ্ছে প্রচুর কাজ হচ্ছে কিন্তু আমরা এখনো সমাধান খুঁজে পাইনি।

প্রথমেই আমার যেটা মনে আসে, সেটা হলো সাধারণীকরণ সমস্যা (generalization problem)।

ধরো আমাদের কাছে দশ লক্ষ ছবি আছে, কিন্তু সেটা দিয়ে আমরা কয়েকশো কোটি কম্পিউটেশনাল ইউনিট সমৃদ্ধ একটা নেটওয়ার্ক-কে প্রশিক্ষণ দিচ্ছি। এতে যাকে বলে “ওভারফিটিং” (overfitting), সেইটা হয়। খুব সহজ করে বললে, ধরো ছবিতে একেক ধরনের কুকুর বা বিড়াল আছে, সেটা চিনলে কিছু নির্দিষ্ট সংখ্যক নিউরোন-ই উত্তেজিত হচ্ছে। যেন সেই নিউরোন-সমূহ এক এক ধরনের কুকুর বা বেড়াল মনে রাখার দায়িত্ব নিয়ে নিয়েছে।

এটাতে সমস্যা হলো, একেবারে একই ধরনের ইনপুট না পেলে, নিউরাল নেটওয়ার্কটা বিভ্রান্ত হয়ে যায়। ধরো একটা নেটওয়ার্ক-কে কালো লেজ-ওয়ালা সাদা বিড়াল আর সাদা লেজ-ওয়ালা কালো কুকুর প্রশিক্ষণের সময় দেখানো হয়েছে। তাকে যদি পরে সাদা লেজ-ওয়ালা কালো বেড়াল দেখানো হয়, সে হয়তো সেটাকে কুকুর ভেবে বসতে পারে। গায়ের রং কি ল্যাজের রং যে বেড়াল আর কুকুরকে আলাদা করার জন্য যথেষ্ট নয়, সেটা এই “ওভারফিটিং”-এর ফলে সে নাও বুঝতে পারে। সে সবটাই মুখস্থ করে রেখেছে।

এটাই সাধারণীকরণ সমস্যা। এই সমস্যাটা দেখা যায় এইভাবে: একটা সিস্টেম হয়তো কোনো একটা ক্ষেত্রে (domain) ভালো কাজ করছে। ক্ষেত্রটা পাল্টে দিলেই আর সেটা কাজ করে না।

একটা উদাহরণ দিই। আজকাল স্বয়ংক্রিয় (automated) গাড়ি চালানোর সিস্টেম তৈরি করা হচ্ছে। এই ধরনের সিস্টেম বানাতে গেলে অবশ্যই সেটাকে আগে বিভিন্ন অবস্থার ব্যাপারে প্রশিক্ষণ দিতে হবে। প্রশিক্ষণ দেওয়ার জন্য তুমি ঝলমলে সকালে গাড়ি চালানোর প্রচুর ছবি পাবে। কিন্তু বরফস্নাত রাতে তো গাড়ি চালানোই কম হয়, সেরকম ছবি হয়তো তুমি বেশি পেলে না। যে মডেল ওই সকালের ছবিগুলোতে প্রশিক্ষিত হয়েছে, সে কিন্তু রাত্রেবেলা ভালো কাজ করবে না। বা এরকমও সমস্যা হয় যে মার্কিন যুক্তরাষ্ট্রের রাস্তায় প্রশিক্ষিত নেটওয়ার্ক চীনের রাস্তায় কাজ করে না।

এটা তো নিশ্চয়ই ক্যামেরা সেটিং অনুযায়ীও পাল্টাতে পারে?

হ্যাঁ পারে, কিন্তু কিসে প্রশিক্ষণ দিলে কোথায় কাজ করবে না — সেটা নির্দিষ্টভাবে বলা মুশকিল। এ থেকে বলা যায় এই সাধারণীকরণ সমস্যা (generalization problem) একটা বড় অমীমাংসিত সমস্যা।

আরেকটা বড় সমস্যা হলো বোধগম্যতা (explainability)। এর কথা আগেই বলেছি — AI কেন কোনো সিদ্ধান্তে পৌঁছল, সেটা মানুষের কাছে বোধগম্য করে তোলার সমস্যা।

আরেকটা সমস্যা হলো সৃষ্টিমূলক কাজ (generative tasks) সংক্রান্ত। যদিও এক্ষেত্রে গত কয়েক বছরে প্রচুর উন্নতি হয়েছে।

প্রশিক্ষণের উদ্দেশ্যটাকে গোদাভাবে ভাগ করতে হলে দুটো সমস্যায় ভাগ করা যায়। এক হলো, কিছু সৃষ্টি করতে হবে (generation), আরেকটা হলো শনাক্ত করতে হবে (discrimination)। কুকুর-বেড়ালের উদাহরণটা ধরলে, কুকুর না বেড়াল সেটা আলাদা করতে পারাটা হলো discrimination। আর তুমি কোনো একটা কুকুরের ছবি বা বিড়ালের ছবি তৈরি করবে, এটা হলো generation।

generation করার পদ্ধতিগুলোতে সত্যিই অনেক উন্নতি হয়েছে। DALL-E বা এ ধরনের কিছু মডেল বেরিয়েছে। কিন্তু এগুলোও প্রচুর তথ্য শিখে আসা মডেল। তাতে অনেকে খুঁত খুঁজে পাচ্ছে। ধরো, কোনো নেগেটিভ উদাহরণ তৈরি করতে হবে — যেমন, এমন একটা ছবি তৈরি করো যেটায় কোনো কমলালেবু নেই, কিন্তু আপেল আছে। এরকম কিন্তু হচ্ছে যে নিউরাল নেটওয়ার্ক দুটো জিনিসই তৈরি করছে। এই প্রসঙ্গ বুঝে কাজ করার ব্যাপারটাতে এখনো সমস্যা রয়েছে। ভাষা ব্যবহার করে কিছু তৈরি করার ক্ষেত্রে এই সমস্যাটা আরো চোখে পড়ে। ছবি তৈরি করতে যতটা না প্রসঙ্গ বোঝার দরকার পড়ে, ভাষাতে অনেক বেশি দরকার হয়। ব্যাকরণ ইত্যাদি ভালোভাবে বুঝতে হয়।

আরেকটা জায়গায় স্পষ্ট সমস্যা দেখা যায়, সেটা হলো চিকিৎসার ক্ষেত্রে। কম্পিউটার ভিশন-এ (computer vision) যে বিশাল সুবিধেটা রয়েছে, সেটা হলো প্রচুর লেবেল করা ছবি। যে কেউ ছবিতে কুকুর বা বেড়াল লেবেল করে দিতে পারে। কিন্তু একটা বুকের এক্স-রে থেকে একটা নিরীহ টিউমার কি মারাত্মক, সেটা বলতে এখনো একজন বিশেষজ্ঞকে লাগে। ফলে এই লেবেল করাটা একই পরিমাণে হয়নি। যেহেতু খুব বেশি তথ্য মজুত নেই, তাই চিকিৎসাশাস্ত্রে ডীপ লার্নিং এখনো সেভাবে ঢুকতে পারেনি।

আরো অনেক ধরনের সমস্যা রয়েছে, কিন্তু আমার এগুলোই আপাতত খুব বড় সমস্যা বলে মনে হয়।

আপনি বললেন যে চিকিৎসাশাস্ত্রে এখনো বিশেষজ্ঞের প্রয়োজন আছে। এই প্রসঙ্গে একটা কথা মনে হলো। আমরা অনেকের কাছে বিশেষ করে অনেক রাজনীতিবিদদের কাছ থেকে বারবারই শুনতে পাই যে এ.আই. নাকি সবকিছুর জায়গা কেড়ে দেবে, এ.আই.-এর ফলে আমাদের চাকরি চলে যাবে।

আরেকটা খবর সম্প্রতি এসেছিল, গুগলের একজন কর্মচারী নাকি জানায়, তাদের এ.আই. সিস্টেম মানুষের মতই সচেতন হয়ে গেছে। Google সেই কর্মচারীটিকে বহিষ্কার করে দেয়।

আপনার এ নিয়ে কী মত, এটা কি বাস্তবে সম্ভব?

আমার মনে হয় এ.আই. এই মুহূর্তে সেই পর্যায়ে পৌঁছয়নি।

তবে গবেষকদের সবসময় সচেতন থাকা উচিত। পরবর্তীকালে হয়তো আমাদের মতামত পাল্টাতে হতে পারে।

এখনো নিউরাল নেটওয়ার্ক যে পর্যায়ে আছে, সেটা খুবই তথ্য নির্ভর। অনেক অনেক তথ্য ওকে দাও, ও সেটাকে ঘেঁটে শিখবে। এখান থেকে মনে হয় না যাকে বলে “আর্টিফিশিয়াল জেনারেল ইন্টেলিজেন্স” (artificial general intelligence), সেটা হওয়াটা সম্ভব।

এই বিষয়টা নিয়ে সত্যিই একটা আলোড়ন উঠেছিল বটে। এখন গবেষণা সম্প্রদায়ের মধ্যে এটা একটা ‘মিম’-এর (meme) মতো। অনেকে মজা করে বলে, আমার অমুক পদ্ধতিটা সচেতন হয়ে গেছে।

কী হবে ভবিষ্যতে, বলা খুব মুশকিল। তবে আমার মনে হয় না —

আপনি বললেন, আর্টিফিশিয়াল ইন্টেলিজেন্স তথ্য নির্ভর। কিন্তু আমাদের মানুষের মস্তিষ্কও তো তথ্যনির্ভর!

এই রে, এটা একটু জটিল প্রশ্ন!

খুব সাধারণভাবে বলতে গেলে, আমরাও তথ্য নির্ভর। কিন্তু … কিছু তফাৎ আছে। আমরা খুব ভালো সাধারণীকরণ (generalization) করতে পারি।

কোনো একটা বাচ্চাকে তুমি যদি ছোট থেকে শুধু লাল আপেলই দেখিয়ে আসো এবং তারপর কোনো একদিন সবুজ আপেল দেখাও, সে কিন্তু সবুজ জিনিসটাকেও আপেল বলবে। নিউরাল নেটওয়ার্ক এখনো সেই পর্যায়ে পৌঁছায়নি। কোনো একটা নেটওয়ার্ক-কে যদি লাল আপেল আর সবুজ আম দিয়ে যদি ট্রেন করা হয়, এবং কখনো একটা সবুজ আপেল দেখানো হয়, নেটওয়ার্ক কিন্তু জিনিসটাকে আমই বলবে। এই বুঝতে পারার ক্ষমতাটা মানুষের এমনকি বাচ্চাদের ক্ষেত্রেও অনেক বেশি।

আজকাল প্রচুর ধরনের এ.আই. সমৃদ্ধ অ্যাপ (app) বাজারে এসেছে। সেগুলো আমরা যথেচ্ছ ব্যবহার করছি কিন্তু তার ভিতরে কী হচ্ছে, সেই সম্বন্ধে আমরা হয়তো অবগত নই।

যেমন আমি দুম করে একটা অ্যাপ ডাউনলোড করতে পারি যেটা হয়তো আমার মুখ পরিবর্তন করে বয়স্ক করে দিতে পারে। এরকম প্রচুর অ্যাপ রয়েছে।

এরকম যে একটা গোটা ইকোসিস্টেম (ecosystem) তৈরি হচ্ছে যেখানে অনেক সাধারণ মানুষ বেশি কিছু না জেনে এই ধরনের অ্যাপ ব্যবহার করছে, এ ব্যাপারে গবেষক হিসেবে তোমার কী মনে হয়? যেহেতু ব্যাপারটা এখন সবার হাতে চলে এসেছে, এ ব্যাপারে কী কিছু নৈতিক ভাবনা, বা অন্তত কিছু সচেতনতা থাকা উচিত?

এই নিয়ে একজন প্রশ্নও করেছেন। আজকাল “ডীপ ফেক” (deep fake) কথাটা খুব শোনা যায়। একটা ছবিকে পরিবর্তন করে ‘জেনেরেটিভ এ.আই.’-এর সাহায্যে খুব সহজে পাল্টে ফেলা যায়। এখানে বিজ্ঞানের অগ্রগতি এবং নৈতিকতার একটা সংঘর্ষ দেখা যাচ্ছে। এ নিয়ে কিছু সিদ্ধান্ত নেওয়াও জটিল কারণ সবসময় ভয় রয়েছে যে কোনো একটা দিকে অনিয়ন্ত্রিতভাবে চলে যাবে ব্যাপারটা। এই নিয়ে তোমার কী মত?

এটা নিয়ে অনেকেই ভাবছে। এটা একটা গম্ভীর ভাবনার বিষয়।

কিন্তু আমার মনে হয়, বিজ্ঞানের যে কোনো ধারাতেই এই সমস্যাটা রয়েছে। সেই বিশ্বযুদ্ধের সময়ও আমরা এটা দেখেছি। বিজ্ঞানীরা কিন্তু সবসময়ই বিজ্ঞানের এই ধরনের অপব্যবহারের বিপক্ষেই রয়েছে।

একটু থামাচ্ছি। আমার মনে হয় বাকিগুলোর থেকে এই জিনিসটা একটু আলাদা কারণ এটা খুব সহজলভ্য এবং খুব কম সময়ের মধ্যে প্রচুর বেশি মাত্রায় অগ্রগতি হয়েছে। এবং অনেকে এটা ব্যবহারও করছে।

আমার মনে হয় কড়া আইন তৈরি করা ছাড়া এটাকে নিয়ন্ত্রণ করার অন্য কোনো উপায় নেই। কিন্তু এটাও স্বীকার করতে হবে যে সবকিছু এত সহজলভ্য বলেই কিন্তু ডীপ লার্নিং গবেষণা এতটা এগিয়েছে। যে কথাটা বললাম — ওই যে মডেলগুলোকে প্রশিক্ষণ দিয়ে (pre-training) অনেকে এগিয়ে রেখেছে, আমার অনেক কাজ কিন্তু তার ফলে কমে যাচ্ছে। শুধু কাজ না, অনেক শক্তি খরচ বেঁচে যাচ্ছে। নইলে আমাকে আবার প্রথম থেকে সবটা করতে হতো।

এটা পুরো ব্যাপারটাকে যতটা সহজলভ্য করে, তেমনই অপব্যবহারের রাস্তাও খুলে দেয়। এই দিকটা আমাদের ব্যবহারকারীদেরই নজর রাখতে হবে এবং আইনের উপর নির্ভর করতে হবে। উন্নত দেশগুলোতে আগে থেকেই কিছু আইন তৈরি হয়েছে, এবং আমাদের দেশেও কিছু নতুন নতুন আইন আসছে। অপব্যবহারকারীকে দৃষ্টান্তমূলক শাস্তি দিতে হবে। তা না হলে মনে হয়, এই সহজলভ্যতাটা আখেরে ক্ষতি করতে পারে।

আমার মনে হয় মানুষকেও আর একটু সচেতন হতে হবে। না জেনে কোনো অ্যাপ ইত্যাদি ব্যবহার না করাই উচিত। পুরোপুরি আইনের উপর তো আর নির্ভর করা যায় না — যেটা বলে, সবসময়ই তো আর পুলিশ বাঁচিয়ে দেবে না, তোমাকে ঘরে তালাটাও দিয়ে রাখতে হবে।

তবে বিজ্ঞানীরা এ ব্যাপারে প্রায় সবাই একমত যে অপব্যবহার করতে দেওয়া যাবে না। কীভাবে? সেটা আমরা পুরোপুরি জানি না। একটা হতে পারে যে অ্যাপ ডাউনলোড করে ব্যবহার করার সময় যে অনুমোদনটা দিতে হয়, সেখানে লেখা থাকে যে অ্যাপটা খারাপ কাজে ব্যবহার করা যাবে না। সেই ব্যাপারটাতে যদি লোকের ভয় থাকে, সেটা একটা উপায় হতে পারে…

আমরা দর্শকদের থেকে একটা ছোট্ট প্রশ্ন নেব। “কৃত্রিম বুদ্ধিমত্তায় একটা স্ট্যান্ডার্ড প্রশ্ন আসে। একটি সম্পূর্ণ অটোমেটেড গাড়ি খুব জোরে চলছে, হঠাৎই রাস্তায় একদিকে একটি শিশু আর একদিকে একজন বৃদ্ধা চলে এলো। গাড়িটি ব্রেক কষেও অন্তত একজনকে ধাক্কা না দিয়ে থাকতে পারবে না। সেক্ষেত্রে গাড়িটির কি করা উচিত, কাকে ধাক্কা মারা উচিত, সেটা কি গাড়ি ভাবতে পারবে, বা ভাবা উচিত?” আপনার কী মনে হয়?

(হেসে) খুবই জটিল প্রশ্ন। আমার তো প্রথমেই যেটা মনে হয়, খুব জোরে গাড়িটা না চালানো উচিত। তবে এর সঠিক উত্তর আমার কাছেও নেই।

পুরো স্বয়ংক্রিয় গাড়ি তৈরি করার ব্যাপারটা আমার মনে হয় আইনগতভাবে খুবই জটিল।

আমার ব্যক্তিগত মত হল, এটা খুবই প্রথম বিশ্বের সমস্যা। আমি নিজে স্বয়ংক্রিয় গাড়ির প্রয়োজনীয়তা খুব একটা বুঝি না। আমার মনে হয় যেসব কারণগুলো দেখানো হয়, যেমন দুর্ঘটনার হার কমবে — সেরকম করা সম্ভব হলে ভালো।

কলকাতায় কি স্বয়ংক্রিয় গাড়ি চালানো সম্ভব?

এখানে মানুষের গাড়ি চালানোরই অসুবিধা রয়েছে। আমি মার্কিন যুক্তরাষ্ট্র থেকে আসার পর এখনও ঠিকমতো গাড়ি চালাতে পারি না। তুমি জানোই না কোথায় কী বাধা রয়েছে।

এবং এই ব্যাপারটা এই ধরনের কোম্পানিরা জানে। বিজ্ঞানী সম্প্রাদয়ের কাছেও ব্যাপারটা জানা। তারা শুধু কলকাতা কেন, যে কোনো ধরনের এশীয় দেশ থেকেই ডেটা নিতে চায় না। কারণ একই সিস্টেম এখানে খুব ভালো কাজ করে না।

এই স্বয়ংক্রিয় গাড়ি ব্যাপারটাকে আমার হুজুগ বলেই মনে হয়। হয়তো আমার এত জোর গলায় বলা উচিত না, কিন্তু এটা আমার মনে হয়।

আপনি বলছিলেন, বেশিরভাগ প্রি-ট্রেন্ড মডেলই তৈরি হয়েছে মার্কিন যুক্তরাষ্ট্র অথবা ইউরোপে। সেসব কি এশিয়া বা ভারতের মতো কোনো জায়গাতে ঠিকভাবে কাজ করে? আপনি কি গবেষণা করতে গিয়ে সমস্যার সম্মুখীন হন?

হ্যাঁ, নিশ্চয়। ভারতের কিছু সমস্যা নিয়ে কাজ করতে গেলে এই অসুবিধাগুলো হয়ই। তবে আমি জানি না সমাধান কী। সমস্যার কথা তো সবাই জানে — ব্রেন ড্রেন, হ্যানা ত্যানা। মোদ্দা কথা হলো, কৃত্রিম বুদ্ধিমত্তা নিয়ে গবেষণা অনেকটাই প্রথম বিশ্বের দেশগুলো দ্বারা পরিচালিত। সেইসব দেশে যে সমস্যাগুলো গুরুত্বপূর্ণ, সেই নিয়েই কাজ হচ্ছে।

তবে আমি বলবো, ভারতের কিছু বিশ্ববিদ্যালয় এবং ইন্ডাস্ট্রির কিছু ল্যাবে ভালো কাজ হচ্ছে এই ধরনের সমস্যা থেকে বেরিয়ে আসতে। চিকিৎসার ক্ষেত্রে কিংবা সামাজিক কল্যাণের জন্য (AI for social good) বিশেষ বিশেষ ক্ষেত্রে কাজ হচ্ছে। তবে আরো বেশি করে কাজ হওয়া প্রয়োজন।

এই প্রসঙ্গেই আরেকটি প্রশ্ন। কৃত্রিম বুদ্ধিমত্তা নিয়ে গবেষণা তুলনামূলকভাবে অনেকটাই নতুন। এখন এর চাহিদাও প্রচুর। তবে অনেকেই জানে না — স্কুলে থেকে কী কী ধরনের পড়াশোনা করতে হবে এ নিয়ে গবেষণা করার জন্য? কেউ যদি এ নিয়ে উচ্চশিক্ষা লাভ করতে চায় তাহলে তার কী করণীয়? তোমার কী মনে হয়?

আমি শুনছিলাম, এন-সি-ই-আর-টি (NCERT) বোধহয় ক্লাস টেনে এ নিয়ে কিছু কিছু নতুন বই বের করছে। আমি জানি না সেগুলোর পাঠক্রম কী। তবে আপাতত উচ্চশিক্ষার জন্য আমার মনে হয় না আন্ডারগ্র্যাজুয়েট লেভেলের আগে কোনো উপায় রয়েছে।

যেটা করা যেতে পারে, সেটা হলো কোডিং-টা শিখে রাখা যায়। তাহলে একটা ভালো হাতিয়ার সঙ্গে থাকবে। এটা আমরা পাঠক্রমেও আনতে পারি।

একদম ভিত্তির জন্য যেটা দরকার সেটা হলো অঙ্কটা শেখা। অঙ্ক বলতে লিনিয়ার অ্যালজেব্রা (linear algebra) এবং স্ট্যাটিসটিকস-এর (probability and statics) ধারণাগুলো পরিষ্কার থাকা প্রয়োজন। এগুলো যদিও এখনকার সব পাঠক্রমেই রয়েছে। আন্ডারগ্র্যাজুয়েট প্রথম বর্ষে কিংবা দ্বিতীয় বর্ষে এটা পড়ানো হয়ই। মোটামুটি এগুলোর ধারণা পরিষ্কার থাকলে পরে জিনিসগুলো বোঝা সহজ হয়ে যায়।

কোডিং-টা জানা জরুরি কিন্তু কোনো একটা প্রোগ্রামিং-এর ভাষা জানাটা অতটাও জরুরি নয়। বা একই সাথে জরুরি এবং জরুরি নয়। তুমি যখন এক সমস্যার কথা ভাবছো, যেভাবে ভাবছো, সেখানে প্রোগ্রামিং-এর ভাষা অতটা আসছে না। কিন্তু সেটাকে হাতেকলমে পরীক্ষা করে দেখতে চাইলে তো একটা ভাষা জানতে হবে।

আর একটা কারণে বিশেষ কোনো একটা প্রোগ্রামিং-এর ভাষা জানা জরুরি। ধরো, তুমি কোথাও একটা কাজ দেখেছো, এবং ভাবছো জিনিসটা কি আদৌ কাজ করে, তখন তোমাকে সেই কাজটা বুঝতে হবে। যেহেতু সবই এখন প্রায় ওপেন-সোর্স (open source), তুমি সেই কাজের কোড-টাও পেয়ে যাবে। তখন যদি তুমি সেই কোডের ভাষা না পড়তে পারো কারণ তুমি অন্য কোনো একটা ভাষা শিখে এসেছো যেটা এই ধরনের বিজ্ঞানীরা ব্যবহার করে না, তখন সমস্যা হয়ে যাবে। তখন তুমি ওই কোড-টা চালাতে বা ওর উপর আরো কাজ করতে পারবে না।

তাই আমার মনে হয়, একদম স্কুল লেভেলে কোডিং-টা শিখতে পারলে খুব ভালো। কোডিং-টা একটা অস্ত্র যেটা পরে কাজে লাগবে। তারপর অঙ্কের বিভিন্ন বিষয়গুলো শিখে এই ধরনের গবেষণায় আসা যায়।

বেশ ভালো আড্ডা হল আজ। অনেক কিছু জানতে পারলাম আমরা। তাহলে আজকের মত আড্ডাটা শেষ করা যাক।

ধন্যবাদ।

লেখাটি অনলাইন পড়তে হলে নিচের কোডটি স্ক্যান করো।

Scan the above code to read the post online.

Link: https://bigyan.org.in/ai-researcher-ai-user

বিজ্ঞান - Bigyan

বাংলা ভাষায় বিজ্ঞান জনপ্রিয়করণের এক বৈদ্যুতিন মাধ্যম An online Bengali Popular Science magazine

https://bigyan.org.in

AI গবেষণা বনাম AI ব্যবহার

বাংলা ভাষায় বিজ্ঞান জনপ্রিয়করণের এক বৈদ্যুতিন মাধ্যম
An online Bengali Popular Science magazine