
ছবি: সংগৃহীত
বর্তমান কৃত্রিম বুদ্ধিমত্তা বা এআই মডেলগুলোকে ঘিরে যত হাইপই থাকুক না কেন, সেগুলো এখনও মানব মস্তিষ্কের চারটি গুরুত্বপূর্ণ বৈশিষ্ট্য অর্জন করতে পারেনি—এমনটাই বললেন মেটা প্লাটফর্মের -এর চিফ এআই সায়েন্টিস্ট ইয়ান লেকুন।
সম্প্রতি প্যারিসে অনুষ্ঠিত এআই একশন সামিটে-এ এক আলোচনা সভায় তিনি জানান, বুদ্ধিমান যেকোনো প্রাণীর—বিশেষ করে মানুষের—চারটি মৌলিক বুদ্ধিবৃত্তিক বৈশিষ্ট্য থাকে:
বুদ্ধিমান প্রাণীর ৪টি মৌলিক গুণ যা এখনো এআই অর্জন করতে পারেনি:
- ভৌত জগত বোঝার ক্ষমতা (Understanding the physical world)
- স্থিতিশীল স্মৃতি বা মেমরি (Persistent memory)
- যুক্তিভিত্তিক চিন্তাভাবনা (Reasoning)
- জটিল এবং স্তরভিত্তিক পরিকল্পনা (Hierarchical planning)
লেকুন বলেন, আজকের অনেক বড় বড় LLM (Large Language Models)-এ এই বৈশিষ্ট্যগুলো নেই। তাই এআই -কে আরও বুদ্ধিমান করতে হলে এর ট্রেনিং পদ্ধতিতে আমূল পরিবর্তন আনতে হবে।
বর্তমান এআই মডেলগুলোর সীমাবদ্ধতা:
বিভিন্ন টেক কোম্পানি এই ঘাটতি পুষিয়ে নিতে বিভিন্ন প্রযুক্তি "বোল্ট-অন" করছে। যেমন—
- ভিশন সিস্টেম আলাদা করে ট্রেইন করা
- RAG (Retrieval Augmented Generation) ব্যবহার করা
- অ্যাসোসিয়েটিভ মেমরি যোগ করা
- মডেল আরও বড় করা
তবে লেকুন বলেন, এসব কৌশল কেবল "হ্যাক"—স্থায়ী সমাধান নয়।
বিকল্প সমাধান: World-Based Model
লেকুন বলেন, ভবিষ্যতের এআই তৈরি হবে এমনভাবে, যেন তারা বাস্তব জগতে ভবিষ্যদ্বাণী করতে পারে।
“আপনার সামনে একটি বাস্তবতা আছে, আপনি একটি কাজ করলেন, এরপর আপনি অনুমান করেন সেই কাজের ফলে ভবিষ্যতে কী হতে পারে”—এই ভিত্তিতেই গড়ে উঠবে World Model। তবে যেহেতু পৃথিবী অসীম পরিবর্তনের মধ্য দিয়ে চলে, তাই এই এআই-কে abstract level-এ বুঝতে শেখাতে হবে।
মেটা-এর নতুন উদ্যোগ: V-JEPA মডেল
মেটা সম্প্রতি প্রকাশ করেছে V-JEPA, একটি non-generative AI model, যা ভিডিওর অনুপস্থিত অংশ অনুমান করবে। এটি পিক্সেল স্তরে প্রেডিকশন না করে abstract representation-এ কাজ করে।
লেকুন বলেন, এটি অনেকটা পদার্থবিজ্ঞানে ম্যাটার হায়ারার্কি গঠনের মতো—যেখানে পার্টিকল → অ্যাটম → মলিকিউল → ম্যাটেরিয়াল—এভাবে স্তরে স্তরে বোঝা সহজ হয়।
তিনি বলেন, “আমরা যত উপরে উঠি, নিচের অপ্রয়োজনীয় জটিলতাগুলো বাদ দিয়ে শুধু প্রয়োজনীয় তথ্য রাখি।”
এভাবেই ভবিষ্যতের এআই হবে বহুস্তর বিশ্লেষণক্ষম ও বাস্তবদর্শী, ঠিক যেমন মানুষ।
মুমু