সংক্ষেপে
- Meta-র নতুন Muse Spark এজেন্ট-ভিত্তিক যুক্তি সহ বন্ধ, নেটিভভাবে মাল্টিমোডাল AI-তে পরিবর্তনের চিহ্ন।
- Meta স্বাস্থ্য এবং অনুসন্ধানে শক্তিশালী বেঞ্চমার্ক লাভের রিপোর্ট করেছে, তবে মূল যুক্তি এবং কোডিংয়ে এখনও Gemini-র পিছনে রয়েছে।
- অনেক কম কম্পিউটের সাথে নয় মাসে নির্মিত, এটি একটি নতুন দক্ষতা-চালিত AI কৌশলের দিকে নির্দেশ করে।
Meta বুধবার Muse Spark চালু করেছে, যা Meta Superintelligence Labs দ্বারা নির্মিত প্রথম মডেল চিহ্নিত করে—Meta-র $14 বিলিয়ন Scale AI অধিগ্রহণের পরে চিফ AI অফিসার Alexandr Wang-এর অধীনে নয় মাস আগে একত্রিত দল। এটি এখন meta.ai এবং Meta AI অ্যাপে লাইভ রয়েছে, আগামী কয়েক সপ্তাহে Facebook, Instagram এবং WhatsApp-এ রোলআউট আসছে।
এটি শুধু আরেকটি চ্যাটবট আপগ্রেড বা Llama-র নতুন সংস্করণ নয়। Muse Spark নেটিভভাবে মাল্টিমোডাল—এটি মূল থেকেই ছবি, টেক্সট এবং ভয়েস প্রক্রিয়া করে, বিদ্যমান টেক্সট মডেলে দৃষ্টিশক্তি যুক্ত করার পরিবর্তে। এটি ভিজ্যুয়াল চেইন-অফ-থট, টুল-ইউজ সাপোর্ট এবং Meta যাকে "Contemplating মোড" বলছে তা নিয়ে আসে: একটি সেটআপ যা কঠিন সমস্যা মোকাবেলায় একাধিক AI এজেন্ট সমান্তরালে চালায়। এটি Google-এর Gemini Deep Think এবং OpenAI-র GPT Pro থেকে বর্ধিত চিন্তার মোডের জন্য Meta-র উত্তর।
"Muse Spark আমাদের স্কেলিং মই-এর প্রথম ধাপ এবং আমাদের AI প্রচেষ্টার মূল থেকে সংস্কারের প্রথম পণ্য," Meta একটি সরকারি ঘোষণায় লিখেছে। "আরও স্কেলিং সমর্থন করতে, আমরা সম্পূর্ণ স্ট্যাক জুড়ে কৌশলগত বিনিয়োগ করছি—গবেষণা এবং মডেল প্রশিক্ষণ থেকে শুরু করে Hyperion ডেটা সেন্টার সহ অবকাঠামো পর্যন্ত।"
কোম্পানিটি Muse Spark-এর চিকিৎসা যুক্তির জন্য প্রশিক্ষণ ডেটা কিউরেট করতে 1,000-এর বেশি চিকিৎসকের সাথে কাজ করেছে। HealthBench Hard-এ ফলাফল—একটি উন্মুক্ত স্বাস্থ্য প্রশ্ন বেঞ্চমার্ক—চমকপ্রদ: Muse Spark 42.8 স্কোর করেছে, GPT 5.4-এর জন্য 40.1 এবং Gemini 3.1 Pro-এর জন্য মাত্র 20.6-এর তুলনায়। এটি একটি প্রান্তিক পার্থক্য নয়।
এজেন্টিক সার্চে (DeepSearchQA), Muse Spark 74.8 নিয়ে নেতৃত্ব দেয়, Gemini (69.7) এবং GPT 5.4 (73.6) কে হারিয়ে। CharXiv Reasoning-এ—বৈজ্ঞানিক কাগজপত্র থেকে চিত্র বোঝা—এটি 86.4 স্কোর করেছে, তুলনায় মডেলগুলির মধ্যে সর্বোচ্চ।
যারা AI জেলব্রেকিং-এ আগ্রহী, মডেলটি কয়েক মিনিটের মধ্যে ক্র্যাক হয়ে গিয়েছিল:
তবে ভালো মহান এর সমান নয়। সামগ্রিক বেঞ্চমার্ক চিত্র দেখায় Gemini 3.1 Pro এখনও বেশিরভাগ বিভাগে এগিয়ে চলছে। ব্যবধান সবচেয়ে বেশি দৃশ্যমান ARC AGI 2-তে, বিমূর্ত যুক্তি পাজল বেঞ্চমার্ক: Gemini 76.5 স্কোর করেছে Muse Spark-এর 42.5-এর বিপরীতে।
কোডিংয়ে (LiveCodeBench Pro), Gemini-র 82.9 Meta-র 80.0 কে ছাড়িয়ে যায়। MMMU Pro-তে—মাল্টিমোডাল বোঝাপড়া—Gemini 83.9 স্কোর করেছে 80.4-এর বিপরীতে। Meta-র নিজস্ব ব্লগ দীর্ঘ-দিগন্ত এজেন্টিক সিস্টেম এবং কোডিং ওয়ার্কফ্লোতে বর্তমান পারফরম্যান্স ফাঁক স্বীকার করে।
এই লঞ্চে একটি উল্লেখযোগ্য কৌশলগত পরিবর্তনও বেক করা আছে। Muse Spark একটি বন্ধ মডেল—এর আর্কিটেকচার এবং ওজন প্রকাশ্যে করা হবে না। এটি Llama থেকে একটি তীক্ষ্ণ প্রস্থান, যা উন্মুক্ত AI বৃত্তে Meta-র খ্যাতি তৈরি করেছিল। এই বছরের শুরুতে Llama 4-এর হতাশাজনক অভ্যর্থনার পরে, Meta দৃশ্যত সিদ্ধান্ত নিয়েছে যে পরবর্তী অধ্যায় ভিন্নভাবে লেখা দরকার।
কোম্পানি বলছে এটি Muse-এর ভবিষ্যত সংস্করণ ওপেন-সোর্স করার আশা করে, তবে আপাতত কোড Meta-র ভিতরে থাকে। ঘোষণার পরে বুধবার টেক দৈত্যের স্টক প্রায় 9% বৃদ্ধি পেয়েছে এবং ট্রেডিং দিন 6.5% বৃদ্ধি নিয়ে $612.42 মূল্যে শেষ হয়েছে।
"Contemplating মোড" মডেলের সীমা আরও উপরে ঠেলে দিতে সমান্তরাল এজেন্ট অর্কেস্ট্রেশন ব্যবহার করে। সেই কনফিগারেশনে, Muse Spark Humanity's Last Exam-এ 58% এবং FrontierScience Research-এ 38% হিট করেছে—এমন অঞ্চল যা এটিকে Gemini এবং GPT-এর সবচেয়ে সক্ষম সংস্করণের সাথে প্রতিযোগিতামূলক করে তোলে, তাদের স্ট্যান্ডার্ড রিলিজের পরিবর্তে।
Meta একটি শপিং সহায়কও রোল আউট করছে যা পণ্য তুলনা করে এবং সরাসরি ক্রয়ের সাথে লিঙ্ক করে, এবং আগামী সপ্তাহে Facebook, Instagram এবং WhatsApp-এ Muse Spark আনার পরিকল্পনা করছে—Llama 3 থেকে প্রয়োগ করা একই স্ক্রিপ্ট অনুসরণ করে, এটিকে 3.5 বিলিয়নেরও বেশি ব্যবহারকারীর সামনে রাখছে। একটি প্রাইভেট API প্রিভিউ নির্বাচিত ডেভেলপারদের জন্য খোলা হচ্ছে।
মডেলটি নয় মাসে নির্মিত হয়েছে, অভ্যন্তরীণভাবে কোডনাম Avocado, Meta দাবি করে যে এর নতুন প্রি-ট্রেনিং স্ট্যাক 10 গুণেরও বেশি কম কম্পিউট ব্যবহার করে Llama 4 Maverick-এর মতো একই সামর্থ্য স্তরে পৌঁছাতে পারে।
Muse Spark অভ্যন্তরীণভাবে Muse পরিবারের একটি "ছোট এবং দ্রুত" প্রথম ধাপ হিসাবে বর্ণনা করা হয়েছে। একটি আরও সক্ষম সংস্করণ ইতিমধ্যে উন্নয়নে রয়েছে।
দৈনিক ডিব্রিফ নিউজলেটার
প্রতিদিন শীর্ষ সংবাদ গল্প দিয়ে শুরু করুন এখনই, পাশাপাশি মূল বৈশিষ্ট্য, একটি পডকাস্ট, ভিডিও এবং আরও অনেক কিছু।
সূত্র: https://decrypt.co/363691/meta-muse-spark-most-capable-ai-gemini-pro-still-leads








