NVIDIA এজেন্টিক ওয়ার্কলোডের জন্য Vera Rubin POD 40-র্যাক AI সুপারকম্পিউটার উন্মোচন করেছে
Iris Coleman মার্চ 16, 2026 19:48
NVIDIA Vera Rubin POD ঘোষণা করেছে যাতে 40টি র্যাক জুড়ে 1,152টি GPU রয়েছে, যা 60 exaflops প্রদান করে এবং Blackwell এর তুলনায় প্রতি ওয়াটে 10x ভালো ইনফারেন্স পারফরম্যান্স দেয়।
NVIDIA তার সবচেয়ে উচ্চাভিলাষী AI অবকাঠামো পরিকল্পনার স্পেসিফিকেশন প্রকাশ করেছে। Vera Rubin POD 40টি র্যাক জুড়ে 1,152টি Rubin GPU প্যাক করে, যা 60 exaflops কম্পিউট শক্তি এবং প্রতি সেকেন্ডে 10 পেটাবাইট মোট স্কেল-আপ ব্যান্ডউইথ প্রদান করে। উৎপাদন ইউনিটগুলি 2026 সালের দ্বিতীয়ার্ধে সরবরাহ করা হবে।
এখানের সংখ্যাগুলি বিস্ময়কর: 1.2 কোয়াড্রিলিয়ন ট্রানজিস্টর, প্রায় 20,000 NVIDIA ডাই, সবগুলি একটি একক সুসংগত সুপারকম্পিউটার হিসাবে কাজ করার জন্য ইঞ্জিনিয়ার করা হয়েছে। NVIDIA দাবি করে যে এর বর্তমান Blackwell আর্কিটেকচারের তুলনায় 4x ভালো ট্রেনিং পারফরম্যান্স এবং প্রতি ওয়াটে 10x ভালো ইনফারেন্স পারফরম্যান্স—টোকেন খরচ বর্তমান স্তরের এক-দশমাংশে নেমে আসছে।
পাঁচটি উদ্দেশ্য-নির্মিত র্যাক সিস্টেম
POD পাঁচটি স্বতন্ত্র র্যাক-স্কেল সিস্টেম একত্রিত করে, প্রতিটি আধুনিক AI ওয়ার্কলোডে নির্দিষ্ট বাধাগুলি লক্ষ্য করে:
Vera Rubin NVL72 মূল কম্পিউট ইঞ্জিন হিসাবে কাজ করে। প্রতিটি র্যাক 72টি Rubin GPU এবং 36টি Vera CPU একীভূত করে যা NVLink 6 এর মাধ্যমে সংযুক্ত, যা প্রতি GPU 3.6 TB/s ব্যান্ডউইথ পুশ করে—NVIDIA অনুযায়ী সম্পূর্ণ বৈশ্বিক ইন্টারনেটের চেয়ে বেশি মোট ব্যান্ডউইথ। সিস্টেমটি চারটি AI স্কেলিং আইন লক্ষ্য করে: প্রিট্রেনিং, পোস্ট-ট্রেনিং, টেস্ট-টাইম স্কেলিং এবং এজেন্টিক স্কেলিং।
Groq 3 LPX র্যাক লেটেন্সি সমস্যা মোকাবেলা করে। SRAM-শুধুমাত্র আর্কিটেকচার ব্যবহার করে প্রতি র্যাকে 256টি ভাষা প্রক্রিয়াকরণ ইউনিট সহ, এগুলি NVL72 এর সাথে জোড়া বেঁধে Blackwell এর তুলনায় ট্রিলিয়ন-প্যারামিটার মডেলের জন্য 35x বেশি টোকেন এবং 10x বেশি রাজস্ব সুযোগ প্রদান করে যা NVIDIA দাবি করে।
Vera CPU র্যাক এজেন্ট পরীক্ষার জন্য স্যান্ডবক্স পরিবেশ প্রদান করে। একটি একক র্যাক 22,500টিরও বেশি সমসাময়িক রিইনফোর্সমেন্ট লার্নিং পরিবেশ টিকিয়ে রাখে—স্থাপনার আগে এজেন্টিক AI আউটপুট যাচাই করার জন্য গুরুত্বপূর্ণ।
BlueField-4 STX র্যাক CMX কনটেক্সট মেমরি প্ল্যাটফর্মের মাধ্যমে যা NVIDIA "AI-নেটিভ স্টোরেজ" বলে তা প্রবর্তন করে। ডেডিকেটেড হাই-ব্যান্ডউইথ স্টোরেজে KV ক্যাশ অফলোড করে, সিস্টেম দাবি করে যে ঐতিহ্যবাহী পদ্ধতির তুলনায় 5x বেশি টোকেন-প্রতি-সেকেন্ড এবং 5x ভালো পাওয়ার দক্ষতা।
Spectrum-6 SPX নেটওয়ার্কিং র্যাক কো-প্যাকেজড অপটিক্স সহ 102.4 Tb/s সুইচ দিয়ে সবকিছু একসাথে বেঁধে রাখে।
টোকেন অর্থনীতি যুক্তি
NVIDIA এটি একটি নির্দিষ্ট বাজার বাস্তবতার চারপাশে ফ্রেম করে: টোকেন ব্যবহার এখন বার্ষিক 10 কোয়াড্রিলিয়ন অতিক্রম করেছে, এবং মানব-AI থেকে AI-AI ইন্টারঅ্যাকশনে স্থানান্তর সেই বৃদ্ধিকে নাটকীয়ভাবে ত্বরান্বিত করবে। আধুনিক এজেন্টিক সিস্টেমগুলি KV ক্যাশ প্রয়োজনীয়তা সম্প্রসারণ করার সময় বিশাল রিজনিং টোকেন ভলিউম তৈরি করে—ঠিক যে বাধা এই আর্কিটেকচার লক্ষ্য করে।
NVIDIA দ্বারা উদ্ধৃত তৃতীয় পক্ষের SemiAnalysis InferenceMax বেঞ্চমার্ক দেখায় যে বর্তমান Blackwell সিস্টেমগুলি ইতিমধ্যে H200 এর তুলনায় প্রতি ওয়াটে 50x ভালো পারফরম্যান্স এবং প্রতি টোকেনে 35x কম খরচ প্রদান করে। Vera Rubin সেই নেতৃত্ব সম্প্রসারিত করার লক্ষ্য রাখে।
থার্মাল এবং পাওয়ার ইঞ্জিনিয়ারিং
তৃতীয় প্রজন্মের MGX র্যাক আর্কিটেকচার পূর্ববর্তী প্রজন্মের তুলনায় 6x বেশি র্যাক-লেভেল এনার্জি স্টোরেজ (প্রতি GPU 400 জুল) সহ Intelligent Power Smoothing প্রবর্তন করে। এটি পিক কারেন্ট চাহিদা 25% পর্যন্ত কমায় এবং বিশাল ব্যাটারি প্যাকের প্রয়োজনীয়তা দূর করে।
সমস্ত র্যাক 45°C উষ্ণ-জল ইনলেট তাপমাত্রায় কাজ করে, যা অনেক জলবায়ুতে ডেটা সেন্টারগুলিকে অ্যাম্বিয়েন্ট এয়ার কুলিং ব্যবহার করতে সক্ষম করে। NVIDIA দাবি করে যে এটি একই সুবিধা পাওয়ার বাজেটে 10% বেশি র্যাক যোগ করার জন্য যথেষ্ট পাওয়ার মুক্ত করে।
ভবিষ্যতের দিকে তাকিয়ে
প্রাথমিক POD কনফিগারেশনের বাইরে, NVIDIA আট র্যাক জুড়ে 576 GPU-তে স্কেলিং করে Vera Rubin Ultra NVL576 এবং প্রতি র্যাকে 144 GPU সহ NVL1152 লক্ষ্য করে পরবর্তী প্রজন্মের Kyber আর্কিটেকচার প্রিভিউ করেছে। রোডম্যাপ পরামর্শ দেয় যে NVIDIA AI অবকাঠামোর ভবিষ্যৎ হিসাবে মাল্টি-র্যাক NVLink ডোমেইনগুলি দেখে—শুধু বড় GPU নয়, বরং মৌলিকভাবে ভিন্ন সিস্টেম আর্কিটেকচার।
AI অবকাঠামো বিনিয়োগ পরিকল্পনা করা এন্টারপ্রাইজগুলির জন্য, বার্তাটি স্পষ্ট: AI কম্পিউটের অর্থনীতি চিপ-লেভেল থেকে সুবিধা-লেভেল অপটিমাইজেশনে স্থানান্তরিত হচ্ছে। যারা এখন ডেটা সেন্টার তৈরি করছেন তারা বর্তমান প্রজন্মের সিস্টেম এবং 2026 সালের শেষের দিকে Vera Rubin প্রাপ্যতার জন্য অপেক্ষা করার মধ্যে একটি পছন্দের মুখোমুখি হচ্ছেন।
চিত্রের উৎস: Shutterstock- nvidia
- ai অবকাঠামো
- vera rubin
- ডেটা সেন্টার
- এন্টারপ্রাইজ ai


