OpenAI এবং Paradigm AI স্মার্ট কন্ট্রাক্ট হ্যাকিং পরীক্ষা করতে EVMbench চালু করেছে
Rongchai Wang ০৫ মার্চ, ২০২৬ ০০:৫৫
নতুন বেঞ্চমার্ক AI এজেন্টদের স্মার্ট কন্ট্রাক্ট দুর্বলতা সনাক্ত, প্যাচ এবং শোষণ করার ক্ষমতা মূল্যায়ন করে। GPT-5.3-Codex শোষণ কাজে ৭২.২% স্কোর করেছে।
OpenAI এবং ক্রিপ্টো ভেঞ্চার ফার্ম Paradigm EVMbench প্রকাশ করেছে, একটি বেঞ্চমার্ক যা পরিমাপ করে AI এজেন্টরা Ethereum স্মার্ট কন্ট্রাক্টে দুর্বলতা কতটা ভালভাবে খুঁজে পেতে, ঠিক করতে এবং শোষণ করতে পারে। ঘোষণাটি এমন সময়ে এসেছে যখন AI-চালিত নিরাপত্তা সরঞ্জামগুলি DeFi প্রোটোকলে লক করা $১০০ বিলিয়ন-এর বেশি রক্ষা করার জন্য প্রতিযোগিতা করছে।
বেঞ্চমার্কটি ৪০টি প্রকৃত নিরাপত্তা অডিট থেকে নেওয়া ১২০টি উচ্চ-গুরুতর দুর্বলতা থেকে আঁকা হয়েছে, বেশিরভাগই Code4rena প্রতিযোগিতা থেকে। এতে Tempo-র নিরাপত্তা পর্যালোচনা থেকে দুর্বলতা পরিস্থিতিও অন্তর্ভুক্ত রয়েছে, যা স্টেবলকয়েন পেমেন্টের জন্য নির্মিত একটি Layer 1 ব্লকচেইন।
স্মার্ট কন্ট্রাক্ট ভাঙার তিনটি উপায়
EVMbench তিনটি স্বতন্ত্র মোডে AI এজেন্ট পরীক্ষা করে। Detect মোডে, এজেন্টরা কন্ট্রাক্ট রিপোজিটরি অডিট করে এবং পরিচিত দুর্বলতা খুঁজে পাওয়ার জন্য স্কোর পায়। Patch মোডে এজেন্টদের বিদ্যমান কার্যকারিতা ভাঙা ছাড়াই দুর্বল কোড ঠিক করতে হয়। Exploit মোড সবচেয়ে আক্রমণাত্মক—এজেন্টদের অবশ্যই স্যান্ডবক্সড ব্লকচেইনে স্থাপন করা কন্ট্রাক্টের বিরুদ্ধে প্রকৃত তহবিল-নিষ্কাশন আক্রমণ চালাতে হবে।
ফলাফলগুলি দেখায় যে এই ডোমেইনে AI ক্ষমতা কত দ্রুত উন্নতি করছে। Codex CLI-এর মাধ্যমে চলা GPT-5.3-Codex শোষণ কাজে ৭২.২% সাফল্যের হার অর্জন করেছে। এটি মাত্র ছয় মাস আগে চালু হওয়া GPT-5-এর ৩১.৯% স্কোরের দ্বিগুণেরও বেশি।
আকর্ষণীয়ভাবে, AI এজেন্টরা রক্ষা করার চেয়ে আক্রমণে ভাল পারফর্ম করে। শোষণ সেটিংয়ে একটি স্পষ্ট উদ্দেশ্য রয়েছে—তহবিল নিষ্কাশন না হওয়া পর্যন্ত পুনরাবৃত্তি চালিয়ে যান। সনাক্তকরণ এবং প্যাচিং কঠিন প্রমাণিত হয়েছে। এজেন্টরা কখনও কখনও সম্পূর্ণভাবে অডিট করার পরিবর্তে একটি বাগ খুঁজে পাওয়ার পরে থেমে যায়, এবং সূক্ষ্ম দুর্বলতা অপসারণ করার সময় সম্পূর্ণ কন্ট্রাক্ট কার্যকারিতা বজায় রাখা চ্যালেঞ্জিং থেকে যায়।
লক্ষণীয় প্রকৃত সীমাবদ্ধতা
OpenAI স্বীকার করেছে যে EVMbench বাস্তব-বিশ্বের কন্ট্রাক্ট নিরাপত্তার সম্পূর্ণ অসুবিধা ক্যাপচার করে না। Uniswap বা Aave-এর মতো ব্যাপকভাবে স্থাপন করা প্রোটোকলগুলি অডিট প্রতিযোগিতা কোডের চেয়ে অনেক বেশি যাচাই-বাছাই করা হয়। বেঞ্চমার্কটি এটিও যাচাই করতে পারে না যে একটি এজেন্ট বৈধ দুর্বলতা খুঁজে পায় কিনা যা মানব অডিটররা মিস করেছে—এটি শুধুমাত্র পরিচিত সমস্যাগুলির বিরুদ্ধে পরীক্ষা করে।
শোষণ পরিবেশ ফর্কড মেইননেট অবস্থার পরিবর্তে একটি পরিষ্কার স্থানীয় Anvil ইনস্ট্যান্সে চলে, এবং সময়-নির্ভর আক্রমণগুলি সুযোগের বাইরে পড়ে। আপাতত শুধুমাত্র একক-চেইন পরিবেশ।
প্রতিরক্ষামূলক গবেষণার জন্য $১০M
EVMbench-এর পাশাপাশি, OpenAI বিশেষভাবে প্রতিরক্ষামূলক নিরাপত্তা গবেষণার জন্য API ক্রেডিটে $১০ মিলিয়ন প্রতিশ্রুতি দিয়েছে। কোম্পানিটি তার Aardvark নিরাপত্তা গবেষণা এজেন্ট আরও ব্যবহারকারীদের কাছে সম্প্রসারিত করছে এবং বিনামূল্যে কোডবেস স্ক্যানিংয়ের জন্য ওপেন-সোর্স রক্ষণাবেক্ষণকারীদের সাথে অংশীদারিত্ব করছে।
সময়টি গুরুত্বপূর্ণ। AI এজেন্টরা কন্ট্রাক্ট শোষণে ভাল হওয়ার সাথে সাথে দুর্বলতা আবিষ্কার এবং শোষণের মধ্যে ব্যবধান সংকুচিত হচ্ছে। যে প্রোটোকল টিমগুলি AI-সহায়তা অডিটিং ব্যবহার করছে না তারা ক্রমবর্ধমানভাবে আক্রমণকারীদের বিরুদ্ধে নিজেদের অসুবিধায় খুঁজে পাবে যারা এটি করছে।
OpenAI EVMbench-এর কাজ, টুলিং এবং মূল্যায়ন কাঠামো প্রকাশ্যে প্রকাশ করেছে। DeFi ডেভেলপার এবং নিরাপত্তা গবেষকদের জন্য, এটি একটি পরিমাপের লাঠি এবং AI ক্ষমতা কোথায় যাচ্ছে সে সম্পর্কে একটি সতর্কতা উভয়ই।
ছবির উৎস: Shutterstock- openai
- paradigm
- স্মার্ট কন্ট্রাক্ট
- ai নিরাপত্তা
- defi


