MaGGIe প্রাকৃতিক ছবিতে চুল রেন্ডারিং এবং ইনস্ট্যান্স পৃথকীকরণে দক্ষতা প্রদর্শন করে, জটিল, বহু-ইনস্ট্যান্স পরিস্থিতিতে MGM এবং InstMatt-কে ছাড়িয়ে যায়।MaGGIe প্রাকৃতিক ছবিতে চুল রেন্ডারিং এবং ইনস্ট্যান্স পৃথকীকরণে দক্ষতা প্রদর্শন করে, জটিল, বহু-ইনস্ট্যান্স পরিস্থিতিতে MGM এবং InstMatt-কে ছাড়িয়ে যায়।

শক্তিশালী মাস্ক-গাইডেড ম্যাটিং: নয়েজি ইনপুট এবং অবজেক্ট বহুমুখিতা পরিচালনা

2025/12/21 02:00
2 মিনিটে পড়া যাবে
এই বিষয়বস্তু সম্পর্কে মতামত বা উদ্বেগ জানাতে, অনুগ্রহ করে আমাদের সাথে [email protected] ঠিকানায় যোগাযোগ করুন

সারসংক্ষেপ এবং ১. ভূমিকা

  1. সম্পর্কিত কাজসমূহ

  2. MaGGIe

    ৩.১. দক্ষ মাস্কড গাইডেড ইনস্ট্যান্স ম্যাটিং

    ৩.২. ফিচার-ম্যাট টেম্পোরাল কনসিস্টেন্সি

  3. ইনস্ট্যান্স ম্যাটিং ডেটাসেট

    ৪.১. ইমেজ ইনস্ট্যান্স ম্যাটিং এবং ৪.২. ভিডিও ইনস্ট্যান্স ম্যাটিং

  4. পরীক্ষা-নিরীক্ষা

    ৫.১. ইমেজ ডেটার উপর প্রি-ট্রেনিং

    ৫.২. ভিডিও ডেটার উপর ট্রেনিং

  5. আলোচনা এবং তথ্যসূত্র

\ সম্পূরক উপাদান

  1. আর্কিটেকচারের বিস্তারিত

  2. ইমেজ ম্যাটিং

    ৮.১. ডেটাসেট তৈরি এবং প্রস্তুতি

    ৮.২. ট্রেনিং বিস্তারিত

    ৮.৩. পরিমাণগত বিস্তারিত

    ৮.৪. প্রাকৃতিক ছবিতে আরো গুণগত ফলাফল

  3. ভিডিও ম্যাটিং

    ৯.১. ডেটাসেট তৈরি

    ৯.২. ট্রেনিং বিস্তারিত

    ৯.৩. পরিমাণগত বিস্তারিত

    ৯.৪. আরো গুণগত ফলাফল

৮.৪. প্রাকৃতিক ছবিতে আরো গুণগত ফলাফল

চিত্র ১৩ চ্যালেঞ্জিং পরিস্থিতিতে আমাদের মডেলের কর্মক্ষমতা প্রদর্শন করে, বিশেষত চুলের অঞ্চলগুলি সঠিকভাবে রেন্ডার করায়। আমাদের ফ্রেমওয়ার্ক ধারাবাহিকভাবে বিস্তারিত সংরক্ষণে MGM⋆ কে ছাড়িয়ে যায়, বিশেষত জটিল ইনস্ট্যান্স ইন্টারঅ্যাকশনে। InstMatt এর সাথে তুলনায়, আমাদের মডেল অস্পষ্ট অঞ্চলে উন্নত ইনস্ট্যান্স বিচ্ছেদ এবং বিস্তারিত নির্ভুলতা প্রদর্শন করে।

\ চিত্র ১৪ এবং চিত্র ১৫ একাধিক ইনস্ট্যান্স জড়িত চরম ক্ষেত্রে আমাদের মডেল এবং পূর্ববর্তী কাজের কর্মক্ষমতা চিত্রিত করে। যদিও MGM⋆ ঘন ইনস্ট্যান্স পরিস্থিতিতে শব্দ এবং নির্ভুলতার সাথে লড়াই করে, আমাদের মডেল উচ্চ নির্ভুলতা বজায় রাখে। InstMatt, অতিরিক্ত ট্রেনিং ডেটা ছাড়াই, এই জটিল সেটিংসে সীমাবদ্ধতা দেখায়।

\ আমাদের মাস্ক-গাইডেড পদ্ধতির দৃঢ়তা চিত্র ১৬ তে আরও প্রদর্শিত হয়েছে। এখানে, আমরা MGM ভ্যারিয়েন্ট এবং SparseMat মাস্ক ইনপুটে অনুপস্থিত অংশগুলি পূর্বাভাসে যে চ্যালেঞ্জগুলির সম্মুখীন হয় তা তুলে ধরি, যা আমাদের মডেল সমাধান করে। তবে, এটি লক্ষ করা গুরুত্বপূর্ণ যে আমাদের মডেল একটি হিউম্যান ইনস্ট্যান্স সেগমেন্টেশন নেটওয়ার্ক হিসাবে ডিজাইন করা হয়নি। চিত্র ১৭ তে দেখানো হয়েছে, আমাদের ফ্রেমওয়ার্ক ইনপুট গাইডেন্স মেনে চলে, একই মাস্কে একাধিক ইনস্ট্যান্স থাকলেও সুনির্দিষ্ট আলফা ম্যাট পূর্বাভাস নিশ্চিত করে।

\ পরিশেষে, চিত্র ১২ এবং চিত্র ১১ আমাদের মডেলের সাধারণীকরণ ক্ষমতার উপর জোর দেয়। মডেলটি পটভূমি থেকে মানব বিষয় এবং অন্যান্য বস্তু উভয়ই সঠিকভাবে নিষ্কাশন করে, বিভিন্ন পরিস্থিতি এবং অবজেক্ট টাইপ জুড়ে এর বহুমুখিতা প্রদর্শন করে।

\ সমস্ত উদাহরণ হল ইন্টারনেট ছবি গ্রাউন্ড-ট্রুথ ছাড়া এবং r101fpn400e থেকে মাস্ক গাইডেন্স হিসাবে ব্যবহার করা হয়েছে।

\ চিত্র ১৩. আমাদের মডেল প্রাকৃতিক ছবিতে অত্যন্ত বিস্তারিত আলফা ম্যাট তৈরি করে। আমাদের ফলাফল দেখায় যে এটি ব্যয়বহুল কম্পিউটেশনাল খরচ ছাড়াই পূর্ববর্তী ইনস্ট্যান্স-অজ্ঞেয়বাদী এবং ইনস্ট্যান্স-সচেতনতা পদ্ধতিগুলির সাথে সঠিক এবং তুলনীয়। লাল বর্গ প্রতিটি ইনস্ট্যান্সের জন্য বিস্তারিত অঞ্চলগুলি জুম করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ চিত্র ১৪. আমাদের ফ্রেমওয়ার্ক অনেক ইনস্ট্যান্স সহ চরম ক্ষেত্রে সুনির্দিষ্টভাবে ইনস্ট্যান্সগুলি আলাদা করে। যদিও MGM প্রায়ই ইনস্ট্যান্সগুলির মধ্যে ওভারল্যাপিং ঘটায় এবং MGM⋆ শব্দ ধারণ করে, আমাদের বাহ্যিক ডেটাসেটে প্রশিক্ষিত InstMatt এর সাথে সমান ফলাফল তৈরি করে। লাল তীর ত্রুটি নির্দেশ করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ চিত্র ১৫. আমাদের ফ্রেমওয়ার্ক একক পাসে সুনির্দিষ্টভাবে ইনস্ট্যান্সগুলি আলাদা করে। প্রস্তাবিত সমাধান পূর্বাভাস/পরিমার্জন পাঁচবার চালানো ছাড়াই InstMatt এবং MGM এর সাথে তুলনীয় ফলাফল দেখায়। লাল তীর ত্রুটি নির্দেশ করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ চিত্র ১৬. MGM এবং SparseMat থেকে ভিন্ন, আমাদের মডেল ইনপুট গাইডেন্স মাস্কে দৃঢ়। অ্যাটেনশন হেড সহ, আমাদের মডেল InstMatt এর মতো ইনস্ট্যান্সগুলির মধ্যে জটিল পরিমার্জন ছাড়াই মাস্ক ইনপুটগুলিতে আরও স্থিতিশীল ফলাফল তৈরি করে। লাল তীর ত্রুটি নির্দেশ করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ চিত্র ১৭. আমাদের সমাধান মাল্টি-ইনস্ট্যান্স মাস্ক গাইডেন্সের সাথে সঠিকভাবে কাজ করে। যখন একটি গাইডেন্স মাস্কে একাধিক ইনস্ট্যান্স বিদ্যমান থাকে, আমরা এখনও সেই ইনস্ট্যান্সগুলির জন্য সঠিক ইউনিয়ন আলফা ম্যাট তৈরি করি। লাল তীর ত্রুটি বা লাল বক্সে জুম-ইন অঞ্চল নির্দেশ করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ সারণি ১২. HIM2K+M-HIM2K এ পরিমাণগত ফলাফলের বিস্তারিত (সারণি ৫ এর সম্প্রসারণ)। ধূসর পুনরায় প্রশিক্ষণ ছাড়াই পাবলিক ওয়েট নির্দেশ করে।

\ সারণি ১২. HIM2K+M-HIM2K এ পরিমাণগত ফলাফলের বিস্তারিত (সারণি ৫ এর সম্প্রসারণ)। ধূসর পুনরায় প্রশিক্ষণ ছাড়াই পাবলিক ওয়েট নির্দেশ করে। (অব্যাহত)

\ সারণি ১২. HIM2K+M-HIM2K এ পরিমাণগত ফলাফলের বিস্তারিত (সারণি ৫ এর সম্প্রসারণ)। ধূসর পুনরায় প্রশিক্ষণ ছাড়াই পাবলিক ওয়েট নির্দেশ করে। (অব্যাহত)

\ সারণি ১২. HIM2K+M-HIM2K এ পরিমাণগত ফলাফলের বিস্তারিত (সারণি ৫ এর সম্প্রসারণ)। ধূসর পুনরায় প্রশিক্ষণ ছাড়াই পাবলিক ওয়েট নির্দেশ করে। (অব্যাহত)

\ সারণি ১৩. V-HIM60 এ প্রস্তাবিত টেম্পোরাল কনসিস্টেন্সি মডিউলের কার্যকারিতা (সারণি ৬ এর সম্প্রসারণ)। দ্বি-দিকীয় Conv-GRU এবং ফরওয়ার্ড-ব্যাকওয়ার্ড ফিউশনের সংমিশ্রণ তিনটি টেস্ট সেটে সর্বোত্তম সামগ্রিক কর্মক্ষমতা অর্জন করে। বোল্ড প্রতিটি স্তরের জন্য সেরা হাইলাইট করে।

\

:::info লেখকগণ:

(১) চুয়ং হুইন, ইউনিভার্সিটি অফ মেরিল্যান্ড, কলেজ পার্ক ([email protected]);

(২) সেউং উগ ও, অ্যাডোব রিসার্চ (seoh,[email protected]);

(৩) অভিনব শ্রীবাস্তব, ইউনিভার্সিটি অফ মেরিল্যান্ড, কলেজ পার্ক ([email protected]);

(৪) জুন-ইয়াং লি, অ্যাডোব রিসার্চ ([email protected])।

:::


:::info এই গবেষণাপত্রটি CC by 4.0 Deed (Attribution 4.0 International) লাইসেন্সের অধীনে arxiv এ উপলব্ধ

:::

\

মার্কেটের সুযোগ
Mask Network লোগো
Mask Network প্রাইস(MASK)
$0.4475
$0.4475$0.4475
-1.27%
USD
Mask Network (MASK) লাইভ প্রাইস চার্ট
ডিসক্লেইমার: এই সাইটে পুনঃপ্রকাশিত নিবন্ধগুলো সর্বসাধারণের জন্য উন্মুক্ত প্ল্যাটফর্ম থেকে সংগ্রহ করা হয়েছে এবং শুধুমাত্র তথ্যের উদ্দেশ্যে প্রদান করা হয়েছে। এগুলো আবশ্যিকভাবে MEXC-এর মতামতকে প্রতিফলিত করে না। সমস্ত অধিকার মূল লেখকদের কাছে সংরক্ষিত রয়েছে। আপনি যদি মনে করেন কোনো কনটেন্ট তৃতীয় পক্ষের অধিকার লঙ্ঘন করেছে, তাহলে অনুগ্রহ করে অপসারণের জন্য [email protected] এ যোগাযোগ করুন। MEXC কনটেন্টের সঠিকতা, সম্পূর্ণতা বা সময়োপযোগিতা সম্পর্কে কোনো গ্যারান্টি দেয় না এবং প্রদত্ত তথ্যের ভিত্তিতে নেওয়া কোনো পদক্ষেপের জন্য দায়ী নয়। এই কনটেন্ট কোনো আর্থিক, আইনগত বা অন্যান্য পেশাদার পরামর্শ নয় এবং এটি MEXC-এর সুপারিশ বা সমর্থন হিসেবে গণ্য করা উচিত নয়।

আপনি আরও পছন্দ করতে পারেন

আশ্চর্যজনক পতন: DeFi সেক্টর আমানতে $৪৫ বিলিয়ন ক্ষতির সম্মুখীন

আশ্চর্যজনক পতন: DeFi সেক্টর আমানতে $৪৫ বিলিয়ন ক্ষতির সম্মুখীন

পোস্টটি Surprising Plunge: DeFi Sector Faces $45 Billion Loss in Deposits BitcoinEthereumNews.com-এ প্রকাশিত হয়েছে। বিকেন্দ্রীকৃত অর্থায়ন (DeFi) স্পেস সাক্ষী হচ্ছে
শেয়ার করুন
BitcoinEthereumNews2026/03/15 11:46
পরবর্তী 1000x মেমে কয়েন? APEMARS 4,297%+ ROI সহ নতুনদের জন্য দেখার জন্য সেরা 6টি ক্রিপ্টো

পরবর্তী 1000x মেমে কয়েন? APEMARS 4,297%+ ROI সহ নতুনদের জন্য দেখার জন্য সেরা 6টি ক্রিপ্টো

২০২৬ সালে মিম কয়েন বাজার নতুন করে আগ্রহ আকর্ষণ করছে, যা কমিউনিটি-চালিত গতিবেগ এবং ভাইরাল ট্রেন্ড দ্বারা চালিত। Dogecoin, Shiba Inu, Pepe, Bonk এর মতো জনপ্রিয় কয়েন
শেয়ার করুন
Techbullion2026/03/15 10:15
প্রাথমিক বিটকয়েন সমর্থক Erik Voorhees আবারও সোনার টোকেন ক্রয় করেছেন, XAUT এবং PAXG কিনতে মোট $23.76 মিলিয়ন ব্যয় করেছেন।

প্রাথমিক বিটকয়েন সমর্থক Erik Voorhees আবারও সোনার টোকেন ক্রয় করেছেন, XAUT এবং PAXG কিনতে মোট $23.76 মিলিয়ন ব্যয় করেছেন।

PANews ১৫ মার্চ রিপোর্ট করেছে যে, Lookonchain মনিটরিং অনুযায়ী, Erik Voorhees, একজন প্রাথমিক Bitcoin সমর্থক এবং ShapeShift-এর প্রতিষ্ঠাতা, পুনরায় ক্রয় শুরু করেছেন
শেয়ার করুন
PANews2026/03/15 10:57