MaGGIe در رندر کردن مو و جداسازی نمونه‌ها در تصاویر طبیعی عملکرد عالی دارد و در سناریوهای پیچیده و چند نمونه‌ای از MGM و InstMatt بهتر عمل می‌کند.MaGGIe در رندر کردن مو و جداسازی نمونه‌ها در تصاویر طبیعی عملکرد عالی دارد و در سناریوهای پیچیده و چند نمونه‌ای از MGM و InstMatt بهتر عمل می‌کند.

ماتینگ قوی با راهنمایی ماسک: مدیریت ورودی‌های پرنویز و تطبیق‌پذیری اشیاء

2025/12/21 02:00
مدت مطالعه: 3 دقیقه
برای ارائه بازخورد یا طرح هرگونه نگرانی درباره این محتوا، لطفاً با ما از طریق [email protected] تماس بگیرید.

خلاصه و 1. مقدمه

  1. کارهای مرتبط

  2. MaGGIe

    3.1. ماتینگ نمونه هدایت‌شده ماسک‌دار کارآمد

    3.2. ثبات زمانی ویژگی-مات

  3. مجموعه داده‌های ماتینگ نمونه

    4.1. ماتینگ نمونه تصویر و 4.2. ماتینگ نمونه ویدیو

  4. آزمایش‌ها

    5.1. پیش‌آموزش بر روی داده تصویر

    5.2. آموزش بر روی داده ویدیو

  5. بحث و منابع

\ مطالب تکمیلی

  1. جزئیات معماری

  2. ماتینگ تصویر

    8.1. تولید و آماده‌سازی مجموعه داده

    8.2. جزئیات آموزش

    8.3. جزئیات کمی

    8.4. نتایج کیفی بیشتر بر روی تصاویر طبیعی

  3. ماتینگ ویدیو

    9.1. تولید مجموعه داده

    9.2. جزئیات آموزش

    9.3. جزئیات کمی

    9.4. نتایج کیفی بیشتر

8.4. نتایج کیفی بیشتر بر روی تصاویر طبیعی

شکل 13 عملکرد مدل ما را در سناریوهای چالش‌برانگیز، به‌ویژه در رندر دقیق نواحی مو نشان می‌دهد. چارچوب ما به‌طور مداوم از MGM⋆ در حفظ جزئیات، به‌ویژه در تعاملات پیچیده نمونه، بهتر عمل می‌کند. در مقایسه با InstMatt، مدل ما جداسازی نمونه و دقت جزئیات برتری در نواحی مبهم نشان می‌دهد.

\ شکل 14 و شکل 15 عملکرد مدل ما و کارهای قبلی را در موارد افراطی شامل نمونه‌های متعدد نشان می‌دهند. در حالی که MGM⋆ با نویز و دقت در سناریوهای نمونه متراکم دست و پنجه نرم می‌کند، مدل ما دقت بالایی را حفظ می‌کند. InstMatt، بدون داده آموزشی اضافی، محدودیت‌هایی را در این تنظیمات پیچیده نشان می‌دهد.

\ استحکام رویکرد هدایت‌شده با ماسک ما بیشتر در شکل 16 نشان داده شده است. در اینجا، ما چالش‌های پیش روی انواع MGM و SparseMat در پیش‌بینی قسمت‌های گمشده در ورودی‌های ماسک را برجسته می‌کنیم که مدل ما آن‌ها را برطرف می‌کند. با این حال، توجه به این نکته مهم است که مدل ما به‌عنوان یک شبکه بخش‌بندی نمونه انسانی طراحی نشده است. همان‌طور که در شکل 17 نشان داده شده است، چارچوب ما به راهنمایی ورودی پایبند است و پیش‌بینی آلفا مات دقیق را حتی با نمونه‌های متعدد در همان ماسک تضمین می‌کند.

\ در نهایت، شکل 12 و شکل 11 قابلیت‌های تعمیم مدل ما را برجسته می‌کنند. مدل به‌طور دقیق هم سوژه‌های انسانی و هم اشیاء دیگر را از پس‌زمینه استخراج می‌کند و تطبیق‌پذیری آن را در سناریوها و انواع اشیاء مختلف نشان می‌دهد.

\ همه نمونه‌ها تصاویر اینترنتی بدون ground-truth هستند و ماسک از r101fpn400e به‌عنوان راهنما استفاده شده است.

\ شکل 13. مدل ما آلفا مات بسیار دقیقی را بر روی تصاویر طبیعی تولید می‌کند. نتایج ما نشان می‌دهد که دقیق و قابل مقایسه با روش‌های قبلی نادیده‌گیرنده نمونه و آگاه از نمونه بدون هزینه‌های محاسباتی گران است. مربع‌های قرمز نواحی جزئیات را برای هر نمونه بزرگنمایی می‌کنند. (بهتر است در رنگی و زوم دیجیتال مشاهده شود).

\ شکل 14. چارچوب ما به‌طور دقیق نمونه‌ها را در یک مورد افراطی با نمونه‌های زیاد جدا می‌کند. در حالی که MGM اغلب باعث همپوشانی بین نمونه‌ها می‌شود و MGM⋆ حاوی نویز است، ما نتایج برابر با InstMatt آموزش‌دیده بر روی مجموعه داده خارجی تولید می‌کنیم. فلش قرمز خطاها را نشان می‌دهد. (بهتر است در رنگی و زوم دیجیتال مشاهده شود).

\ شکل 15. چارچوب ما به‌طور دقیق نمونه‌ها را در یک پاس واحد جدا می‌کند. راه‌حل پیشنهادی نتایج قابل مقایسه‌ای با InstMatt و MGM بدون اجرای پیش‌بینی/اصلاح پنج بار نشان می‌دهد. فلش قرمز خطاها را نشان می‌دهد. (بهتر است در رنگی و زوم دیجیتال مشاهده شود).

\ شکل 16. برخلاف MGM و SparseMat، مدل ما نسبت به ماسک راهنمای ورودی مقاوم است. با سر توجه، مدل ما نتایج پایدارتری را به ورودی‌های ماسک بدون اصلاح پیچیده بین نمونه‌ها مانند InstMatt تولید می‌کند. فلش قرمز خطاها را نشان می‌دهد. (بهتر است در رنگی و زوم دیجیتال مشاهده شود).

\ شکل 17. راه‌حل ما به‌درستی با راهنماهای ماسک چند-نمونه‌ای کار می‌کند. وقتی نمونه‌های متعدد در یک ماسک راهنما وجود دارند، ما همچنان آلفا مات اتحاد صحیح برای آن نمونه‌ها تولید می‌کنیم. فلش قرمز خطاها یا ناحیه بزرگنمایی در جعبه قرمز را نشان می‌دهد. (بهتر است در رنگی و زوم دیجیتال مشاهده شود).

\ جدول 12. جزئیات نتایج کمی بر روی HIM2K+M-HIM2K (توسعه جدول 5). خاکستری وزن عمومی را بدون آموزش مجدد نشان می‌دهد.

\ جدول 12. جزئیات نتایج کمی بر روی HIM2K+M-HIM2K (توسعه جدول 5). خاکستری وزن عمومی را بدون آموزش مجدد نشان می‌دهد. (ادامه)

\ جدول 12. جزئیات نتایج کمی بر روی HIM2K+M-HIM2K (توسعه جدول 5). خاکستری وزن عمومی را بدون آموزش مجدد نشان می‌دهد. (ادامه)

\ جدول 12. جزئیات نتایج کمی بر روی HIM2K+M-HIM2K (توسعه جدول 5). خاکستری وزن عمومی را بدون آموزش مجدد نشان می‌دهد. (ادامه)

\ جدول 13. اثربخشی ماژول‌های ثبات زمانی پیشنهادی بر روی V-HIM60 (توسعه جدول 6). ترکیب Conv-GRU دوجهته و ترکیب رو به جلو-رو به عقب بهترین عملکرد کلی را در سه مجموعه آزمون به دست می‌آورد. پررنگ بهترین را برای هر سطح برجسته می‌کند.

\

:::info نویسندگان:

(1) Chuong Huynh، دانشگاه مریلند، کالج پارک ([email protected]

(2) Seoung Wug Oh، تحقیقات Adobe (seoh,[email protected]

(3) Abhinav Shrivastava، دانشگاه مریلند، کالج پارک ([email protected]

(4) Joon-Young Lee، تحقیقات Adobe ([email protected]).

:::


:::info این مقاله در arxiv تحت مجوز CC by 4.0 Deed (Attribution 4.0 International) در دسترس است.

:::

\

فرصت‌ های بازار
لوگو Mask Network
قیمت لحظه ای Mask Network(MASK)
$0.5213
$0.5213$0.5213
+4.42%
USD
نمودار قیمت لحظه ای Mask Network (MASK)
سلب مسئولیت: مطالب بازنشرشده در این وب‌ سایت از منابع عمومی گردآوری شده‌ اند و صرفاً به‌ منظور اطلاع‌ رسانی ارائه می‌ شوند. این مطالب لزوماً بازتاب‌ دهنده دیدگاه‌ ها یا مواضع MEXC نیستند. کلیه حقوق مادی و معنوی آثار متعلق به نویسندگان اصلی است. در صورت مشاهده هرگونه محتوای ناقض حقوق اشخاص ثالث، لطفاً از طریق آدرس ایمیل [email protected] با ما تماس بگیرید تا مورد بررسی و حذف قرار گیرد.MEXC هیچ‌ گونه تضمینی نسبت به دقت، جامعیت یا به‌ روزبودن اطلاعات ارائه‌ شده ندارد و مسئولیتی در قبال هرگونه اقدام یا تصمیم‌ گیری مبتنی بر این اطلاعات نمی‌ پذیرد. همچنین، محتوای منتشرشده نباید به‌عنوان توصیه مالی، حقوقی یا حرفه‌ ای تلقی شود و به منزله پیشنهاد یا تأیید رسمی از سوی MEXC نیست.

محتوای پیشنهادی

اسکات جنینگز پس از تهدید رکیکانه در CNN به شدت مسخره شد: 'خودش را تحقیر کرد'

اسکات جنینگز پس از تهدید رکیکانه در CNN به شدت مسخره شد: 'خودش را تحقیر کرد'

استراتژیست جمهوری‌خواه اسکات جنینگز در شب پنج‌شنبه به شدت مورد تمسخر قرار گرفت، پس از اینکه تهدیدی رکیک علیه یکی از اعضای پانل در برنامه «NewsNight» شبکه CNN مطرح کرد. پانل درباره
اشتراک
Rawstory2026/05/01 11:43
افت اتریوم موج خرید ۱ میلیارد دلاری را برمی‌انگیزد، علی‌رغم هشدار تندروانه فدرال رزرو درباره تورم — چه چیزی تغییر کرد؟

افت اتریوم موج خرید ۱ میلیارد دلاری را برمی‌انگیزد، علی‌رغم هشدار تندروانه فدرال رزرو درباره تورم — چه چیزی تغییر کرد؟

اتریوم در تلاش است تا سطح ۲,۲۵۰ دلار را حفظ کند، زیرا فشار فروش دوباره خود را نشان می‌دهد. و بازار با مقاومتی روبه‌رو است که هر تلاش برای بازیابی را محدود کرده است در
اشتراک
NewsBTC2026/05/01 11:00
پالایشگاه دانگوته برنامه عرضه اولیه سهام (IPO) با لیستینگ اولیه ۴۰ میلیارد دلاری در سراسر آفریقا را دارد

پالایشگاه دانگوته برنامه عرضه اولیه سهام (IPO) با لیستینگ اولیه ۴۰ میلیارد دلاری در سراسر آفریقا را دارد

پالایشگاه دانگوته با هدف ارزش‌گذاری ۴۰ میلیارد دلاری در چندین بورس آفریقایی برای تأمین مالی توسعه و رشد منطقه‌ای، برنامه‌ریزی برای عرضه اولیه عمومی دارد. پست پالایشگاه دانگوته برنامه لیستینگ اولیه ۴۰ میلیارد دلاری را دنبال می‌کند
اشتراک
Furtherafrica2026/05/01 11:00