نویسنده: Deep Web Tencent News
درست زمانی که OpenClaw به دلیل شیوع "پرورش میگو" و جنجال پیرامون "کشتن میگو" به یک روند برتر در حوزه هوش مصنوعی تبدیل شد، تولیدکنندگان پیشرو تلفن همراه که عمیقاً درگیر هوش مصنوعی لبه بودند، نتوانستند خودداری کنند و شروع به استقرار و "رام کردن" Claw خود کردند.

در تاریخ 1404/12/15، AI Agent موبایل شیائومی، شیائومی miclaw، رسماً آزمایش بسته محدود در مقیاس کوچک را از طریق کدهای دعوت راهاندازی کرد و اولین تولیدکننده تلفن همراه داخلی شد که "Claw" را به صورت داخلی آزمایش کرد. به دنبال این، هواوی، هانر، OPPO و سایرین تست عمومی بتا Claw خود را اعلام کردند.
در میان آنها، هواوی رسماً اضافه کردن حالت OpenClaw به Xiaoyi را اعلام کرد و سپس نسخه بتای Xiaoyi Claw را راهاندازی کرد؛ هانر راهاندازی "Honor Lobster Universe" را اعلام کرد که از پرورش میگو با یک کلیک در رایانه شخصی و تبلت پشتیبانی میکند و در آینده با دسترسی میگو سایر دستگاههای اکوسیستم سازگار خواهد بود؛ Chen Xi، مدیر طراحی ColorOS اوپو، برخی از عملکردهای Xiaobu Claw را در رسانههای اجتماعی نشان داد و بیان کرد که "Xiaobu Claw هنوز مشکلات امنیتی دارد که باید حل شوند".
به عبارت دیگر، ابتکار فعلی "پرورش میگو" توسط تولیدکنندگان تلفن همراه عمدتاً در مرحله آزمایش داخلی است و هیچ جدول زمانی مشخصی برای راهاندازی گسترده آن وجود ندارد.
به عنوان مثال، اپلیکیشن موبایل miclaw شیائومی در حال حاضر فقط برای تست عمومی بتا محدود در سری شیائومی 17، شیائومی 15S Pro و سری Redmi K90 در دسترس است. کاربران پس از دریافت کد دعوت و بهروزرسانی سیستم خود میتوانند به اپلیکیشن موبایل شیائومی miclaw دسترسی پیدا کنند. "در حال حاضر هیچ برنامهای برای دریافت هزینه از کاربران در طول دوره آزمایش بسته وجود ندارد"، گفت Lu Weibing، شریک و رئیس گروه شیائومی.
در مورد استقرار نسخه موبایل "Lobster" توسط تولیدکنندگان تلفن همراه، یک فرد آگاه صنعت فاش کرد که "OpenClaw اساساً یک چارچوب متنباز است که شامل یک اکوسیستم مهارتها و افزونههای شخص ثالث است و همچنین میتواند مدلهای بزرگ مختلف را فراخوانی کند. برای کاربران عادی، استقرار OpenClaw دارای مانع ورودی بالایی است، اما برای تولیدکنندگان تلفن همراه، هیچ مشکل فنی وجود ندارد. مشکل در مسائلی مانند اخذ مجوز، امنیت اطلاعات کاربر و انطباق قانونی نهفته است."
"تولیدکنندگان اصلی تلفن همراه با صدها میلیون کاربر عادی سر و کار دارند. هر عملکرد هوش مصنوعی باید به طور کامل تأیید شود قبل از اینکه بتوان آن را منتشر کرد و اطمینان حاصل شود که تجربهای بالغ، ایمن و پایدار ارائه میشود"، یک کارمند تولیدکننده تلفن همراه فاش کرد.
فروشندگان مدل بزرگ مشتاق استقرار "Lobster" هستند که میتوان آن را به سادگی به عنوان کسبوکار "تبدیل قدرت محاسباتی به پول" درک کرد، یعنی باعث شدن AI Agent ها مدل را مکرراً فراخوانی کرده و وظایف پیچیدهای را انجام دهند، در نتیجه توکنهای بیشتری مصرف شود و مستقیماً درآمد API افزایش یابد.
با این حال، این منطق در صنعت تلفن همراه صادق نیست. پس از هزینه کردن هزاران یا حتی دهها هزار یوان برای یک تلفن، کاربران به ندرت مایل به پرداخت اضافی برای هر وظیفه خاص هستند. از آنجا که نمیتوانند مستقیماً از "فروش وظایف" سود ببرند، چرا تولیدکنندگان پیشرو تلفن همراه هنوز مایل به تحمل هزینههای قدرت محاسباتی و توکنها برای آزمایش داخلی یک نسخه موبایل اختصاصی "Claw" هستند؟
یک دلیل این است که، در مسیر از دستیاران سنتی هوش مصنوعی موبایل به "AI Agent های شخصی"، OpenClaw بیشتر و بیشتر به شکل ایدهآل یک "دستیار فوقالعاده" نزدیک میشود.
برخلاف دستیاران صوتی قبلی که فقط میتوانستند به صورت منفعلانه پاسخ دهند، OpenClaw بیشتر شبیه یک "کارمند دیجیتال" است که 7×24 آنلاین است و به کاربران عادی اجازه میدهد برای اولین بار واقعاً احتمال واقعی جایگزینی نیروی انسانی توسط هوش مصنوعی را تجربه کنند.
از منطق زیربنایی OpenClaw، ارزش اصلی آن در "خودمختاری" قوی آن نهفته است. این مرزهای جعبه چت را میشکند. تا زمانی که مهارتهای مربوطه پیکربندی شده و توکنهای کافی مجوز داده شوند، OpenClaw میتواند عادات و وظایف کاربر را به خاطر بسپارد، مراحل را به طور خودمختار برنامهریزی کند، ابزارها را فراخوانی کرده و نرمافزار را اجرا کند، تا زمانی که نتیجه نهایی بازگردانده شود.
با این حال، برای رام کردن واقعی این "خودمختاری" که در ابر شناور است روی صفحه کوچک یک تلفن همراه، اضافه کردن ساده برنامهها به وضوح کافی نیست. نیاز به تولیدکنندگان تلفن همراه دارد تا بازسازی عمیق و از پایین به بالای سیستم عامل را انجام دهند.
از نظر مسیرهای پیادهسازی خاص، هم Claw هواوی و هم miclaw شیائومی انتخاب کردهاند که به عنوان "برنامههای سطح سیستم" وارد بازار شوند. این رویکرد اساساً عملکردهای نرمافزاری گسسته قبلی، مجوزهای سیستم و حتی قابلیتهای میان دستگاهی را در مهارتهای یکپارچهای که میتوانند توسط AI Agent فراخوانی شوند، کپسوله میکند و سپس آنها را از طریق یک موتور استنتاج-اجرای خودساخته به صورت ارگانیک به هم متصل میکند.
با گرفتن miclaw شیائومی به عنوان مثال، بیش از 50 ابزار سیستمی و خدمات اکوسیستم را یکپارچه میکند تا یک موتور حلقه بسته "ادراک-استدلال-اجرا" بسازد. وقتی با دستورات کاربر مواجه میشود، موتور به طور خودمختار مراحل را تجزیه، ابزارها را تطبیق، پارامترها را تعیین و به طور مداوم بر اساس نتایج اجرا تجدیدنظر میکند تا زمانی که وظیفه به طور کامل تحویل داده شود.
Xiaoyi Claw هواوی مستقیماً بر روی پلتفرم HarmonyOS ساخته شده است. "Xiaoyi Claw دارای سه مزیت اصلی است: مجوزهای سطح سیستم (دسترسی مستقیم به عملکردهای زیربنایی بدون تغییر مسیر برنامه شخص ثالث)، همکاری کامل-سناریو (ارتباط بیدرز بین تلفنهای همراه، رایانههای شخصی، سیستمهای داخل خودرو و خانههای هوشمند) و جداسازی امنیت داده (پردازش محلی دادههای حریم خصوصی کاربر)"، یک فرد آگاه هواوی فاش کرد.
با این حال، استقرار "Lobster" بر روی تلفنهای همراه چالشهایی فراتر از فناوری و اکوسیستم دارد. همچنین نیاز به مدیریت مناسب دادههای حساس در عین اطمینان از امنیت و انطباق، شکستن موانع در برنامهها و پلتفرمها و حتی تغییر شکل کل ساختار توزیع سود صنعت دارد.
"مهمترین چیز هنگام استقرار Lobster بر روی تلفنهای همراه پرکاربرد کاربران، اطمینان از امنیت اطلاعات است"، یک کارمند تولیدکننده تلفن همراه تأکید کرد.
این نگرانیها در مورد امنیت اطلاعات بیاساس نیستند. زیرا پیکربندی امنیتی پیشفرض OpenClaw ضعیف است، مهاجمان به راحتی میتوانند کنترل کامل سیستم را به دست آورند و خطرات امنیتی مانند تزریق کلمات اعلان، عملیات تصادفی و حملات افزونه مخرب از قبل ظهور کردهاند.
در مواجهه با این "صخرههای" امنیتی پنهان، حاکمیت امنیتی به یک خط قرمز غیرقابل نقض برای تولیدکنندگان تلفن همراه هنگام استقرار گسترده "Lobster" تبدیل شده است.
با گرفتن miclaw شیائومی به عنوان مثال، برای جلوگیری از اجرای خودسرانه عملیات پرخطر مانند پرداختها در ابر توسط AI Agent ها، miclaw مستقیماً همه ثبتنامهای ابزار مربوط به انتقالها و ثبت سفارش را در سطح کد "فلج" کرده است. این بدان معنی است که بدون تأیید صریح کاربر مانند تأیید اثر انگشت یا ورودی رمز عبور، هیچ تراکنش مالی فعال نخواهد شد، بنابراین خطر کسورات خودکار در منبع قفل میشود.
تقریب نزدیک به کامل OpenClaw به "دستیار فوقالعاده" ایدهآل صرفاً انگیزه سطحی برای تولیدکنندگان تلفن همراه برای "پرورش خرچنگها" (یعنی توسعه یک استراتژی رقابتی) است. بازی عمیقتر در این واقعیت نهفته است که با اینکه کاربران به تدریج به روش تعامل "انجام کارها به سادگی با صحبت کردن" عادت میکنند، نظم قدیمی اینترنت موبایل سنتی که بر اساس برنامهها است و تولیدکنندگان تلفن همراه حقوق توزیع فروشگاههای برنامه را کنترل میکنند، شروع به شل شدن میکند.
همانطور که Jensen Huang، بنیانگذار انویدیا، گفت: "Mac و Windows سیستمعاملهای رایانههای شخصی هستند، در حالی که OpenClaw سیستم عامل برای هوش مصنوعی شخصی است."
در عصر رایانه شخصی، هر کس که سیستم عامل را کنترل میکرد، دروازه اکوسیستم را کنترل میکرد. در عصر هوش مصنوعی، این قانون همچنان اعمال میشود، اما نبرد برای دسترسی به AI Agent ها تغییر کرده است.
تصور کنید اگر کاربران به حل همه مشکلات خود در AI Agent های شخص ثالث (مانند صفحات وب یا برنامههای مستقل مانند OpenClaw) عادت کنند، تلفنهای هوشمند ممکن است چیزی بیش از "پایگاههای سختافزاری" صرف نباشند.
با استقرار نسخههای موبایل "Lobster" توسط شرکتهای بزرگ اینترنتی، احساس بحران در میان تولیدکنندگان تلفن همراه بدیهی است.
درست زمانی که تولیدکنندگان تلفن همراه راهاندازی نسخههای موبایل "Lobster" را اعلام کردند، غولهای اینترنتی مانند Baidu و Alibaba نیز به سرعت اقدام کردند و تست عمومی بتا رایگان نسخههای موبایل "Lobster" را راهاندازی کردند.
در تاریخ 1404/12/21، Baidu اپلیکیشن موبایل "Redfinger Operator" را در اندروید راهاندازی کرد که به کاربران اجازه میدهد مستقیماً قابلیتهای دستیار هوش مصنوعی را در دستگاههای موبایل خود تجربه کنند و عملیات میان برنامهای مانند فراخوانی تاکسی و سفارش غذا را انجام دهند. به دنبال آن، Alibaba Cloud روز بعد نسخه موبایل OpenClaw، "Lobster"—JVS Claw—را راهاندازی کرد و بر "قابلیت استفاده خارج از جعبه" تأکید کرد. کاربران میتوانند برنامهها را اجرا، فایلها را پردازش و وظایف پیچیده را در یک فضای ابری ایمن و جدا شده با استفاده از دستورات زبان طبیعی ساده کامل کنند.
در مورد استقرار "پرورش خرچنگ" بر روی تلفنهای همراه توسط تولیدکنندگان تلفن همراه و شرکتهای بزرگ اینترنتی، Guo Tianxiang، مدیر تحقیقات IDC چین، گفت: "در حال حاضر، ارزش کاربردی عملی (پرورش خرچنگ) بر روی تلفنهای همراه محدود است. گلوگاه کلیدی این است که اگر سعی کنید برنامههای شخص ثالث را فراخوانی کنید، همچنان با مشکل مجوز API مواجه خواهید شد. اگر فراخوانی را مجبور کنید، ممکن است با وضعیت غیرفعال شدن توسط این برنامههای شخص ثالث مواجه شوید، درست مانند تلفن Doubao قبلی."
با آموختن از تجربه "تلفن Doubao"، تولیدکنندگان تلفن همراه مانند هواوی و شیائومی هنگام استقرار نسخه موبایل "Lobster"، آزمایش آن را در اکوسیستم های بسته خود در اولویت قرار دادند.
به عنوان مثال، miclaw شیائومی در حال حاضر بر تأیید قابلیتهای اجرای وظایف مدلهای بزرگ در "اکوسیستم انسان، وسیله نقلیه و خانه" تمرکز دارد؛ در حالی که Xiaoyi Claw در اولویت قرار دادن دستیابی به جریان همکاری در میان دستگاههای خود هواوی مانند تلفنهای همراه و تبلتها را ترجیح میدهد.
با این حال، در حالی که اجرای "Lobster" در یک اکوسیستم نسبتاً بسته میتواند از برخی خطرات جلوگیری کند، اقدامات "Lobster" را تا حدودی محدود میکند، زیرا نیازهای با فرکانس بالا کاربران اغلب در برنامههای ملی شخص ثالث مانند WeChat و Douyin پراکنده هستند.
به منظور ایجاد تعادل بین انطباق امنیتی و عملکرد کامل، فروشندگان انتخاب نکردهاند که همکاری میان برنامهای را به طور کامل کنار بگذارند، بلکه یک مسیر فنی محتاطانهتر و کنترلشدهتر را کشف کردهاند.
در مورد خدمات همکاری با برنامههای شخص ثالث، یک عضو کارکنان فنی نزدیک به شیائومی فاش کرد که miclaw شیائومی در حال حاضر با برنامههای شخص ثالث عمدتاً از طریق دو روش استاندارد صنعت همکاری میکند: یکی راهاندازی برنامه یا فعال کردن اقدامات خاص از طریق درایورهای Intent (SendIntentTool) است؛ دیگری ترویج برنامه برای سازگاری با SDK AppTool آن (بر اساس پروتکل AIDL) و انجام فراخوانیهای عملکرد عمیقتر و همکاری وظایف از طریق فرمتهای داده از پیش تعیین شده است. برنامههای شخص ثالث همچنین میتوانند به طور فعال اعلانها را به miclaw شیائومی ارسال کنند تا وظایف را فعال کنند.
در حال حاضر، استقرار "خرچنگهای" اختصاصی از سیستم زیربنایی یک گام حیاتی در تکامل تلفنهای هوشمند به "تلفنهای هوش مصنوعی" است. با این حال، برای تولیدکنندگان مشتاق به دنبال رشد افزایشی در موج هوش مصنوعی، چالش اصلی در ساخت یک AI Agent فوقالعاده، فشار هزینه است.
استقرار یک "Lobster" محلیسازی شده یک ارتقا ساده نرمافزار نیست؛ همچنین نیاز به ارتقا سختافزار مانند پردازنده اصلی و حافظه دارد. استنتاج با فرکانس بالا و پاسخ در زمان واقعی مدلهای بزرگ تقاضاهای بالاتری را برای قدرت محاسباتی NPU پردازنده اصلی (SoC) قرار میدهد و همچنین الزامات مشخصات تراشههای RAM و حافظه را به طور قابل توجهی افزایش میدهد.
"اجرای مدلهای بزرگ بر روی دستگاههای موبایل تحت تأثیر یک سری عوامل فنی مانند فضای ذخیرهسازی و مصرف برق قرار میگیرد. هرچه تعداد پارامترها بیشتر باشد، اجرا بر روی تلفن همراه دشوارتر میشود. یک مدل با 1 میلیارد پارامتر 1GB از حافظه تلفن همراه را اشغال میکند، 7 میلیارد 4GB را اشغال میکند و 13 میلیارد 7GB را اشغال میکند"، مدیر مرکز راهحلهای هوش مصنوعی یک تولیدکننده پیشرو تلفن همراه فاش کرد.
در حال حاضر، قیمت تراشههای ذخیرهسازی در یک چرخه صعودی قرار دارند و هر GB ارتقا حافظه مستقیماً سودهای کل سیستم سختافزار را فشار میدهد.
دردسرسازتر از سرمایهگذاری یکباره سختافزار، هزینه استفاده مداوم پس از فعال شدن نسخه موبایل "Lobster" است. در سمت رایانه شخصی، هر اجرای وظیفه با مصرف واقعی توکن و هزینههای قدرت محاسباتی مطابقت دارد. خبر قبلی مبنی بر اینکه "حقوق ماهانه 20,000 یوان نمیتواند از Lobster حمایت کند" مستقیماً این "اضطراب هزینه" را در معرض کاربران قرار داد.
"قبل از استفاده از 'Lobster'، باید بفهمید که میخواهید با آن چه کاری انجام دهید"، Feng Nian، بنیانگذار Dianjinshou (یک آژانس MCN) توضیح داد. "در فرآیند تولید ویدیو، مصرف توکن برای ویرایش و تولید ویدیوها در واقع بسیار متفاوت است، اما بسیاری از مبتدیان نمیفهمند که Lobster در واقع چه کاری میتواند انجام دهد."
Fengnian از عملیات واقعی تیم به عنوان مثال برای محاسبه هزینهها استفاده کرد: "ویرایش ما عمدتاً از OpenClaw مستقر شده بر روی Mac mini 4 برای کمک به کار استفاده میکند. به طور خاص، 'Lobster' مسئول تولید اسکریپت برای ویدیوهای بررسی رستوران بر اساس نقاط داغ محلی است. برخی از این اسکریپتها با افراد واقعی فیلمبرداری میشوند، در حالی که برخی دیگر با استفاده از هوش مصنوعی (مانند Seedance 2.0 یا Sora 2) تولید میشوند. Lobster میتواند Mac mini را کنترل کند تا ویدیوها را ویرایش کند و همزمان API Sora 2 را برای تولید ویدیوها فراخوانی کند. انجام برخی از این کارها توسط افراد ارزانتر است و واگذاری آنها به هوش مصنوعی مقرونبهصرفهتر است. در یک روز، میتوانیم حدود 12 ویدیوی اورجینال + مونتاژ تولید کنیم، با هزینه مصرف توکن متناظر تقریباً 15 یوان."
"دشواری اصلی در تصمیمگیری در تعادل هزینه قدرت محاسباتی توکن با حقوق ویراستاران جوان نهفته است"، Feng Nian اضافه کرد. "کلید استفاده معقول از 'خرچنگها' روشن کردن اینکه کدام وظایف باید به 'خرچنگها' واگذار شوند و کدام باید به انسانها واگذار شوند، است. متأسفانه، بسیاری از شرکتها در حال حاضر صرفاً برای دنبال کردن روند و نمایش مهارتهای خود 'خرچنگ پرورش' میدهند، بدون اینکه بهرهوری واقعی تولید کنند."
در حالی که هزینه توکن روزانه 15 یوان ممکن است کم به نظر برسد، با توجه به پایگاه کاربری عظیم تولیدکنندگان تلفن همراه، بار قابل توجهی است. با صدها میلیون کاربر عادت کرده به مدل "خرید سختافزار، دریافت خدمات رایگان"، اینکه آیا تولیدکنندگان تلفن همراه میتوانند در بلندمدت هزینههای عظیم قدرت محاسباتی و توکن حاصل را تحمل کنند یا خیر، هنوز مشخص نیست.
"تولیدکنندگان تلفن همراه ممکن است در آینده مدل 'خرید تلفن، دریافت قدرت محاسباتی رایگان' را اتخاذ کنند"، یک فرد آگاه صنعت پیشبینی کرد. "به عنوان مثال، مقدار مشخصی توکن رایگان ممکن است با خرید تلفن شامل شود تا وظایف روزمره سبک مانند نوشتن گزارشهای روزانه و رزرو بلیط را مدیریت کند. در مورد عملیات پیچیده و پرمصرف مانند تولید ویدیو، ممکن است به طور جداگانه بر اساس پیچیدگی وظیفه هزینه دریافت کنند، یا کاربر ممکن است مجبور شود هزینه توکنهای بیش از حد را تحمل کند."


