نظرة من وراء الكواليس على بناء خط أنابيب لفرز السمات قائمة على الذكاء الاصطناعي لملايين وحدات حفظ المخزون.نظرة من وراء الكواليس على بناء خط أنابيب لفرز السمات قائمة على الذكاء الاصطناعي لملايين وحدات حفظ المخزون.

كيف استخدمت الذكاء الاصطناعي لإصلاح قيم السمات غير المتسقة على نطاق واسع في التجارة الإلكترونية

عندما يتحدث الناس عن توسيع نطاق التجارة الإلكترونية، فإنهم يركزون على التحديات الهندسية الكبيرة: البحث الموزع، المخزون في الوقت الفعلي، محركات التوصية، وتحسين عملية الدفع. ولكن تحت كل ذلك تكمن مشكلة أكثر هدوءًا واستمرارًا يعاني منها كل بائع تجزئة تقريبًا: قيم السمات.

السمات هي العمود الفقري لاكتشاف المنتجات. فهي تشغّل الفلاتر والمقارنات وترتيب البحث ومنطق التوصيات. ولكن في الكتالوجات الفعلية، نادرًا ما تكون قيم السمات نظيفة. فهي غير متسقة أو مكررة أو ذات تنسيق خاطئ أو غامضة دلاليًا.

خذ شيئًا بسيطًا مثل الحجم. قد ترى:

Code

["XL", "Small", "12cm", "Large", "M", "S"]

أو اللون:

Code

["RAL 3020", "Crimson", "Red", "Dark Red"]

بشكل فردي، تبدو هذه التناقضات غير ضارة. ولكن عند ضربها في أكثر من 3 ملايين SKU، كل منها مع عشرات السمات، تصبح المشكلة منهجية. تتصرف الفلاتر بشكل غير متوقع، وتفقد محركات البحث الصلة، ويغرق التجار في التنظيف اليدوي، ويصبح اكتشاف المنتج أبطأ وأكثر إحباطًا للعملاء.

كان هذا هو التحدي الذي واجهته كمهندس برمجيات متكامل في Zoro، وهي مشكلة كان من السهل تجاهلها ولكنها أثرت على كل صفحة منتج.

نهجي: الذكاء الاصطناعي الهجين يلتقي بالحتمية

لم أرغب في صندوق أسود غامض للذكاء الاصطناعي يقوم فقط بفرز الأشياء. من الصعب الوثوق بمثل هذه الأنظمة أو تصحيحها أو توسيع نطاقها. بدلاً من ذلك، استهدفت خط أنابيب كان:

  • قابل للشرح
  • يمكن التنبؤ به
  • قابل للتوسع
  • قابل للتحكم من قبل البشر

كانت النتيجة خط أنابيب ذكاء اصطناعي هجين يجمع بين الاستدلال السياقي من LLMs مع قواعد واضحة وضوابط للتجار. إنه يتصرف بذكاء عند الحاجة، ولكنه يظل دائمًا قابلاً للتنبؤ. هذا ذكاء اصطناعي بحواجز حماية، وليس ذكاء اصطناعي خارج السيطرة.

المهام الخلفية: مصممة للإنتاجية

تتم معالجة جميع السمات في مهام خلفية غير متصلة بالإنترنت، وليس في الوقت الفعلي. لم يكن هذا حلاً وسطًا؛ بل كان اختيارًا معماريًا استراتيجيًا.

تبدو خطوط الأنابيب في الوقت الفعلي جذابة، ولكن على نطاق التجارة الإلكترونية، فإنها تقدم:

  • زمن انتقال غير متوقع
  • تبعيات هشة
  • ارتفاعات حسابية مكلفة
  • هشاشة تشغيلية

من ناحية أخرى، منحتنا المهام غير المتصلة:

  • إنتاجية عالية: معالجة دفعات ضخمة دون التأثير على الأنظمة المباشرة
  • المرونة: لم تؤثر الإخفاقات أبدًا على حركة العملاء
  • التحكم في التكلفة: يمكن جدولة الحساب خلال أوقات انخفاض حركة المرور
  • العزل: لم يؤثر زمن انتقال LLM أبدًا على صفحات المنتج
  • الاتساق: كانت التحديثات ذرية ويمكن التنبؤ بها

يعد الحفاظ على فصل الأنظمة التي تواجه العملاء عن خطوط معالجة البيانات أمرًا ضروريًا عند العمل مع ملايين SKUs.

التنظيف والتطبيع

قبل استخدام الذكاء الاصطناعي على البيانات، قمت بتشغيل خطوة معالجة مسبقة واضحة لإزالة الضوضاء والارتباك. قد تبدو هذه الخطوة بسيطة، لكنها حسنت بشكل كبير استدلال LLM.

تضمن خط أنابيب التنظيف:

  • قص المسافات البيضاء
  • إزالة القيم الفارغة
  • إلغاء تكرار القيم
  • تسطيح مسارات الفئات في سلسلة سياقية

هذا ضمن أن LLM تلقى مدخلات نظيفة وواضحة، وهو أمر أساسي للحصول على نتائج متسقة. القمامة في الداخل، القمامة في الخارج. على هذا النطاق، حتى الأخطاء الصغيرة يمكن أن تؤدي إلى مشاكل أكبر لاحقًا.

خدمة LLM مع السياق

لم يكن LLM يقوم فقط بفرز القيم أبجديًا. بل كان يستدل عليها.

تلقت الخدمة:

  • قيم السمات النظيفة
  • مسارات الفئات
  • البيانات الوصفية للسمات

مع هذا السياق، يمكن للنموذج أن يفهم:

  • أن "الجهد الكهربائي" في أدوات الطاقة رقمي
  • أن "الحجم" في الملابس يتبع تطورًا معروفًا
  • أن "اللون" في الدهانات قد يتبع معايير RAL
  • أن "المادة" في الأجهزة له علاقات دلالية

أعاد النموذج:

  • القيم المرتبة
  • أسماء السمات المحسنة
  • قرار: ترتيب حتمي أو سياقي

يتيح هذا لخط الأنابيب التعامل مع أنواع مختلفة من السمات دون ترميز صلب للقواعد لكل فئة.

البدائل الحتمية

ليست كل سمة تحتاج إلى ذكاء اصطناعي.

في الواقع، يتم التعامل مع العديد من السمات بشكل أفضل بواسطة المنطق الحتمي.

غالبًا ما تستفيد النطاقات الرقمية والقيم المستندة إلى الوحدات والمجموعات البسيطة من:

  • معالجة أسرع
  • ترتيب يمكن التنبؤ به
  • تكلفة أقل
  • عدم وجود غموض

اكتشف خط الأنابيب تلقائيًا هذه الحالات واستخدم المنطق الحتمي لها. هذا حافظ على كفاءة النظام وتجنب استدعاءات LLM غير الضرورية.

الوسم اليدوي مقابل وسم LLM

كان التجار لا يزالون بحاجة إلى التحكم، خاصة بالنسبة للسمات الحساسة للأعمال.

لذلك يمكن وسم كل فئة على النحو التالي:

  • LLM_SORT — دع النموذج يقرر
  • MANUAL_SORT — يحدد التجار الترتيب

يتيح نظام الوسم المزدوج هذا للأشخاص اتخاذ القرارات النهائية بينما قام الذكاء الاصطناعي بمعظم العمل. كما بنى الثقة، حيث يمكن للتجار تجاوز النموذج عند الحاجة دون كسر خط الأنابيب.

الاستمرارية والتحكم

تم تخزين جميع النتائج مباشرة في قاعدة بيانات Product MongoDB، مع الحفاظ على بساطة الهندسة المعمارية ومركزيتها.

أصبحت MongoDB المتجر التشغيلي الوحيد لـ:

  • قيم السمات المرتبة
  • أسماء السمات المحسنة
  • علامات الفرز على مستوى الفئة
  • حقول sortOrder على مستوى المنتج

هذا سهّل مراجعة التغييرات، وتجاوز القيم، وإعادة معالجة الفئات، والمزامنة مع الأنظمة الأخرى.

تكامل البحث

بمجرد الفرز، تدفقت القيم إلى:

  • Elasticsearch للبحث المستند إلى الكلمات الرئيسية
  • Vespa للبحث الدلالي والمستند إلى المتجهات

هذا ضمن أن:

  • ظهرت الفلاتر بترتيب منطقي
  • عرضت صفحات المنتج سمات متسقة
  • رتبت محركات البحث المنتجات بدقة أكبر
  • يمكن للعملاء تصفح الفئات بسهولة أكبر

البحث هو المكان الذي يكون فيه فرز السمات أكثر وضوحًا، وحيث يكون الاتساق أكثر أهمية.

نظرة عامة على الهندسة المعمارية

لجعل هذا العمل عبر ملايين SKUs، صممت خط أنابيب معياري مبني حول المهام الخلفية واستدلال الذكاء الاصطناعي وتكامل البحث. يلتقط مخطط الهندسة المعمارية أدناه التدفق الكامل:

  • تدخل بيانات المنتج من نظام معلومات المنتج
  • تسحب مهمة استخراج السمات قيم السمات وسياق الفئة
  • يتم تمريرها إلى خدمة فرز الذكاء الاصطناعي
  • تتم كتابة مستندات المنتج المحدثة في Product MongoDB
  • تقوم مهمة المزامنة الصادرة بتحديث نظام معلومات المنتج بترتيب الفرز
  • تدفع مهام مزامنة Elasticsearch و Vespa البيانات المفروزة إلى أنظمة البحث الخاصة بها
  • تربط خدمات API بين Elasticsearch و Vespa وتطبيق العميل

يضمن هذا التدفق أن كل قيمة سمة، سواء تم فرزها بواسطة الذكاء الاصطناعي أو تم تعيينها يدويًا، تنعكس في البحث والتسويق وتجربة العميل.

الحل في العمل

إليك كيف تم تحويل القيم الفوضوية:

| السمة | القيم الأولية | الإخراج المرتب | |----|----|----| | الحجم | XL, Small, 12cm, Large, M, S | Small, M, Large, XL, 12cm | | اللون | RAL 3020, Crimson, Red, Dark Red | Red, Dark Red, Crimson, Red (RAL 3020) | | المادة | Steel, Carbon Steel, Stainless, Stainless Steel | Steel, Stainless Steel, Carbon Steel | | رقمي | 5cm, 12cm, 2cm, 20cm | 2cm, 5cm, 12cm, 20cm |

توضح هذه الأمثلة كيف يجمع خط الأنابيب بين الاستدلال السياقي والقواعد الواضحة لإنشاء تسلسلات نظيفة وسهلة الفهم.

لماذا المهام غير المتصلة بدلاً من المعالجة في الوقت الفعلي؟

كانت المعالجة في الوقت الفعلي ستقدم:

  • زمن انتقال غير متوقع
  • تكاليف حوسبة أعلى
  • تبعيات هشة
  • تعقيد تشغيلي

منحتنا المهام غير المتصلة:

  • كفاءة الدفعات
  • استدعاءات LLM غير متزامنة
  • منطق إعادة المحاولة وقوائم الأخطاء
  • نوافذ المراجعة البشرية
  • إنفاق حسابي يمكن التنبؤ به

كان المقايضة هو تأخير صغير بين إدخال البيانات والعرض، ولكن الفائدة كانت الاتساق على نطاق واسع، وهو ما يقدره العملاء أكثر بكثير.

التأثير

كانت النتائج كبيرة:

  • ترتيب سمات متسق عبر أكثر من 3 ملايين SKU
  • فرز رقمي يمكن التنبؤ به عبر البدائل الحتمية
  • تحكم التاجر من خلال الوسم اليدوي
  • صفحات منتجات أنظف وفلاتر أكثر سهولة
  • تحسين صلة البحث
  • زيادة ثقة العملاء والتحويل

لم يكن هذا مجرد فوز تقني؛ بل كان أيضًا فوزًا لتجربة المستخدم والإيرادات.

الدروس المستفادة

  • تتفوق خطوط الأنابيب الهجينة على الذكاء الاصطناعي النقي على نطاق واسع. حواجز الحماية مهمة.
  • يحسن السياق بشكل كبير دقة LLM
  • المهام غير المتصلة ضرورية للإنتاجية والمرونة
  • آليات التجاوز البشري تبني الثقة والاعتماد
  • المدخلات النظيفة هي أساس إخراج الذكاء الاصطناعي الموثوق

فكرة نهائية

يبدو فرز قيم السمات بسيطًا، ولكنه يصبح تحديًا حقيقيًا عندما يتعين عليك القيام بذلك لملايين المنتجات.

من خلال الجمع بين ذكاء LLM والقواعد الواضحة والتحكم في التجار، قمت بتحويل مشكلة معقدة ومخفية إلى نظام نظيف وقابل للتوسع.

إنه تذكير بأن بعضًا من أكبر الانتصارات تأتي من حل المشاكل المملة، تلك التي يسهل تفويتها ولكنها تظهر في كل صفحة منتج.

\n \n \n

فرصة السوق
شعار Sleepless AI
Sleepless AI السعر(AI)
$0.03831
$0.03831$0.03831
0.00%
USD
مخطط أسعار Sleepless AI (AI) المباشر
إخلاء مسؤولية: المقالات المُعاد نشرها على هذا الموقع مستقاة من منصات عامة، وهي مُقدمة لأغراض إعلامية فقط. لا تُظهِر بالضرورة آراء MEXC. جميع الحقوق محفوظة لمؤلفيها الأصليين. إذا كنت تعتقد أن أي محتوى ينتهك حقوق جهات خارجية، يُرجى التواصل عبر البريد الإلكتروني [email protected] لإزالته. لا تقدم MEXC أي ضمانات بشأن دقة المحتوى أو اكتماله أو حداثته، وليست مسؤولة عن أي إجراءات تُتخذ بناءً على المعلومات المُقدمة. لا يُمثل المحتوى نصيحة مالية أو قانونية أو مهنية أخرى، ولا يُعتبر توصية أو تأييدًا من MEXC.