نظرة من وراء الكواليس على بناء خط أنابيب لفرز السمات قائمة على الذكاء الاصطناعي لملايين وحدات حفظ المخزون.نظرة من وراء الكواليس على بناء خط أنابيب لفرز السمات قائمة على الذكاء الاصطناعي لملايين وحدات حفظ المخزون.

كيف استخدمت الذكاء الاصطناعي لإصلاح قيم السمات غير المتسقة على نطاق واسع في التجارة الإلكترونية

عندما يتحدث الناس عن توسيع نطاق التجارة الإلكترونية، فإنهم يركزون على التحديات الهندسية الكبيرة: البحث الموزع، المخزون في الوقت الفعلي، محركات التوصية، وتحسين عملية الدفع. ولكن تحت كل ذلك تكمن مشكلة أكثر هدوءًا واستمرارًا يعاني منها كل بائع تجزئة تقريبًا: قيم السمات.

السمات هي العمود الفقري لاكتشاف المنتجات. فهي تشغّل الفلاتر والمقارنات وترتيب البحث ومنطق التوصيات. ولكن في الكتالوجات الفعلية، نادرًا ما تكون قيم السمات نظيفة. فهي غير متسقة أو مكررة أو ذات تنسيق خاطئ أو غامضة دلاليًا.

خذ شيئًا بسيطًا مثل الحجم. قد ترى:

Code

["XL", "Small", "12cm", "Large", "M", "S"]

أو اللون:

Code

["RAL 3020", "Crimson", "Red", "Dark Red"]

بشكل فردي، تبدو هذه التناقضات غير ضارة. ولكن عند ضربها في أكثر من 3 ملايين SKU، كل منها مع عشرات السمات، تصبح المشكلة منهجية. تتصرف الفلاتر بشكل غير متوقع، وتفقد محركات البحث الصلة، ويغرق التجار في التنظيف اليدوي، ويصبح اكتشاف المنتج أبطأ وأكثر إحباطًا للعملاء.

كان هذا هو التحدي الذي واجهته كمهندس برمجيات متكامل في Zoro، وهي مشكلة كان من السهل تجاهلها ولكنها أثرت على كل صفحة منتج.

نهجي: الذكاء الاصطناعي الهجين يلتقي بالحتمية

لم أرغب في صندوق أسود غامض للذكاء الاصطناعي يقوم فقط بفرز الأشياء. من الصعب الوثوق بمثل هذه الأنظمة أو تصحيحها أو توسيع نطاقها. بدلاً من ذلك، استهدفت خط أنابيب كان:

  • قابل للشرح
  • يمكن التنبؤ به
  • قابل للتوسع
  • قابل للتحكم من قبل البشر

كانت النتيجة خط أنابيب ذكاء اصطناعي هجين يجمع بين الاستدلال السياقي من LLMs مع قواعد واضحة وضوابط للتجار. إنه يتصرف بذكاء عند الحاجة، ولكنه يظل دائمًا قابلاً للتنبؤ. هذا ذكاء اصطناعي بحواجز حماية، وليس ذكاء اصطناعي خارج السيطرة.

المهام الخلفية: مصممة للإنتاجية

تتم معالجة جميع السمات في مهام خلفية غير متصلة بالإنترنت، وليس في الوقت الفعلي. لم يكن هذا حلاً وسطًا؛ بل كان اختيارًا معماريًا استراتيجيًا.

تبدو خطوط الأنابيب في الوقت الفعلي جذابة، ولكن على نطاق التجارة الإلكترونية، فإنها تقدم:

  • زمن انتقال غير متوقع
  • تبعيات هشة
  • ارتفاعات حسابية مكلفة
  • هشاشة تشغيلية

من ناحية أخرى، منحتنا المهام غير المتصلة:

  • إنتاجية عالية: معالجة دفعات ضخمة دون التأثير على الأنظمة المباشرة
  • المرونة: لم تؤثر الإخفاقات أبدًا على حركة العملاء
  • التحكم في التكلفة: يمكن جدولة الحساب خلال أوقات انخفاض حركة المرور
  • العزل: لم يؤثر زمن انتقال LLM أبدًا على صفحات المنتج
  • الاتساق: كانت التحديثات ذرية ويمكن التنبؤ بها

يعد الحفاظ على فصل الأنظمة التي تواجه العملاء عن خطوط معالجة البيانات أمرًا ضروريًا عند العمل مع ملايين SKUs.

التنظيف والتطبيع

قبل استخدام الذكاء الاصطناعي على البيانات، قمت بتشغيل خطوة معالجة مسبقة واضحة لإزالة الضوضاء والارتباك. قد تبدو هذه الخطوة بسيطة، لكنها حسنت بشكل كبير استدلال LLM.

تضمن خط أنابيب التنظيف:

  • قص المسافات البيضاء
  • إزالة القيم الفارغة
  • إلغاء تكرار القيم
  • تسطيح مسارات الفئات في سلسلة سياقية

هذا ضمن أن LLM تلقى مدخلات نظيفة وواضحة، وهو أمر أساسي للحصول على نتائج متسقة. القمامة في الداخل، القمامة في الخارج. على هذا النطاق، حتى الأخطاء الصغيرة يمكن أن تؤدي إلى مشاكل أكبر لاحقًا.

خدمة LLM مع السياق

لم يكن LLM يقوم فقط بفرز القيم أبجديًا. بل كان يستدل عليها.

تلقت الخدمة:

  • قيم السمات النظيفة
  • مسارات الفئات
  • البيانات الوصفية للسمات

مع هذا السياق، يمكن للنموذج أن يفهم:

  • أن "الجهد الكهربائي" في أدوات الطاقة رقمي
  • أن "الحجم" في الملابس يتبع تطورًا معروفًا
  • أن "اللون" في الدهانات قد يتبع معايير RAL
  • أن "المادة" في الأجهزة له علاقات دلالية

أعاد النموذج:

  • القيم المرتبة
  • أسماء السمات المحسنة
  • قرار: ترتيب حتمي أو سياقي

يتيح هذا لخط الأنابيب التعامل مع أنواع مختلفة من السمات دون ترميز صلب للقواعد لكل فئة.

البدائل الحتمية

ليست كل سمة تحتاج إلى ذكاء اصطناعي.

في الواقع، يتم التعامل مع العديد من السمات بشكل أفضل بواسطة المنطق الحتمي.

غالبًا ما تستفيد النطاقات الرقمية والقيم المستندة إلى الوحدات والمجموعات البسيطة من:

  • معالجة أسرع
  • ترتيب يمكن التنبؤ به
  • تكلفة أقل
  • عدم وجود غموض

اكتشف خط الأنابيب تلقائيًا هذه الحالات واستخدم المنطق الحتمي لها. هذا حافظ على كفاءة النظام وتجنب استدعاءات LLM غير الضرورية.

الوسم اليدوي مقابل وسم LLM

كان التجار لا يزالون بحاجة إلى التحكم، خاصة بالنسبة للسمات الحساسة للأعمال.

لذلك يمكن وسم كل فئة على النحو التالي:

  • LLM_SORT — دع النموذج يقرر
  • MANUAL_SORT — يحدد التجار الترتيب

يتيح نظام الوسم المزدوج هذا للأشخاص اتخاذ القرارات النهائية بينما قام الذكاء الاصطناعي بمعظم العمل. كما بنى الثقة، حيث يمكن للتجار تجاوز النموذج عند الحاجة دون كسر خط الأنابيب.

الاستمرارية والتحكم

تم تخزين جميع النتائج مباشرة في قاعدة بيانات Product MongoDB، مع الحفاظ على بساطة الهندسة المعمارية ومركزيتها.

أصبحت MongoDB المتجر التشغيلي الوحيد لـ:

  • قيم السمات المرتبة
  • أسماء السمات المحسنة
  • علامات الفرز على مستوى الفئة
  • حقول sortOrder على مستوى المنتج

هذا سهّل مراجعة التغييرات، وتجاوز القيم، وإعادة معالجة الفئات، والمزامنة مع الأنظمة الأخرى.

تكامل البحث

بمجرد الفرز، تدفقت القيم إلى:

  • Elasticsearch للبحث المستند إلى الكلمات الرئيسية
  • Vespa للبحث الدلالي والمستند إلى المتجهات

هذا ضمن أن:

  • ظهرت الفلاتر بترتيب منطقي
  • عرضت صفحات المنتج سمات متسقة
  • رتبت محركات البحث المنتجات بدقة أكبر
  • يمكن للعملاء تصفح الفئات بسهولة أكبر

البحث هو المكان الذي يكون فيه فرز السمات أكثر وضوحًا، وحيث يكون الاتساق أكثر أهمية.

نظرة عامة على الهندسة المعمارية

لجعل هذا العمل عبر ملايين SKUs، صممت خط أنابيب معياري مبني حول المهام الخلفية واستدلال الذكاء الاصطناعي وتكامل البحث. يلتقط مخطط الهندسة المعمارية أدناه التدفق الكامل:

  • تدخل بيانات المنتج من نظام معلومات المنتج
  • تسحب مهمة استخراج السمات قيم السمات وسياق الفئة
  • يتم تمريرها إلى خدمة فرز الذكاء الاصطناعي
  • تتم كتابة مستندات المنتج المحدثة في Product MongoDB
  • تقوم مهمة المزامنة الصادرة بتحديث نظام معلومات المنتج بترتيب الفرز
  • تدفع مهام مزامنة Elasticsearch و Vespa البيانات المفروزة إلى أنظمة البحث الخاصة بها
  • تربط خدمات API بين Elasticsearch و Vespa وتطبيق العميل

يضمن هذا التدفق أن كل قيمة سمة، سواء تم فرزها بواسطة الذكاء الاصطناعي أو تم تعيينها يدويًا، تنعكس في البحث والتسويق وتجربة العميل.

الحل في العمل

إليك كيف تم تحويل القيم الفوضوية:

| السمة | القيم الأولية | الإخراج المرتب | |----|----|----| | الحجم | XL, Small, 12cm, Large, M, S | Small, M, Large, XL, 12cm | | اللون | RAL 3020, Crimson, Red, Dark Red | Red, Dark Red, Crimson, Red (RAL 3020) | | المادة | Steel, Carbon Steel, Stainless, Stainless Steel | Steel, Stainless Steel, Carbon Steel | | رقمي | 5cm, 12cm, 2cm, 20cm | 2cm, 5cm, 12cm, 20cm |

توضح هذه الأمثلة كيف يجمع خط الأنابيب بين الاستدلال السياقي والقواعد الواضحة لإنشاء تسلسلات نظيفة وسهلة الفهم.

لماذا المهام غير المتصلة بدلاً من المعالجة في الوقت الفعلي؟

كانت المعالجة في الوقت الفعلي ستقدم:

  • زمن انتقال غير متوقع
  • تكاليف حوسبة أعلى
  • تبعيات هشة
  • تعقيد تشغيلي

منحتنا المهام غير المتصلة:

  • كفاءة الدفعات
  • استدعاءات LLM غير متزامنة
  • منطق إعادة المحاولة وقوائم الأخطاء
  • نوافذ المراجعة البشرية
  • إنفاق حسابي يمكن التنبؤ به

كان المقايضة هو تأخير صغير بين إدخال البيانات والعرض، ولكن الفائدة كانت الاتساق على نطاق واسع، وهو ما يقدره العملاء أكثر بكثير.

التأثير

كانت النتائج كبيرة:

  • ترتيب سمات متسق عبر أكثر من 3 ملايين SKU
  • فرز رقمي يمكن التنبؤ به عبر البدائل الحتمية
  • تحكم التاجر من خلال الوسم اليدوي
  • صفحات منتجات أنظف وفلاتر أكثر سهولة
  • تحسين صلة البحث
  • زيادة ثقة العملاء والتحويل

لم يكن هذا مجرد فوز تقني؛ بل كان أيضًا فوزًا لتجربة المستخدم والإيرادات.

الدروس المستفادة

  • تتفوق خطوط الأنابيب الهجينة على الذكاء الاصطناعي النقي على نطاق واسع. حواجز الحماية مهمة.
  • يحسن السياق بشكل كبير دقة LLM
  • المهام غير المتصلة ضرورية للإنتاجية والمرونة
  • آليات التجاوز البشري تبني الثقة والاعتماد
  • المدخلات النظيفة هي أساس إخراج الذكاء الاصطناعي الموثوق

فكرة نهائية

يبدو فرز قيم السمات بسيطًا، ولكنه يصبح تحديًا حقيقيًا عندما يتعين عليك القيام بذلك لملايين المنتجات.

من خلال الجمع بين ذكاء LLM والقواعد الواضحة والتحكم في التجار، قمت بتحويل مشكلة معقدة ومخفية إلى نظام نظيف وقابل للتوسع.

إنه تذكير بأن بعضًا من أكبر الانتصارات تأتي من حل المشاكل المملة، تلك التي يسهل تفويتها ولكنها تظهر في كل صفحة منتج.

\n \n \n

فرصة السوق
شعار Sleepless AI
Sleepless AI السعر(AI)
$0.03742
$0.03742$0.03742
-2.32%
USD
مخطط أسعار Sleepless AI (AI) المباشر
إخلاء مسؤولية: المقالات المُعاد نشرها على هذا الموقع مستقاة من منصات عامة، وهي مُقدمة لأغراض إعلامية فقط. لا تُظهِر بالضرورة آراء MEXC. جميع الحقوق محفوظة لمؤلفيها الأصليين. إذا كنت تعتقد أن أي محتوى ينتهك حقوق جهات خارجية، يُرجى التواصل عبر البريد الإلكتروني service@support.mexc.com لإزالته. لا تقدم MEXC أي ضمانات بشأن دقة المحتوى أو اكتماله أو حداثته، وليست مسؤولة عن أي إجراءات تُتخذ بناءً على المعلومات المُقدمة. لا يُمثل المحتوى نصيحة مالية أو قانونية أو مهنية أخرى، ولا يُعتبر توصية أو تأييدًا من MEXC.

قد يعجبك أيضاً

صناديق الاستثمار المتداولة XRP و SOL تجذب تدفقات وسط تدفقات خارجة من BTC و ETH

صناديق الاستثمار المتداولة XRP و SOL تجذب تدفقات وسط تدفقات خارجة من BTC و ETH

صناديق الاستثمار المتداولة العقود الفورية لـ XRP و SOL تحقق تدفقات واردة بينما تواجه BTC و ETH تدفقات خارجة، مما يشير إلى تحول في السوق.
مشاركة
CoinLive2025/12/26 05:14
مايكل سايلور من ستراتيجي يكشف عن مبدأه الرئيسي للبيتكوين في كلمتين فقط

مايكل سايلور من ستراتيجي يكشف عن مبدأه الرئيسي للبيتكوين في كلمتين فقط

ظهر منشور "مايكل سايلور من ستراتيجي يكشف عن مبدأه الرئيسي في بيتكوين بكلمتين فقط" على موقع BitcoinEthereumNews.com. نشر مايكل سايلور كلمتين يوم الخميس — "كن لا يُقهر" — بينما أكدت التصنيفات الجديدة الريادة التي لا مثيل لها لشركة ستراتيجي في حيازات بيتكوين للشركات. تسيطر الشركة الآن على 639,835 BTC، بقيمة تزيد عن 70 مليار دولار، مع تداول بيتكوين حول 109,500 دولار. المسافة بين شركة سايلور والبقية واسعة. تأتي MARA Holdings في المرتبة الثانية بـ 52,477 BTC. تمتلك تسلا 11,509. وتمتلك كوينبيس 11,776. حتى لو جمعت الشركات العشر التالية احتياطياتها، فإنها تقصر عن إجمالي ستراتيجي. في غضون ذلك، يبدو تحرك سعر بيتكوين مؤخرًا أشبه برحلة على الأفعوانية، حيث ارتفع فوق 124,000 دولار في أغسطس قبل أن ينخفض إلى 106,000 دولار، ثم يتعافى إلى ما دون 110,000 دولار. بالنسبة للمتداولين، تحدد هذه التقلبات المكاسب أو الخسائر. بالنسبة لستراتيجي، لم يغيروا نهجهم: التراكم والعقد. استراتيجية مايكل سايلور حولت شركة برمجيات واحدة نفسها إلى أكبر خزنة بيتكوين على الكوكب، أكبر من المنقبين والبورصات التي تدير البنية التحتية للشبكة. الشركات العامة مثل CleanSpark وRiot وBlock هي لاعبون نشطون، لكنها تبدو صغيرة بجانب ميزانية سايلور. يضع منشور سايلور وجهًا على تلك الأرقام، حيث أن رئيس ستراتيجي نفسه هو وجه شركته. صورته بقلنسوة داكنة وربطة عنق برتقالية، مقترنة بكلمات "كن لا يُقهر"، هي تذكير بكيفية تأطيره لموقف الشركة. لا تتعامل ستراتيجي مع بيتكوين كتجربة. لقد بنت هويتها حوله، وتظهر الأرقام الأخيرة أنه لا أحد قريب منها حتى. المصدر: https://u.today/strategys-michael-saylor-unveils-his-main-bitcoin-principle-in-only-2-words
مشاركة
BitcoinEthereumNews2025/09/27 04:57
استثمار ستانلي دراكنميلر بقيمة 77 مليون دولار في شركة البلوكشين

استثمار ستانلي دراكنميلر بقيمة 77 مليون دولار في شركة البلوكشين

ستانلي دراكنميلر يستثمر 77 مليون دولار في Figure، منصة إقراض قائمة على البلوكشين.
مشاركة
bitcoininfonews2025/12/26 05:19