نگاهی پشت صحنه به ساخت یک خط لوله مرتب‌سازی ویژگی مبتنی بر هوش مصنوعی برای میلیون‌ها SKU.نگاهی پشت صحنه به ساخت یک خط لوله مرتب‌سازی ویژگی مبتنی بر هوش مصنوعی برای میلیون‌ها SKU.

چگونه از هوش مصنوعی برای رفع مقادیر ناسازگار ویژگی‌ها در مقیاس بزرگ در تجارت الکترونیک استفاده کردم

وقتی مردم درباره مقیاس‌بندی تجارت الکترونیک صحبت می‌کنند، بر چالش‌های مهندسی بزرگ تمرکز می‌کنند: جستجوی توزیع‌شده، موجودی در زمان واقعی، موتورهای توصیه و بهینه‌سازی تسویه‌حساب. اما در زیر همه اینها، یک مسئله ساکت‌تر و پایدارتر وجود دارد که تقریباً هر خرده‌فروشی با آن دست و پنجه نرم می‌کند: مقادیر ویژگی.

ویژگی‌ها ستون فقرات کشف محصول هستند. آنها فیلترها، مقایسه‌ها، رتبه‌بندی جستجو و منطق توصیه را تامین می‌کنند. اما در کاتالوگ‌های واقعی، مقادیر ویژگی به ندرت تمیز هستند. آنها ناسازگار، تکراری، نامنظم یا از نظر معنایی مبهم هستند.

چیزی به سادگی سایز را در نظر بگیرید. ممکن است ببینید:

کد

["XL", "Small", "12cm", "Large", "M", "S"]

یا رنگ:

کد

["RAL 3020", "Crimson", "Red", "Dark Red"]

به صورت جداگانه، این ناسازگاری‌ها بی‌ضرر به نظر می‌رسند. اما آنها را در بیش از 3 میلیون SKU ضرب کنید، که هر کدام دارای ده‌ها ویژگی هستند، و مشکل سیستمیک می‌شود. فیلترها به طور غیرقابل پیش‌بینی رفتار می‌کنند، موتورهای جستجو ارتباط خود را از دست می‌دهند، فروشندگان در پاکسازی دستی غرق می‌شوند و کشف محصول برای مشتریان کندتر و ناامیدکننده‌تر می‌شود.

این چالشی بود که من به عنوان یک مهندس نرم‌افزار فول استک در Zoro با آن روبرو شدم، مشکلی که به راحتی نادیده گرفته می‌شد اما بر هر صفحه محصول تأثیر می‌گذاشت.

رویکرد من: هوش مصنوعی ترکیبی با قطعیت

من یک هوش مصنوعی جعبه سیاه مرموز نمی‌خواستم که فقط چیزها را مرتب کند. چنین سیستم‌هایی برای اعتماد، اشکال‌زدایی یا مقیاس‌بندی دشوار هستند. در عوض، من هدفم یک خط لوله بود که:

  • قابل توضیح
  • قابل پیش‌بینی
  • مقیاس‌پذیر
  • قابل کنترل توسط انسان

نتیجه یک خط لوله هوش مصنوعی ترکیبی بود که استدلال متنی از LLM‌ها را با قوانین واضح و کنترل‌های فروشنده ترکیب می‌کند. زمانی که نیاز است هوشمندانه عمل می‌کند، اما همیشه قابل پیش‌بینی باقی می‌ماند. این هوش مصنوعی با محافظ است، نه هوش مصنوعی خارج از کنترل.

وظایف پس‌زمینه: ساخته‌شده برای توان عملیاتی

تمام پردازش ویژگی در وظایف پس‌زمینه آفلاین اتفاق می‌افتد، نه در زمان واقعی. این یک مصالحه نبود؛ این یک انتخاب معماری استراتژیک بود.

خطوط لوله در زمان واقعی جذاب به نظر می‌رسند، اما در مقیاس تجارت الکترونیک، آنها معرفی می‌کنند:

  • تاخیر غیرقابل پیش‌بینی
  • وابستگی‌های شکننده
  • افزایش‌های محاسباتی گران
  • شکنندگی عملیاتی

از سوی دیگر، وظایف آفلاین به ما داد:

  • توان عملیاتی بالا: دسته‌های عظیم پردازش شده بدون تأثیر بر سیستم‌های زنده
  • انعطاف‌پذیری: شکست‌ها هرگز بر ترافیک مشتری تأثیر نگذاشتند
  • کنترل هزینه: محاسبات می‌توانست در زمان‌های کم‌ترافیک برنامه‌ریزی شود
  • جداسازی: تاخیر LLM هرگز بر صفحات محصول تأثیر نگذاشت
  • سازگاری: به‌روزرسانی‌ها اتمی و قابل پیش‌بینی بودند

نگه داشتن سیستم‌های روبه‌مشتری جدا از خطوط لوله پردازش داده هنگام کار با میلیون‌ها SKU ضروری است.

پاکسازی و عادی‌سازی

قبل از استفاده از هوش مصنوعی بر روی داده‌ها، من یک مرحله پیش‌پردازش واضح را برای حذف نویز و سردرگمی اجرا کردم. این مرحله ممکن است ساده به نظر برسد، اما استدلال LLM را به طور قابل توجهی بهبود بخشید.

خط لوله پاکسازی شامل موارد زیر بود:

  • حذف فضای خالی
  • حذف مقادیر خالی
  • حذف تکرار مقادیر
  • تبدیل مسیرهای دسته‌بندی به یک رشته متنی

این تضمین کرد که LLM ورودی تمیز و واضحی دریافت می‌کند، که کلید نتایج سازگار است. زباله وارد، زباله خارج. در این مقیاس، حتی خطاهای کوچک می‌توانند منجر به مشکلات بزرگتری بعداً شوند.

سرویس LLM با متن

LLM فقط مقادیر را به ترتیب الفبا مرتب نمی‌کرد. در مورد آنها استدلال می‌کرد.

سرویس دریافت کرد:

  • مقادیر ویژگی پاکسازی‌شده
  • مسیرهای دسته‌بندی
  • ابرداده‌های ویژگی

با این متن، مدل می‌توانست درک کند:

  • که "ولتاژ" در ابزارهای برقی عددی است
  • که "سایز" در پوشاک از یک پیشرفت شناخته‌شده پیروی می‌کند
  • که "رنگ" در رنگ‌ها ممکن است از استانداردهای RAL پیروی کند
  • که "مواد" در سخت‌افزار دارای روابط معنایی است

مدل بازگرداند:

  • مقادیر مرتب‌شده
  • نام‌های ویژگی اصلاح‌شده
  • یک تصمیم: ترتیب قطعی یا متنی

این به خط لوله اجازه می‌دهد انواع مختلف ویژگی را بدون کدگذاری سخت قوانین برای هر دسته مدیریت کند.

جایگزین‌های قطعی

هر ویژگی به هوش مصنوعی نیاز ندارد.

در واقع، بسیاری از ویژگی‌ها با منطق قطعی بهتر مدیریت می‌شوند.

محدوده‌های عددی، مقادیر مبتنی بر واحد و مجموعه‌های ساده اغلب از موارد زیر بهره می‌برند:

  • پردازش سریع‌تر
  • ترتیب قابل پیش‌بینی
  • هزینه کمتر
  • ابهام صفر

خط لوله به طور خودکار این موارد را تشخیص داد و از منطق قطعی برای آنها استفاده کرد. این سیستم را کارآمد نگه داشت و از تماس‌های غیرضروری LLM جلوگیری کرد.

برچسب‌گذاری دستی در مقابل LLM

فروشندگان هنوز به کنترل نیاز داشتند، به ویژه برای ویژگی‌های حساس تجاری.

بنابراین هر دسته می‌توانست به صورت زیر برچسب‌گذاری شود:

  • LLM_SORT — به مدل اجازه دهید تصمیم بگیرد
  • MANUAL_SORT — فروشندگان ترتیب را تعریف می‌کنند

این سیستم برچسب دوگانه به مردم اجازه می‌دهد تصمیمات نهایی را بگیرند در حالی که هوش مصنوعی بیشتر کارها را انجام می‌داد. همچنین اعتماد ایجاد کرد، زیرا فروشندگان می‌توانستند در صورت نیاز مدل را بدون شکستن خط لوله لغو کنند.

تداوم و کنترل

تمام نتایج مستقیماً در یک پایگاه داده Product MongoDB ذخیره شدند، که معماری را ساده و متمرکز نگه می‌داشت.

MongoDB به فروشگاه عملیاتی واحد تبدیل شد برای:

  • مقادیر ویژگی مرتب‌شده
  • نام‌های ویژگی اصلاح‌شده
  • برچسب‌های مرتب‌سازی سطح دسته‌بندی
  • فیلدهای sortOrder سطح محصول

این بررسی تغییرات، لغو مقادیر، پردازش مجدد دسته‌بندی‌ها و همگام‌سازی با سیستم‌های دیگر را آسان کرد.

یکپارچه‌سازی جستجو

پس از مرتب‌سازی، مقادیر جریان یافتند به:

  • Elasticsearch برای جستجوی مبتنی بر کلمه کلیدی
  • Vespa برای جستجوی معنایی و مبتنی بر بردار

این تضمین کرد که:

  • فیلترها به ترتیب منطقی ظاهر شدند
  • صفحات محصول ویژگی‌های سازگار را نمایش دادند
  • موتورهای جستجو محصولات را دقیق‌تر رتبه‌بندی کردند
  • مشتریان می‌توانستند دسته‌بندی‌ها را راحت‌تر مرور کنند

جستجو جایی است که مرتب‌سازی ویژگی بیشترین نمایان است، و جایی که سازگاری بیشترین اهمیت را دارد.

نمای کلی معماری

برای اینکه این کار در میلیون‌ها SKU کار کند، من یک خط لوله ماژولار طراحی کردم که حول وظایف پس‌زمینه، استدلال هوش مصنوعی و یکپارچه‌سازی جستجو ساخته شده است. نمودار معماری زیر جریان کامل را نشان می‌دهد:

  • داده‌های محصول از سیستم اطلاعات محصول وارد می‌شوند
  • وظیفه استخراج ویژگی مقادیر ویژگی و متن دسته‌بندی را می‌کشد
  • اینها به سرویس مرتب‌سازی هوش مصنوعی منتقل می‌شوند
  • اسناد محصول به‌روزرسانی‌شده در Product MongoDB نوشته می‌شوند
  • وظیفه همگام‌سازی خروجی سیستم اطلاعات محصول را با ترتیب مرتب‌سازی به‌روز می‌کند
  • وظایف همگام‌سازی Elasticsearch و Vespa داده‌های مرتب‌شده را به سیستم‌های جستجوی مربوطه فشار می‌دهند
  • سرویس‌های API، Elasticsearch و Vespa را به برنامه مشتری متصل می‌کنند

این جریان اطمینان می‌دهد که هر مقدار ویژگی، چه توسط هوش مصنوعی مرتب شده یا به صورت دستی تنظیم شده، در جستجو، فروش و تجربه مشتری منعکس می‌شود.

راه‌حل در عمل

در اینجا نحوه تبدیل مقادیر نامرتب آمده است:

| ویژگی | مقادیر خام | خروجی مرتب‌شده | |----|----|----| | سایز | XL, Small, 12cm, Large, M, S | Small, M, Large, XL, 12cm | | رنگ | RAL 3020, Crimson, Red, Dark Red | Red, Dark Red, Crimson, Red (RAL 3020) | | مواد | Steel, Carbon Steel, Stainless, Stainless Steel | Steel, Stainless Steel, Carbon Steel | | عددی | 5cm, 12cm, 2cm, 20cm | 2cm, 5cm, 12cm, 20cm |

این مثال‌ها نشان می‌دهند که چگونه خط لوله استدلال متنی را با قوانین واضح ترکیب می‌کند تا توالی‌های تمیز و آسان برای درک ایجاد کند.

چرا وظایف آفلاین به جای پردازش در زمان واقعی؟

پردازش در زمان واقعی معرفی می‌کرد:

  • تاخیر غیرقابل پیش‌بینی
  • هزینه‌های محاسباتی بالاتر
  • وابستگی‌های شکننده
  • پیچیدگی عملیاتی

وظایف آفلاین به ما داد:

  • کارایی دسته‌ای
  • تماس‌های ناهمزمان LLM
  • منطق تلاش مجدد و صف‌های خطا
  • پنجره‌های بررسی انسانی
  • هزینه محاسباتی قابل پیش‌بینی

مبادله یک تاخیر کوچک بین دریافت داده و نمایش بود، اما مزیت سازگاری در مقیاس بود، که مشتریان بسیار بیشتر ارزش می‌دهند.

تأثیر

نتایج قابل توجه بودند:

  • ترتیب ویژگی سازگار در بیش از 3 میلیون SKU
  • مرتب‌سازی عددی قابل پیش‌بینی از طریق جایگزین‌های قطعی
  • کنترل فروشنده از طریق برچسب‌گذاری دستی
  • صفحات محصول تمیزتر و فیلترهای شهودی‌تر
  • ارتباط جستجوی بهبودیافته
  • اعتماد و تبدیل مشتری بالاتر

این فقط یک برد فنی نبود؛ همچنین یک برد برای تجربه کاربر و درآمد بود.

درس‌های آموخته‌شده

  • خطوط لوله ترکیبی از هوش مصنوعی خالص در مقیاس بهتر عمل می‌کنند. محافظ‌ها مهم هستند.
  • متن به طور چشمگیری دقت LLM را بهبود می‌بخشد
  • وظایف آفلاین برای توان عملیاتی و انعطاف‌پذیری ضروری هستند
  • مکانیسم‌های لغو انسانی اعتماد و پذیرش ایجاد می‌کنند
  • ورودی تمیز پایه خروجی قابل اعتماد هوش مصنوعی است

فکر نهایی

مرتب‌سازی مقادیر ویژگی ساده به نظر می‌رسد، اما زمانی که باید آن را برای میلیون‌ها محصول انجام دهید، به یک چالش واقعی تبدیل می‌شود.

با ترکیب هوش LLM با قوانین واضح و کنترل فروشنده، من یک مسئله پیچیده و پنهان را به یک سیستم تمیز و مقیاس‌پذیر تبدیل کردم.

این یادآوری است که برخی از بزرگترین برندها از حل مشکلات خسته‌کننده می‌آیند، مشکلاتی که به راحتی نادیده گرفته می‌شوند اما در هر صفحه محصول نمایش داده می‌شوند.

\n \n \n

فرصت‌ های بازار
لوگو Sleepless AI
Sleepless AI قیمت لحظه ای(AI)
$0,0383
$0,0383$0,0383
-%0,02
USD
نمودار قیمت لحظه ای Sleepless AI (AI)
سلب مسئولیت: مطالب بازنشرشده در این وب‌ سایت از منابع عمومی گردآوری شده‌ اند و صرفاً به‌ منظور اطلاع‌ رسانی ارائه می‌ شوند. این مطالب لزوماً بازتاب‌ دهنده دیدگاه‌ ها یا مواضع MEXC نیستند. کلیه حقوق مادی و معنوی آثار متعلق به نویسندگان اصلی است. در صورت مشاهده هرگونه محتوای ناقض حقوق اشخاص ثالث، لطفاً از طریق آدرس ایمیل service@support.mexc.com با ما تماس بگیرید تا مورد بررسی و حذف قرار گیرد.MEXC هیچ‌ گونه تضمینی نسبت به دقت، جامعیت یا به‌ روزبودن اطلاعات ارائه‌ شده ندارد و مسئولیتی در قبال هرگونه اقدام یا تصمیم‌ گیری مبتنی بر این اطلاعات نمی‌ پذیرد. همچنین، محتوای منتشرشده نباید به‌عنوان توصیه مالی، حقوقی یا حرفه‌ ای تلقی شود و به منزله پیشنهاد یا تأیید رسمی از سوی MEXC نیست.