خرده‌فروشی مد: پیش‌بینی تقاضا برای کالاهای جدید

1. مقدمه

پیش‌بینی تقاضا در خرده‌فروشی مد، یکی از پیچیده‌ترین چالش‌های این صنعت محسوب می‌شود. ماهیت زودگذر گرایش‌ها در رنگ‌ها، طرح‌ها، برش‌ها، الگوها و مواد، در کنار چرخه‌های طراحی طولانی، نیازمندی‌های تولید انبوه و تفاوت‌های جغرافیایی در مصرف، محیطی پرریسک برای خرده‌فروشان ایجاد می‌کند. روش‌های سنتی پیش‌بینی، به شدت به داده‌های فروش تاریخی کالاهای موجود متکی هستند و این باعث می‌شود برای پیش‌بینی تقاضای طرح‌ها یا استایل‌های کاملاً جدید، که تمرکز اصلی این پژوهش است، نامناسب باشند.

این مقاله که در کارگاه هوش مصنوعی برای مد در کنفرانس KDD 2019 ارائه شد، به این شکاف حیاتی می‌پردازد. نویسندگان از شرکت Myntra Designs رویکردی نوین ارائه می‌دهند که فراتر از تحلیل سری‌های زمانی فروش گذشته حرکت می‌کند. در عوض، آن‌ها داده‌های فروش مد در مقیاس بزرگ را تحلیل می‌کنند تا دریابند کدام ویژگی‌های خاص محصول (مانند یقه، نوع آستین، جنس پارچه) و عوامل بازاریابی (مانند قیمت، برند) محرک تقاضای مصرف‌کننده هستند. سپس مدل‌های یادگیری ماشین تعمیم‌پذیری می‌سازند که قادرند تنها بر اساس این ویژگی‌ها و پیش از وجود هرگونه سابقه فروش، تقاضا برای کالاهای جدید را پیش‌بینی کنند.

2. بیان مسئله و چالش‌ها

مسئله اصلی، سناریوی «شروع سرد» در پیش‌بینی مد است: پیش‌بینی تقاضا برای یک کالای جدید با داده فروش تاریخی صفر. تکنیک‌های متعارف در این زمینه شکست می‌خورند زیرا:

تعاملات غیرخطی: پارامترهای طراحی متعدد (رنگ، الگو، برش) به شیوه‌های پیچیده و غیرخطی با هم تعامل می‌کنند تا جذابیت یک کالا را تعریف کنند و این امر برون‌یابی ساده را غیرممکن می‌سازد.
تکیه بر شهود: روش متداول کنونی در صنعت اغلب به شهود ذهنی بازاریابان متکی است که منجر به تغییرپذیری بالا، ناتوانی در محاسبه اثرات متقابل محصولات (جایگزینی، رقابت داخلی) و خطاهای پیش‌بینی قابل توجه می‌شود.
هزینه تجاری و زیست‌محیطی: پیش‌بینی‌های نادرست منجر به از دست رفتن فرصت‌های فروش، موجودی انبوه فروخته‌نشده (زیان سرمایه در گردش) و آسیب زیست‌محیطی ناشی از تولید بیش از حد و ضایعات می‌شود.

نیاز به یک مدل مبتنی بر داده و تعمیم‌پذیر است که ویژگی‌های کالا را به یک پیش‌بینی تقاضای قابل اطمینان برای افق برنامه‌ریزی ۶ تا ۸ ماهه تبدیل کند.

3. روش‌شناسی و رویکرد فنی

روش‌شناسی نویسندگان از مدل‌سازی سری‌های زمانی به مدل‌سازی فضای معنایی ویژگی‌های مد تغییر جهت می‌دهد.

3.1 داده‌ها و نمایش ویژگی‌ها

مدل بر روی یک مجموعه داده بزرگ از کالاهای مد تاریخی ساخته شده است که هر کدام با مجموعه‌ای غنی از ویژگی‌های دسته‌ای و عددی توصیف شده‌اند. کلید رویکرد آن‌ها، ایجاد جاسازی‌های ویژگی است. مشابه جاسازی کلمات در پردازش زبان طبیعی (مانند Word2Vec)، ویژگی‌های دسته‌ای (مانند «یقه گرد»، «طرح گلدار») به نمایش‌های برداری متراکم و پیوسته تبدیل می‌شوند. این امر به مدل اجازه می‌دهد تا روابط و شباهت‌های ظریف بین ویژگی‌ها را یاد بگیرد (مثلاً اینکه «یقه هفت» و «یقه قاشقی» به یکدیگر شبیه‌ترند تا به «یقه اسکی»).

3.2 معماری‌های مدل

مقاله با چندین معماری عصبی و روش‌های سنتی یادگیری ماشین آزمایش می‌کند:

مدل‌های مبتنی بر درخت (XGBoost، جنگل تصادفی): به عنوان خط‌مبناهای قدرتمند استفاده می‌شوند که قادر به مدیریت داده‌های جدولی با انواع ویژگی‌های مختلط هستند.
شبکه‌های عصبی پیش‌خور (FFNN): پرسپترون‌های چندلایه استانداردی که جاسازی‌های ویژگی الحاق‌شده و ویژگی‌های عددی را به عنوان ورودی می‌گیرند.
شبکه‌های حافظه کوتاه‌مدت-بلندمدت (LSTM): نه برای دنباله‌های زمانی فروش، بلکه به طور بالقوه برای مدل‌سازی دنباله‌ای از ویژگی‌ها یا برای ثبت وابستگی‌ها در خط پردازش ویژگی به کار گرفته شده‌اند. مقاله کاربرد آن‌ها را در این زمینه غیرترتیبی بررسی می‌کند.

معماری اصلی شامل یک لایه جاسازی برای هر ویژگی دسته‌ای است که خروجی‌های آن‌ها ترکیب شده (مثلاً الحاق یا تجمیع می‌شوند) و به لایه‌های شبکه عصبی بعدی برای پیش‌بینی نهایی تقاضا وارد می‌شوند.

3.3 توابع زیان

انتخاب تابع هدف مناسب برای تأثیر تجاری حیاتی است. نویسندگان فراتر از خطای میانگین مربعات استاندارد (MSE) آزمایش می‌کنند. آن‌ها توابع زیان نامتقارنی را در نظر می‌گیرند که موجودی بیش از حد (پیش‌بینی بیش از حد بالا) و موجودی ناکافی (پیش‌بینی بیش از حد پایین) را به طور متفاوت جریمه می‌کنند و هدف بهینه‌سازی مدل را با ساختار هزینه واقعی مدیریت موجودی خرده‌فروشی همسو می‌سازند. یک فرم ساده‌شده می‌تواند به این شکل باشد:

$L(y, \hat{y}) = \begin{cases} c_{over} \cdot (\hat{y} - y) & \text{if } \hat{y} > y \\ c_{under} \cdot (y - \hat{y}) & \text{if } \hat{y} \leq y \end{cases}$

که در آن $c_{over}$ و $c_{under}$ به ترتیب هزینه‌های پیش‌بینی بیش از حد و پیش‌بینی کمتر از حد هستند.

4. نتایج آزمایشی و تحلیل

مقاله عملکرد قوی مدل‌های مبتنی بر ویژگی پیشنهادی را نشان می‌دهد. یافته‌های کلیدی احتمالاً شامل موارد زیر است (استنباط شده از چکیده):

برتری نسبت به خط‌مبناها: مدل‌های عصبی با جاسازی ویژگی‌ها به طور قابل توجهی از مدل‌های ساده برون‌یابی تاریخی و احتمالاً مدل‌های سنتی یادگیری ماشین در وظیفه پیش‌بینی کالای جدید بهتر عمل می‌کنند.
قدرت تعمیم‌پذیری: مدل‌ها توانایی تعمیم به ترکیب‌های مشاهده‌نشده ویژگی‌ها را نشان می‌دهند که فرضیه اصلی مبنی بر هدایت تقاضا توسط ویژگی‌های تجزیه‌پذیر را تأیید می‌کند.
مقایسه معماری: نتایج، تحلیل مقایسه‌ای FFNNها در مقابل LSTMها را در این تنظیمات ارائه می‌دهد و احتمالاً نتیجه می‌گیرد که اگرچه LSTMها قدرتمندند، FFNNهای ساده‌تر ممکن است برای این مسئله خاص نگاشت ویژگی به تقاضا کافی و کارآمدتر باشند.
تأثیر تابع زیان: مدل‌های آموزش دیده با توابع زیان نامتقارن آگاه از کسب‌وکار، منجر به پیش‌بینی‌هایی می‌شوند که هزینه واقعی موجودی را به حداقل می‌رسانند، نه فقط خطای پیش‌بینی.

توضیح نمودار (استنباط شده): یک نمودار میله‌ای احتمالاً معیارهای مقایسه‌ای (مانند میانگین درصد خطای مطلق - MAPE، یا یک معیار سفارشی مبتنی بر هزینه) را برای مدل‌های مختلف نشان می‌دهد: یک خط‌مبنای ساده (مثلاً میانگین تقاضا برای دسته‌های مشابه)، مدل‌های مبتنی بر درخت (XGBoost)، FFNN و LSTM. مدل‌های شبکه عصبی با جاسازی کمترین خطا را نشان می‌دهند. یک نمودار دوم ممکن است نشان دهد که چگونه خطای پیش‌بینی با پارامتر عدم تقارن در تابع زیان سفارشی تغییر می‌کند و یک حداقل واضح در یک تنظیم بهینه تجاری نشان می‌دهد.

5. مطالعه موردی: کاربرد چارچوب

سناریو: یک خرده‌فروش فست‌فشن نیاز به پیش‌بینی تقاضا برای یک لباس زنانه تابستانی جدید برنامه‌ریزی شده برای فصل آینده دارد.

مرحله ۱ - تعریف ویژگی‌ها: تیم محصول ویژگی‌های آن را تعریف می‌کند: {دسته: لباس، زیردسته: میدی، یقه: هفت، آستین: کوتاه، طرح: گلدار، رنگ: آبی پاستلی، جنس: پنبه، رده قیمت: متوسط، برند: برند داخلی}.

مرحله ۲ - برداری‌سازی ویژگی‌ها: هر ویژگی دسته‌ای (یقه، طرح و غیره) از طریق لایه جاسازی از پیش آموزش‌دیده خود عبور داده می‌شود و «یقه هفت» و «گلدار» را به بردارهای متراکم تبدیل می‌کند (مثلاً [0.2, -0.5, 0.8...]). ویژگی‌های عددی مانند قیمت نرمال‌سازی می‌شوند.

مرحله ۳ - استنتاج مدل: تمام بردارهای ویژگی و ویژگی‌های عددی در یک بردار ورودی واحد الحاق می‌شوند. این بردار به مدل FFNN آموزش‌دیده وارد می‌شود.

مرحله ۴ - پیش‌بینی تقاضا: مدل یک مقدار پیوسته خروجی می‌دهد که نشان‌دهنده تعداد کل واحدهای پیش‌بینی شده فروخته شده در فصل اول است. این پیش‌بینی برای برنامه‌ریزی تولید و تخصیص موجودی استفاده می‌شود.

بینش: مدل ممکن است به طور داخلی تشخیص دهد که ترکیب «گلدار»، «آبی پاستلی» و طول «میدی» در رده قیمت «متوسط» در طول تابستان بسیار موفق بوده است که منجر به یک پیش‌بینی با اطمینان بالا و حجم زیاد می‌شود.

6. کاربردها و جهت‌های آینده

رویکرد ارائه شده، چندین مسیر امیدوارکننده را باز می‌کند:

حلقه طراحی مولد و پیش‌بینی: ادغام این مدل پیش‌بین با هوش مصنوعی مولد (مانند GANها یا مدل‌های انتشار، مشابه آن‌هایی که در سنتز تصویر از متن استفاده می‌شوند) می‌تواند یک سیستم حلقه بسته ایجاد کند. طراحان می‌توانند تابلوهای خلق‌و‌خوی گرایش‌ها را وارد کنند، یک مولد (الهام گرفته از مدل‌هایی مانند CycleGAN برای انتقال سبک) ترکیب‌های ویژگی جدیدی تولید می‌کند و پیش‌بین پتانسیل تجاری آن‌ها را ارزیابی می‌کند و این امکان طراحی با کمک هوش مصنوعی برای کالاهای پرتقاضا را فراهم می‌آورد.
ادغام قیمت‌گذاری پویا: مدل می‌تواند به یک تابع تقاضا $D(attributes, price)$ گسترش یابد که امکان استراتژی‌های قیمت‌گذاری اولیه بهینه و تخفیف برای کالاهای جدید را فراهم می‌کند.
انطباق بین‌حوزه‌ای: روش‌شناسی اصلی جاسازی ویژگی برای پیش‌بینی شروع سرد، به سایر بخش‌های عمودی خرده‌فروشی با ویژگی‌های محصول غنی، مانند الکترونیک، مبلمان یا لوازم آرایشی قابل انتقال است.
هوش مصنوعی قابل تفسیر (XAI): کار آینده می‌تواند بر تفسیر فضاهای جاسازی و تصمیمات مدل متمرکز شود و به این سؤال پاسخ دهد که چرا پیش‌بینی می‌شود یک ترکیب ویژگی خاص موفق باشد و بازخورد ارزشمندی به بازاریابان ارائه دهد.
ادغام گرایش‌های بلادرنگ: تقویت ویژگی‌های ایستا با سیگنال‌های بلادرنگ از رسانه‌های اجتماعی (مانند اینستاگرام، پینترست) یا گرایش‌های جستجو می‌تواند پیش‌بینی‌ها را نسبت به مدهای نوظهور پاسخگوتر کند.

7. مراجع

Singh, P. K., Gupta, Y., Jha, N., & Rajan, A. (2019). Fashion Retail: Forecasting Demand for New Items. In Proceedings of the KDD 2019 Workshop on AI for Fashion.
Ferreira, K. J., Lee, B. H. A., & Simchi-Levi, D. (2015). Analytics for an Online Retailer: Demand Forecasting and Price Optimization. Manufacturing & Service Operations Management, 18(1), 69–88.
Mikolov, T., Chen, K., Corrado, G., & Dean, J. (2013). Efficient Estimation of Word Representations in Vector Space. arXiv preprint arXiv:1301.3781.
Zhu, J.-Y., Park, T., Isola, P., & Efros, A. A. (2017). Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks. In Proceedings of the IEEE International Conference on Computer Vision (ICCV). (مقاله CycleGAN که برای مفهوم طراحی مولد ارجاع داده شده است).
Academictorrents.com & arXiv.org - به عنوان پایگاه‌های داده دانشگاهی دسترسی آزاد نماینده برای کارهای مرتبط در یادگیری ماشین و پیش‌بینی.

8. دیدگاه تحلیلگر

بینش اصلی: کار تیم Myntra یک تکامل عملی و ضروری فراتر از پرستش سری‌های زمانی در هوش مصنوعی خرده‌فروشی است. بینش بنیادی آن‌ها—که تقاضای آینده مد تابعی از منحنی‌های فروش گذشته نیست، بلکه از ویژگی‌های زیبایی‌شناختی و تجاری تجزیه‌پذیر و قابل یادگیری است—دقیقاً هدف را می‌زند. آن‌ها اساساً در حال ساخت یک «موتور سلیقه» هستند که زبان کیفی طراحی را به زبان کمّی حجم پیش‌بینی شده ترجمه می‌کنند. این امر صنعت را از تحلیل‌های واکنشی به پیش‌بینی پیش‌دستانه و مبتنی بر قصد طراحی منتقل می‌کند.

جریان منطقی و شایستگی فنی: روش‌شناسی صحیح است و به طور هوشمندانه از موفقیت جاسازی‌ها در پردازش زبان طبیعی وام گرفته است. برخورد با «یقه قایقی» یا «طرح حیوانی» به عنوان نشانه‌هایی در «واژگان مد» و یادگیری روابط معنایی آن‌ها، ظریف است. آزمایش با معماری‌های عصبی مختلف و مهم‌تر از آن، توابع زیان آگاه از هزینه کسب‌وکار، بلوغی را نشان می‌دهد که اغلب در پژوهش‌های صرف یادگیری ماشین مفقود است. این فقط درباره خطای کمتر نیست، بلکه درباره زیان مالی کمتر است. با این حال، مقاله از غور عمیق‌تر در فضاهای جاسازی یادگرفته شده سود می‌برد—مدل درباره «شباهت» بین رنگ‌ها یا طرح‌ها چه می‌آموزد؟ تجسم این موارد، همان‌طور که در پردازش زبان طبیعی انجام می‌شود، می‌تواند بینش‌های شگفت‌انگیزی در مورد گرایش‌های پنهان مد ارائه دهد.

نقاط قوت و ضعف: نقطه قوت کلیدی، قابلیت کاربرد مستقیم آن برای مسئله چند میلیارد دلاری شروع سرد است. این یک نقشه راه آماده تولید است. یک نقص قابل توجه، که تصدیق شده اما به طور کامل حل نشده، ماهیت ایستای مدل است. مد فقط درباره ویژگی‌ها در خلأ نیست؛ بلکه درباره تازگی و چرخه عمر آن‌ها در یک گرایش است. یک ویژگی «پپلوم» ممکن است در سال ۲۰۱۴ وزن مثبت، در سال ۲۰۱۸ خنثی و امروز وزن منفی داشته باشد. مدل به یک بعد زمانی برای تکانه یا خستگی ویژگی نیاز دارد، شاید با وابسته کردن جاسازی‌ها به زمان یا ادغام سیگنال‌های سرعت گرایش از داده‌های خارجی، تکنیکی که در آزمایشگاه‌های پژوهشی پیشرو فناوری بررسی شده است.

بینش‌های قابل اجرا: برای خرده‌فروشان، اقدام فوری سرمایه‌گذاری در رده‌بندی‌های غنی، یکپارچه و ریزدانه ویژگی محصول است. زیرساخت داده شما اکنون یک دارایی طراحی اصلی است. برای تیم‌های فناوری، اولویت‌دهی به توابع زیان نامتقارن و تعریف‌شده توسط کسب‌وکار بر معیارهای دقت ساده است. در نهایت، این را نه به عنوان یک ابزار پیش‌بینی صرف، بلکه به عنوان اولین مؤلفه یک سیستم طراحی مولد ببینید. گام منطقی بعدی معکوس کردن مدل است: استفاده از پیش‌بین به عنوان یک منتقد برای هدایت یک هوش مصنوعی مولد (مانند یک گونه خاص مد از یک مدل انتشار) برای ایجاد ترکیب‌های ویژگی با امتیاز بالا و نوآورانه، که به طور مؤثر فرآیند طوفان فکری طراحی اولیه را خودکار می‌کند. اینجاست که اختلال واقعی نهفته است.