1. مقدمه
پیشبینی تقاضا در خردهفروشی مد، یکی از پیچیدهترین چالشهای این صنعت محسوب میشود. ماهیت زودگذر گرایشها در رنگها، طرحها، برشها، الگوها و مواد، در کنار چرخههای طراحی طولانی، نیازمندیهای تولید انبوه و تفاوتهای جغرافیایی در مصرف، محیطی پرریسک برای خردهفروشان ایجاد میکند. روشهای سنتی پیشبینی، به شدت به دادههای فروش تاریخی کالاهای موجود متکی هستند و این باعث میشود برای پیشبینی تقاضای طرحها یا استایلهای کاملاً جدید، که تمرکز اصلی این پژوهش است، نامناسب باشند.
این مقاله که در کارگاه هوش مصنوعی برای مد در کنفرانس KDD 2019 ارائه شد، به این شکاف حیاتی میپردازد. نویسندگان از شرکت Myntra Designs رویکردی نوین ارائه میدهند که فراتر از تحلیل سریهای زمانی فروش گذشته حرکت میکند. در عوض، آنها دادههای فروش مد در مقیاس بزرگ را تحلیل میکنند تا دریابند کدام ویژگیهای خاص محصول (مانند یقه، نوع آستین، جنس پارچه) و عوامل بازاریابی (مانند قیمت، برند) محرک تقاضای مصرفکننده هستند. سپس مدلهای یادگیری ماشین تعمیمپذیری میسازند که قادرند تنها بر اساس این ویژگیها و پیش از وجود هرگونه سابقه فروش، تقاضا برای کالاهای جدید را پیشبینی کنند.
2. بیان مسئله و چالشها
مسئله اصلی، سناریوی «شروع سرد» در پیشبینی مد است: پیشبینی تقاضا برای یک کالای جدید با داده فروش تاریخی صفر. تکنیکهای متعارف در این زمینه شکست میخورند زیرا:
- تعاملات غیرخطی: پارامترهای طراحی متعدد (رنگ، الگو، برش) به شیوههای پیچیده و غیرخطی با هم تعامل میکنند تا جذابیت یک کالا را تعریف کنند و این امر برونیابی ساده را غیرممکن میسازد.
- تکیه بر شهود: روش متداول کنونی در صنعت اغلب به شهود ذهنی بازاریابان متکی است که منجر به تغییرپذیری بالا، ناتوانی در محاسبه اثرات متقابل محصولات (جایگزینی، رقابت داخلی) و خطاهای پیشبینی قابل توجه میشود.
- هزینه تجاری و زیستمحیطی: پیشبینیهای نادرست منجر به از دست رفتن فرصتهای فروش، موجودی انبوه فروختهنشده (زیان سرمایه در گردش) و آسیب زیستمحیطی ناشی از تولید بیش از حد و ضایعات میشود.
نیاز به یک مدل مبتنی بر داده و تعمیمپذیر است که ویژگیهای کالا را به یک پیشبینی تقاضای قابل اطمینان برای افق برنامهریزی ۶ تا ۸ ماهه تبدیل کند.
3. روششناسی و رویکرد فنی
روششناسی نویسندگان از مدلسازی سریهای زمانی به مدلسازی فضای معنایی ویژگیهای مد تغییر جهت میدهد.
3.1 دادهها و نمایش ویژگیها
مدل بر روی یک مجموعه داده بزرگ از کالاهای مد تاریخی ساخته شده است که هر کدام با مجموعهای غنی از ویژگیهای دستهای و عددی توصیف شدهاند. کلید رویکرد آنها، ایجاد جاسازیهای ویژگی است. مشابه جاسازی کلمات در پردازش زبان طبیعی (مانند Word2Vec)، ویژگیهای دستهای (مانند «یقه گرد»، «طرح گلدار») به نمایشهای برداری متراکم و پیوسته تبدیل میشوند. این امر به مدل اجازه میدهد تا روابط و شباهتهای ظریف بین ویژگیها را یاد بگیرد (مثلاً اینکه «یقه هفت» و «یقه قاشقی» به یکدیگر شبیهترند تا به «یقه اسکی»).
3.2 معماریهای مدل
مقاله با چندین معماری عصبی و روشهای سنتی یادگیری ماشین آزمایش میکند:
- مدلهای مبتنی بر درخت (XGBoost، جنگل تصادفی): به عنوان خطمبناهای قدرتمند استفاده میشوند که قادر به مدیریت دادههای جدولی با انواع ویژگیهای مختلط هستند.
- شبکههای عصبی پیشخور (FFNN): پرسپترونهای چندلایه استانداردی که جاسازیهای ویژگی الحاقشده و ویژگیهای عددی را به عنوان ورودی میگیرند.
- شبکههای حافظه کوتاهمدت-بلندمدت (LSTM): نه برای دنبالههای زمانی فروش، بلکه به طور بالقوه برای مدلسازی دنبالهای از ویژگیها یا برای ثبت وابستگیها در خط پردازش ویژگی به کار گرفته شدهاند. مقاله کاربرد آنها را در این زمینه غیرترتیبی بررسی میکند.
معماری اصلی شامل یک لایه جاسازی برای هر ویژگی دستهای است که خروجیهای آنها ترکیب شده (مثلاً الحاق یا تجمیع میشوند) و به لایههای شبکه عصبی بعدی برای پیشبینی نهایی تقاضا وارد میشوند.
3.3 توابع زیان
انتخاب تابع هدف مناسب برای تأثیر تجاری حیاتی است. نویسندگان فراتر از خطای میانگین مربعات استاندارد (MSE) آزمایش میکنند. آنها توابع زیان نامتقارنی را در نظر میگیرند که موجودی بیش از حد (پیشبینی بیش از حد بالا) و موجودی ناکافی (پیشبینی بیش از حد پایین) را به طور متفاوت جریمه میکنند و هدف بهینهسازی مدل را با ساختار هزینه واقعی مدیریت موجودی خردهفروشی همسو میسازند. یک فرم سادهشده میتواند به این شکل باشد:
$L(y, \hat{y}) = \begin{cases} c_{over} \cdot (\hat{y} - y) & \text{if } \hat{y} > y \\ c_{under} \cdot (y - \hat{y}) & \text{if } \hat{y} \leq y \end{cases}$
که در آن $c_{over}$ و $c_{under}$ به ترتیب هزینههای پیشبینی بیش از حد و پیشبینی کمتر از حد هستند.
4. نتایج آزمایشی و تحلیل
مقاله عملکرد قوی مدلهای مبتنی بر ویژگی پیشنهادی را نشان میدهد. یافتههای کلیدی احتمالاً شامل موارد زیر است (استنباط شده از چکیده):
- برتری نسبت به خطمبناها: مدلهای عصبی با جاسازی ویژگیها به طور قابل توجهی از مدلهای ساده برونیابی تاریخی و احتمالاً مدلهای سنتی یادگیری ماشین در وظیفه پیشبینی کالای جدید بهتر عمل میکنند.
- قدرت تعمیمپذیری: مدلها توانایی تعمیم به ترکیبهای مشاهدهنشده ویژگیها را نشان میدهند که فرضیه اصلی مبنی بر هدایت تقاضا توسط ویژگیهای تجزیهپذیر را تأیید میکند.
- مقایسه معماری: نتایج، تحلیل مقایسهای FFNNها در مقابل LSTMها را در این تنظیمات ارائه میدهد و احتمالاً نتیجه میگیرد که اگرچه LSTMها قدرتمندند، FFNNهای سادهتر ممکن است برای این مسئله خاص نگاشت ویژگی به تقاضا کافی و کارآمدتر باشند.
- تأثیر تابع زیان: مدلهای آموزش دیده با توابع زیان نامتقارن آگاه از کسبوکار، منجر به پیشبینیهایی میشوند که هزینه واقعی موجودی را به حداقل میرسانند، نه فقط خطای پیشبینی.
توضیح نمودار (استنباط شده): یک نمودار میلهای احتمالاً معیارهای مقایسهای (مانند میانگین درصد خطای مطلق - MAPE، یا یک معیار سفارشی مبتنی بر هزینه) را برای مدلهای مختلف نشان میدهد: یک خطمبنای ساده (مثلاً میانگین تقاضا برای دستههای مشابه)، مدلهای مبتنی بر درخت (XGBoost)، FFNN و LSTM. مدلهای شبکه عصبی با جاسازی کمترین خطا را نشان میدهند. یک نمودار دوم ممکن است نشان دهد که چگونه خطای پیشبینی با پارامتر عدم تقارن در تابع زیان سفارشی تغییر میکند و یک حداقل واضح در یک تنظیم بهینه تجاری نشان میدهد.
5. مطالعه موردی: کاربرد چارچوب
سناریو: یک خردهفروش فستفشن نیاز به پیشبینی تقاضا برای یک لباس زنانه تابستانی جدید برنامهریزی شده برای فصل آینده دارد.
مرحله ۱ - تعریف ویژگیها: تیم محصول ویژگیهای آن را تعریف میکند: {دسته: لباس، زیردسته: میدی، یقه: هفت، آستین: کوتاه، طرح: گلدار، رنگ: آبی پاستلی، جنس: پنبه، رده قیمت: متوسط، برند: برند داخلی}.
مرحله ۲ - برداریسازی ویژگیها: هر ویژگی دستهای (یقه، طرح و غیره) از طریق لایه جاسازی از پیش آموزشدیده خود عبور داده میشود و «یقه هفت» و «گلدار» را به بردارهای متراکم تبدیل میکند (مثلاً [0.2, -0.5, 0.8...]). ویژگیهای عددی مانند قیمت نرمالسازی میشوند.
مرحله ۳ - استنتاج مدل: تمام بردارهای ویژگی و ویژگیهای عددی در یک بردار ورودی واحد الحاق میشوند. این بردار به مدل FFNN آموزشدیده وارد میشود.
مرحله ۴ - پیشبینی تقاضا: مدل یک مقدار پیوسته خروجی میدهد که نشاندهنده تعداد کل واحدهای پیشبینی شده فروخته شده در فصل اول است. این پیشبینی برای برنامهریزی تولید و تخصیص موجودی استفاده میشود.
بینش: مدل ممکن است به طور داخلی تشخیص دهد که ترکیب «گلدار»، «آبی پاستلی» و طول «میدی» در رده قیمت «متوسط» در طول تابستان بسیار موفق بوده است که منجر به یک پیشبینی با اطمینان بالا و حجم زیاد میشود.
6. کاربردها و جهتهای آینده
رویکرد ارائه شده، چندین مسیر امیدوارکننده را باز میکند:
- حلقه طراحی مولد و پیشبینی: ادغام این مدل پیشبین با هوش مصنوعی مولد (مانند GANها یا مدلهای انتشار، مشابه آنهایی که در سنتز تصویر از متن استفاده میشوند) میتواند یک سیستم حلقه بسته ایجاد کند. طراحان میتوانند تابلوهای خلقوخوی گرایشها را وارد کنند، یک مولد (الهام گرفته از مدلهایی مانند CycleGAN برای انتقال سبک) ترکیبهای ویژگی جدیدی تولید میکند و پیشبین پتانسیل تجاری آنها را ارزیابی میکند و این امکان طراحی با کمک هوش مصنوعی برای کالاهای پرتقاضا را فراهم میآورد.
- ادغام قیمتگذاری پویا: مدل میتواند به یک تابع تقاضا $D(attributes, price)$ گسترش یابد که امکان استراتژیهای قیمتگذاری اولیه بهینه و تخفیف برای کالاهای جدید را فراهم میکند.
- انطباق بینحوزهای: روششناسی اصلی جاسازی ویژگی برای پیشبینی شروع سرد، به سایر بخشهای عمودی خردهفروشی با ویژگیهای محصول غنی، مانند الکترونیک، مبلمان یا لوازم آرایشی قابل انتقال است.
- هوش مصنوعی قابل تفسیر (XAI): کار آینده میتواند بر تفسیر فضاهای جاسازی و تصمیمات مدل متمرکز شود و به این سؤال پاسخ دهد که چرا پیشبینی میشود یک ترکیب ویژگی خاص موفق باشد و بازخورد ارزشمندی به بازاریابان ارائه دهد.
- ادغام گرایشهای بلادرنگ: تقویت ویژگیهای ایستا با سیگنالهای بلادرنگ از رسانههای اجتماعی (مانند اینستاگرام، پینترست) یا گرایشهای جستجو میتواند پیشبینیها را نسبت به مدهای نوظهور پاسخگوتر کند.
7. مراجع
- Singh, P. K., Gupta, Y., Jha, N., & Rajan, A. (2019). Fashion Retail: Forecasting Demand for New Items. In Proceedings of the KDD 2019 Workshop on AI for Fashion.
- Ferreira, K. J., Lee, B. H. A., & Simchi-Levi, D. (2015). Analytics for an Online Retailer: Demand Forecasting and Price Optimization. Manufacturing & Service Operations Management, 18(1), 69–88.
- Mikolov, T., Chen, K., Corrado, G., & Dean, J. (2013). Efficient Estimation of Word Representations in Vector Space. arXiv preprint arXiv:1301.3781.
- Zhu, J.-Y., Park, T., Isola, P., & Efros, A. A. (2017). Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks. In Proceedings of the IEEE International Conference on Computer Vision (ICCV). (مقاله CycleGAN که برای مفهوم طراحی مولد ارجاع داده شده است).
- Academictorrents.com & arXiv.org - به عنوان پایگاههای داده دانشگاهی دسترسی آزاد نماینده برای کارهای مرتبط در یادگیری ماشین و پیشبینی.
8. دیدگاه تحلیلگر
بینش اصلی: کار تیم Myntra یک تکامل عملی و ضروری فراتر از پرستش سریهای زمانی در هوش مصنوعی خردهفروشی است. بینش بنیادی آنها—که تقاضای آینده مد تابعی از منحنیهای فروش گذشته نیست، بلکه از ویژگیهای زیباییشناختی و تجاری تجزیهپذیر و قابل یادگیری است—دقیقاً هدف را میزند. آنها اساساً در حال ساخت یک «موتور سلیقه» هستند که زبان کیفی طراحی را به زبان کمّی حجم پیشبینی شده ترجمه میکنند. این امر صنعت را از تحلیلهای واکنشی به پیشبینی پیشدستانه و مبتنی بر قصد طراحی منتقل میکند.
جریان منطقی و شایستگی فنی: روششناسی صحیح است و به طور هوشمندانه از موفقیت جاسازیها در پردازش زبان طبیعی وام گرفته است. برخورد با «یقه قایقی» یا «طرح حیوانی» به عنوان نشانههایی در «واژگان مد» و یادگیری روابط معنایی آنها، ظریف است. آزمایش با معماریهای عصبی مختلف و مهمتر از آن، توابع زیان آگاه از هزینه کسبوکار، بلوغی را نشان میدهد که اغلب در پژوهشهای صرف یادگیری ماشین مفقود است. این فقط درباره خطای کمتر نیست، بلکه درباره زیان مالی کمتر است. با این حال، مقاله از غور عمیقتر در فضاهای جاسازی یادگرفته شده سود میبرد—مدل درباره «شباهت» بین رنگها یا طرحها چه میآموزد؟ تجسم این موارد، همانطور که در پردازش زبان طبیعی انجام میشود، میتواند بینشهای شگفتانگیزی در مورد گرایشهای پنهان مد ارائه دهد.
نقاط قوت و ضعف: نقطه قوت کلیدی، قابلیت کاربرد مستقیم آن برای مسئله چند میلیارد دلاری شروع سرد است. این یک نقشه راه آماده تولید است. یک نقص قابل توجه، که تصدیق شده اما به طور کامل حل نشده، ماهیت ایستای مدل است. مد فقط درباره ویژگیها در خلأ نیست؛ بلکه درباره تازگی و چرخه عمر آنها در یک گرایش است. یک ویژگی «پپلوم» ممکن است در سال ۲۰۱۴ وزن مثبت، در سال ۲۰۱۸ خنثی و امروز وزن منفی داشته باشد. مدل به یک بعد زمانی برای تکانه یا خستگی ویژگی نیاز دارد، شاید با وابسته کردن جاسازیها به زمان یا ادغام سیگنالهای سرعت گرایش از دادههای خارجی، تکنیکی که در آزمایشگاههای پژوهشی پیشرو فناوری بررسی شده است.
بینشهای قابل اجرا: برای خردهفروشان، اقدام فوری سرمایهگذاری در ردهبندیهای غنی، یکپارچه و ریزدانه ویژگی محصول است. زیرساخت داده شما اکنون یک دارایی طراحی اصلی است. برای تیمهای فناوری، اولویتدهی به توابع زیان نامتقارن و تعریفشده توسط کسبوکار بر معیارهای دقت ساده است. در نهایت، این را نه به عنوان یک ابزار پیشبینی صرف، بلکه به عنوان اولین مؤلفه یک سیستم طراحی مولد ببینید. گام منطقی بعدی معکوس کردن مدل است: استفاده از پیشبین به عنوان یک منتقد برای هدایت یک هوش مصنوعی مولد (مانند یک گونه خاص مد از یک مدل انتشار) برای ایجاد ترکیبهای ویژگی با امتیاز بالا و نوآورانه، که به طور مؤثر فرآیند طوفان فکری طراحی اولیه را خودکار میکند. اینجاست که اختلال واقعی نهفته است.