اختر اللغة

التجزئة في مجال الأزياء: التنبؤ بالطلب على المنتجات الجديدة - نهج التعلم الآلي

ورقة بحثية تحلل نماذج التعلم الآلي للتنبؤ بطلب منتجات الأزياء الجديدة باستخدام تضمين السمات والشبكات العصبية، مُقدمة في مؤتمر KDD 2019.
diyshow.org | PDF Size: 3.4 MB
التقييم: 4.5/5
تقييمك
لقد قيمت هذا المستند مسبقاً
غلاف مستند PDF - التجزئة في مجال الأزياء: التنبؤ بالطلب على المنتجات الجديدة - نهج التعلم الآلي

1. المقدمة

يمثل التنبؤ بالطلب في تجارة التجزئة للأزياء أحد أكثر التحديات تعقيدًا في الصناعة. فالطبيعة العابرة لاتجاهات الألوان، والطباعة، والتقصير، والنقوش، والمواد، مجتمعة مع دورات التصميم الطويلة، ومتطلبات التصنيع بالجملة، والاختلافات الجغرافية في الاستهلاك، تخلق بيئة عالية المخاطر لتجار التجزئة. تعتمد طرق التنبؤ التقليدية بشكل كبير على بيانات المبيعات التاريخية للمنتجات الحالية، مما يجعلها غير مناسبة للتنبؤ بالطلب على التصميمات أو الأنماط الجديدة تمامًا، وهو المحور الرئيسي لهذا البحث.

تتناول هذه الورقة البحثية، التي قُدمت في ورشة عمل KDD 2019 حول الذكاء الاصطناعي للأزياء، هذه الفجوة الحرجة. يقترح المؤلفون من Myntra Designs نهجًا جديدًا يتجاوز تحليل السلاسل الزمنية للمبيعات السابقة. بدلاً من ذلك، يحللون بيانات المبيعات الضخمة للأزياء لاستنتاج أي سمات منتج محددة (مثل خط العنق، ونوع الكم، والنسيج) وعوامل التسويق (مثل نقطة السعر، والعلامة التجارية) هي التي تحفز طلب المستهلك. ثم يقومون ببناء نماذج تعلم آلي معممة قادرة على التنبؤ بالطلب على المنتجات الجديدة بناءً على هذه السمات وحدها، قبل وجود أي تاريخ مبيعات.

2. بيان المشكلة والتحديات

المشكلة الأساسية هي سيناريو "البداية الباردة" في التنبؤ بالأزياء: التنبؤ بالطلب على منتج جديد بدون أي بيانات مبيعات تاريخية. تفشل التقنيات التقليدية لأن:

  • التفاعلات غير الخطية: تتفاعل معلمات التصميم المتعددة (اللون، النقش، القص) بطرق معقدة وغير خطية لتحديد جاذبية المنتج، مما يجعل الاستقراء البسيط مستحيلاً.
  • الاعتماد على الحدس: تعتمد الممارسة الحالية في الصناعة غالبًا على الحدس الذاتي للمسوقين، مما يؤدي إلى تباين كبير، وعدم القدرة على حساب تأثيرات المنتجات المتقاطعة (الاستبدال، الاقتطاع)، وأخطاء تنبؤ كبيرة.
  • التكلفة التجارية والبيئية: تؤدي التنبؤات غير الدقيقة إلى فقدان فرص المبيعات، ومخزون ضخم غير مباع (خسارة رأس المال العامل)، وأضرار بيئية من الإفراط في الإنتاج والنفايات.

الحاجة هي لنموذج قائم على البيانات وقابل للتعميم يحول سمات المنتج إلى تنبؤ طلب موثوق به لأفق تخطيط يتراوح بين 6-8 أشهر.

3. المنهجية والنهج التقني

تتحول منهجية المؤلفين من نمذجة السلاسل الزمنية إلى نمذجة الفضاء الدلالي لسمات الأزياء.

3.1 البيانات وتمثيل السمات

يُبنى النموذج على مجموعة بيانات كبيرة من منتجات الأزياء التاريخية، يوصف كل منها بمجموعة غنية من السمات الفئوية والرقمية. المفتاح في نهجهم هو إنشاء تضمينات السمات. على غرار تضمينات الكلمات في معالجة اللغات الطبيعية (مثل Word2Vec)، يتم تحويل السمات الفئوية (مثل "ياقة مستديرة"، "طباعة زهرية") إلى تمثيلات متجهية كثيفة ومستمرة. وهذا يسمح للنموذج بتعلم العلاقات الدقيقة والتشابهات بين السمات (مثل أن "الياقة على شكل V" و"الياقة المستديرة العميقة" أكثر تشابهًا مع بعضهما البعض من "الياقة الطويلة").

3.2 هيكليات النماذج

تختبر الورقة البحثية هياكل عصبية متعددة وطرق تعلم آلي تقليدية:

  • النماذج القائمة على الأشجار (XGBoost، Random Forest): تُستخدم كخطوط أساس قوية، قادرة على التعامل مع البيانات الجدولية ذات أنواع الميزات المختلطة.
  • الشبكات العصبية ذات التغذية الأمامية (FFNN): هي مُدركات متعددة الطبقات قياسية تأخذ تضمينات السمات المدمجة والميزات الرقمية كمدخلات.
  • شبكات الذاكرة قصيرة وطويلة المدى (LSTM): تُستخدم ليس لتسلسلات المبيعات الزمنية، ولكن ربما لنمذجة تسلسلات السمات أو لالتقاط التبعيات في خط معالجة الميزات. تستكشف الورقة فائدتها في هذا السياق غير التسلسلي.

تتضمن الهيكلية الأساسية طبقة تضمين لكل سمة فئوية، حيث يتم دمج مخرجاتها (مثل الدمج أو التجميع) وإدخالها في طبقات الشبكة العصبية اللاحقة للتنبؤ النهائي بالطلب.

3.3 دوال الخسارة

اختيار الهدف الصحيح أمر بالغ الأهمية للتأثير التجاري. يجرب المؤلفون ما هو أبعد من متوسط الخطأ التربيعي (MSE) القياسي. فهم يأخذون في الاعتبار دوال الخسارة غير المتماثلة التي تعاقب على زيادة المخزون (التنبؤ بأعلى من اللازم) ونقص المخزون (التنبؤ بأقل من اللازم) بشكل مختلف، مما ينسق هدف تحسين النموذج مع هيكل التكلفة الفعلي لإدارة مخزون التجزئة. يمكن أن يكون الشكل المبسط كما يلي:

$L(y, \hat{y}) = \begin{cases} c_{over} \cdot (\hat{y} - y) & \text{if } \hat{y} > y \\ c_{under} \cdot (y - \hat{y}) & \text{if } \hat{y} \leq y \end{cases}$

حيث $c_{over}$ و $c_{under}$ هما التكلفتان المقابلتان للإفراط في التنبؤ والتنبؤ بأقل من اللازم.

4. النتائج التجريبية والتحليل

تُظهر الورقة البحثية أداءً قويًا للنماذج المقترحة القائمة على السمات. من المحتمل أن تشمل النتائج الرئيسية (المستنتجة من الملخص):

  • التفوق على النماذج الأساسية: تتفوق النماذج العصبية مع تضمينات السمات بشكل كبير على نماذج الاستقراء التاريخي البسيطة وربما على نماذج التعلم الآلي التقليدية في مهمة التنبؤ بالمنتجات الجديدة.
  • قوة التعميم: تُظهر النماذج قدرة على التعميم على مجموعات غير مرئية من السمات، مما يؤكد الفرضية الأساسية بأن الطلب يُدفع بواسطة سمات قابلة للتحليل.
  • مقارنة الهيكليات: تقدم النتائج تحليلاً مقارنًا للشبكات العصبية ذات التغذية الأمامية مقابل شبكات الذاكرة قصيرة وطويلة المدى في هذا الإعداد، وربما تخلص إلى أنه بينما تكون شبكات الذاكرة قصيرة وطويلة المدى قوية، فقد تكون الشبكات العصبية ذات التغذية الأمامية الأبسط كافية وأكثر كفاءة لمشكلة ربط السمات بالطلب المحددة هذه.
  • تأثير دالة الخسارة: تؤدي النماذج المدربة بدوال الخسارة غير المتماثلة الواعية بالأعمال التجارية إلى تنبؤات تقلل من تكاليف المخزون الفعلية، وليس فقط خطأ التنبؤ.

وصف الرسم البياني (المستنتج): من المحتمل أن يُظهر مخطط الأعمدة مقاييس المقارنة (مثل متوسط النسبة المئوية للخطأ المطلق - MAPE، أو مقياس مخصص قائم على التكلفة) لنماذج مختلفة: نموذج أساسي بسيط (مثل متوسط الطلب لفئات مماثلة)، ونماذج قائمة على الأشجار (XGBoost)، والشبكات العصبية ذات التغذية الأمامية، وشبكات الذاكرة قصيرة وطويلة المدى. ستظهر النماذج العصبية مع التضمينات أقل خطأ. قد يوضح مخطط ثاني كيف يتغير خطأ التنبؤ مع معلمة عدم التماثل في دالة الخسارة المخصصة، مما يُظهر حدًا أدنى واضحًا عند إعداد تجاري أمثل.

5. دراسة حالة: تطبيق الإطار

السيناريو: يحتاج بائع تجزئة للأزياء السريعة إلى التنبؤ بالطلب على فستان صيفي جديد للنساء مخطط للموسم القادم.

الخطوة 1 - تعريف السمات: يحدد فريق المنتج سماته: {الفئة: فستان، الفئة الفرعية: ميدي، خط العنق: على شكل V، الكم: قصير، النقش: زهري، اللون: أزرق فاتح، المادة: قطن، فئة السعر: متوسطة، العلامة التجارية: علامة داخلية}.

الخطوة 2 - تحويل الميزات إلى متجهات: يتم تمرير كل سمة فئوية (خط العنق، النقش، إلخ) عبر طبقة التضمين المدربة مسبقًا، مما يحول "على شكل V" و"زهري" إلى متجهات كثيفة (مثل [0.2, -0.5, 0.8...]). يتم تسوية الميزات الرقمية مثل السعر.

الخطوة 3 - استدلال النموذج: يتم دمج جميع متجهات السمات والميزات الرقمية في متجه إدخال واحد. يتم إدخال هذا المتجه في نموذج الشبكة العصبية ذات التغذية الأمامية المدرب.

الخطوة 4 - التنبؤ بالطلب: يخرج النموذج قيمة مستمرة تمثل إجمالي الوحدات المتوقعة مبيعها في الموسم الأول. يُستخدم هذا التنبؤ لتخطيط الإنتاج وتخصيص المخزون.

الرؤية: قد يتعرف النموذج داخليًا على أن مزيج "الزهري"، "الأزرق الفاتح"، وطول "الميدي" كان ناجحًا للغاية في فئة السعر "المتوسطة" خلال الصيف، مما يؤدي إلى تنبؤ عالي الثقة وحجم مبيعات كبير.

6. التطبيقات المستقبلية والاتجاهات

يفتح النهج الموضح عدة مسارات واعدة:

  • حلقة التصميم التوليدي والتنبؤ: يمكن أن يؤدي دمج هذا النموذج التنبؤي مع الذكاء الاصطناعي التوليدي (مثل شبكات الخصومة التوليدية أو نماذج الانتشار، المشابهة لتلك المستخدمة في توليف الصور من النص) إلى إنشاء نظام حلقة مغلقة. يمكن للمصممين إدخال لوحات اتجاهات الموضة، ويقوم مُولد (مستوحى من نماذج مثل CycleGAN لنقل الأنماط) بإنتاج مجموعات سمات جديدة، ويقيم المُتنبئ إمكاناتها التجارية، مما يتيح التصميم بمساعدة الذكاء الاصطناعي للمنتجات عالية الطلب.
  • دمج التسعير الديناميكي: يمكن توسيع النموذج ليكون دالة طلب $D(attributes, price)$، مما يسمح باستراتيجيات التسعير الأولي الأمثل وتخفيض الأسعار للمنتجات الجديدة.
  • التكيف عبر المجالات: المنهجية الأساسية لتضمين السمات للتنبؤ بالبداية الباردة قابلة للنقل إلى قطاعات تجزئة أخرى ذات سمات منتج غنية، مثل الإلكترونيات، والأثاث، أو مستحضرات التجميل.
  • الذكاء الاصطناعي القابل للتفسير (XAI): يمكن أن يركز العمل المستقبلي على تفسير فضاءات التضمين وقرارات النموذج، والإجابة على لماذا من المتوقع أن تكون مجموعة سمات معينة ناجحة، مما يوفر ملاحظات قيمة للمسوقين.
  • دمج الاتجاهات في الوقت الفعلي: يمكن أن يجعل تعزيز السمات الثابتة بإشارات في الوقت الفعلي من وسائل التواصل الاجتماعي (مثل إنستغرام، بينتيريست) أو اتجاهات البحث التنبؤات أكثر استجابة للموضات الناشئة.

7. المراجع

  1. Singh, P. K., Gupta, Y., Jha, N., & Rajan, A. (2019). Fashion Retail: Forecasting Demand for New Items. In Proceedings of the KDD 2019 Workshop on AI for Fashion.
  2. Ferreira, K. J., Lee, B. H. A., & Simchi-Levi, D. (2015). Analytics for an Online Retailer: Demand Forecasting and Price Optimization. Manufacturing & Service Operations Management, 18(1), 69–88.
  3. Mikolov, T., Chen, K., Corrado, G., & Dean, J. (2013). Efficient Estimation of Word Representations in Vector Space. arXiv preprint arXiv:1301.3781.
  4. Zhu, J.-Y., Park, T., Isola, P., & Efros, A. A. (2017). Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks. In Proceedings of the IEEE International Conference on Computer Vision (ICCV). (تمت الإشارة إلى ورقة CycleGAN لمفهوم التصميم التوليدي).
  5. Academictorrents.com & arXiv.org - كقواعد بيانات أكاديمية مفتوحة الوصول ممثلة للعمل ذي الصلة في التعلم الآلي والتنبؤ.

8. منظور المحلل

الرؤية الأساسية: عمل فريق Myntra هو تطور عملي وضروري يتجاوز عبادة السلاسل الزمنية في ذكاء التجزئة الاصطناعي. رؤيتهم الأساسية - أن طلب الأزياء المستقبلي ليس دالة على منحنيات المبيعات السابقة ولكن على سمات جمالية وتجارية قابلة للتحليل والتعلم - تصيب الهدف. إنهم يبنون بشكل أساسي "محركًا للذوق"، يترجم اللغة النوعية للتصميم إلى اللغة الكمية للحجم المتوقع. وهذا ينقل الصناعة من التحليلات التفاعلية إلى التنبؤ الاستباقي القائم على نية التصميم.

التدفق المنطقي والقيمة التقنية: المنهجية سليمة، حيث تستعير بحكمة من نجاح تضمينات الكلمات في معالجة اللغات الطبيعية. معاملة "الياقة المربعة" أو "الطباعة الحيوانية" كرموز في "مفردات الموضة" وتعلم علاقاتها الدلالية هو أنيق. التجربة مع هياكل عصبية مختلفة، والأهم من ذلك، دوال الخسارة الواعية بتكلفة الأعمال، تُظهر نضجًا غالبًا ما يكون مفقودًا في أبحاث التعلم الآلي البحتة. الأمر لا يتعلق فقط بتقليل الخطأ، بل بتقليل الخسارة المالية. ومع ذلك، ستستفيد الورقة من الغوص بشكل أعمق في فضاءات التضمين المتعلمة - ماذا يتعلم النموذج عن "التشابه" بين الألوان أو النقوش؟ يمكن أن يوفر تصور هذه، كما هو الحال في معالجة اللغات الطبيعية، رؤى مذهلة في اتجاهات الموضة الكامنة.

نقاط القوة والعيوب: نقطة القوة الرئيسية هي قابليتها للتطبيق المباشر على مشكلة البداية الباردة بمليارات الدولارات. إنها مخطط جاهز للإنتاج. عيب كبير، تم الاعتراف به ولكن لم يتم حله بالكامل، هو الطبيعة الثابتة للنموذج. الموضة ليست مجرد سمات في فراغ؛ إنها تتعلق بجدتها ودورة حياتها داخل اتجاه. قد يكون لسمة "الببلوم" وزن إيجابي في عام 2014، ومحايد في عام 2018، وسلبي اليوم. يحتاج النموذج إلى بُعد زمني لـ زخم السمة أو التعب منها، ربما عن طريق جعل التضمينات تعتمد على الوقت أو دمج إشارات سرعة الاتجاه من البيانات الخارجية، وهي تقنية يتم استكشافها في معامل البحث التقني الرائدة.

رؤى قابلة للتنفيذ: بالنسبة لتجار التجزئة، الإجراء الفوري هو الاستثمار في تصنيفات سمات المنتج الغنية والمتسقة والتفصيلية. أصبحت بنيتك التحتية للبيانات الآن أصل تصميم أساسي. بالنسبة للفرق التقنية، رتب أولويات دوال الخسارة غير المتماثلة والمحددة تجاريًا فوق مقاييس الدقة العادية. أخيرًا، انظر إلى هذا ليس كأداة تنبؤية وحدها، ولكن كأول مكون لنظام تصميم توليدي. الخطوة المنطقية التالية هي عكس النموذج: استخدم المُتنبئ كناقد لتوجيه ذكاء اصطناعي توليدي (مثل نوع موضة محدد من نموذج الانتشار) لإنشاء مجموعات سمات جديدة عالية الدرجة، مما يؤدي فعليًا إلى أتمتة عملية العصف الذهني التصميمي الأولية. هذا هو مكان الاضطراب الحقيقي.