時尚零售：新品需求預測——一種機器學習方法

1. 緒論

時尚零售業的需求預測，是該產業最複雜的挑戰之一。色彩、印花、剪裁、圖案與材質的流行趨勢轉瞬即逝，加上冗長的設計週期、大量生產需求，以及消費習慣的地域差異，為零售商創造了一個高風險的環境。傳統的預測方法高度依賴既有商品的歷史銷售數據，使其難以預測全新設計或款式的需求，而這正是本研究的核心焦點。

這篇發表於KDD 2019「時尚人工智慧」研討會的論文，旨在解決此一關鍵缺口。來自Myntra Designs的作者們提出了一種超越過去銷售時間序列分析的新穎方法。他們轉而分析大規模的時尚銷售數據，以推斷哪些特定的產品屬性（例如：領口、袖型、布料）與行銷因素（例如：價格點、品牌）驅動了消費者需求。接著，他們建立了通用的機器學習模型，能夠僅基於這些屬性，在沒有任何銷售歷史之前，預測新商品的需求。

2. 問題陳述與挑戰

核心問題在於時尚預測中的「冷啟動」情境：預測一個歷史銷售數據為零的新商品之需求。傳統技術之所以失敗，原因如下：

非線性交互作用：多個設計參數（顏色、圖案、剪裁）以複雜的非線性方式交互作用，定義了商品的吸引力，使得簡單的外推法無法適用。
依賴直覺：當前的產業實務常依賴採購人員的主觀直覺，導致預測結果變異性高、無法考量跨產品效應（替代效應、自相殘殺效應），並產生顯著的預測誤差。
商業與環境成本：不準確的預測會導致銷售機會流失、大量未售出庫存（營運資金損失），以及因過度生產和浪費造成的環境破壞。

業界需要的是一個以數據驅動、可泛化的模型，能將商品屬性轉化為未來6至8個月規劃期內的可靠需求預測。

3. 方法論與技術途徑

作者們的方法論從建模時間序列，轉向建模時尚屬性的語意空間。

3.1 資料與屬性表示法

模型建立於一個大型的歷史時尚商品資料集之上，每個商品都由一組豐富的類別與數值屬性所描述。其方法的關鍵在於建立屬性嵌入。類似於自然語言處理中的詞嵌入（如Word2Vec），類別屬性（例如：「圓領」、「花卉印花」）被轉換為稠密、連續的向量表示。這使得模型能夠學習屬性之間細微的關係與相似性（例如，「V領」和「湯匙領」彼此之間的相似度高於與「高領」的相似度）。

3.2 模型架構

本文實驗了多種神經網路架構與傳統機器學習方法：

樹狀基礎模型（XGBoost、隨機森林）：作為穩健的基準模型，能夠處理混合特徵類型的表格資料。
前饋神經網路（FFNN）：標準的多層感知器，以串聯的屬性嵌入向量與數值特徵作為輸入。
長短期記憶網路（LSTM）：並非用於時間銷售序列，而是可能用於建模屬性序列，或捕捉特徵處理流程中的依賴關係。本文探討了LSTM在此非序列情境下的效用。

核心架構包含每個類別屬性對應的嵌入層，其輸出被組合（例如：串聯或池化）後，輸入到後續的神經網路層，以進行最終的需求預測。

3.3 損失函數

選擇正確的目標函數對於商業影響至關重要。作者們的實驗超越了標準的均方誤差（MSE）。他們考慮了非對稱損失函數，對庫存過多（預測過高）和庫存不足（預測過低）給予不同的懲罰，使模型的優化目標與零售庫存管理的實際成本結構保持一致。一個簡化的形式可以是：

$L(y, \hat{y}) = \begin{cases} c_{over} \cdot (\hat{y} - y) & \text{if } \hat{y} > y \\ c_{under} \cdot (y - \hat{y}) & \text{if } \hat{y} \leq y \end{cases}$

其中 $c_{over}$ 和 $c_{under}$ 分別是預測過高和預測過低的成本。

4. 實驗結果與分析

本文展示了所提出的基於屬性模型的穩健效能。主要發現可能包括（根據摘要推斷）：

優於基準模型：帶有屬性嵌入的神經網路模型，在新品預測任務上，顯著優於簡單的歷史外推模型，並可能優於傳統的機器學習模型。
泛化能力：模型展現出對未見過的屬性組合進行泛化的能力，驗證了需求是由可分解屬性驅動的核心假設。
架構比較：結果提供了在此情境下FFNN與LSTM的比較分析，可能得出結論：雖然LSTM功能強大，但對於這個特定的「屬性到需求」映射問題，較簡單的FFNN可能已足夠且更有效率。
損失函數的影響：使用具備商業意識的非對稱損失函數訓練的模型，所產生的預測能最小化實際庫存成本，而不僅僅是預測誤差。

圖表描述（推斷）：長條圖可能會顯示不同模型的比較指標（例如：平均絕對百分比誤差 - MAPE，或自訂的基於成本的指標）：一個簡單的基準模型（例如：類似品類的平均需求）、樹狀基礎模型（XGBoost）、FFNN和LSTM。帶有嵌入的神經網路模型將顯示最低的誤差。第二張圖表可能說明預測誤差如何隨著自訂損失函數中的非對稱參數變化，並在商業最優設定處顯示出明確的最小值。

5. 個案研究：框架應用

情境：一家快時尚零售商需要預測下一季計畫推出的一款新女裝夏季洋裝的需求。

步驟 1 - 屬性定義：產品團隊定義其屬性：{類別：洋裝，子類別：中長裙，領口：V領，袖長：短袖，圖案：花卉，顏色：淡藍色，材質：棉，價格區間：中價位，品牌：自有品牌}。

步驟 2 - 特徵向量化：每個類別屬性（領口、圖案等）通過其預先訓練好的嵌入層，將「V領」和「花卉」轉換為稠密向量（例如：[0.2, -0.5, 0.8...]）。價格等數值特徵則進行標準化。

步驟 3 - 模型推論：所有屬性向量與數值特徵被串聯成單一輸入向量。此向量被輸入到訓練好的FFNN模型中。

步驟 4 - 需求預測：模型輸出一個連續值，代表預測在第一季的總銷售量。此預測用於生產規劃與庫存分配。

洞察：模型可能在內部識別出「花卉」、「淡藍色」與「中長裙」長度的組合，在夏季的「中價位」區間一直非常成功，從而產生一個高信心、高銷量的預測。

6. 未來應用與方向

概述的方法開啟了數個前景看好的途徑：

生成式設計與預測迴圈：將此預測模型與生成式人工智慧（如GAN或擴散模型，類似於從文字生成圖像的技術）整合，可創造一個閉環系統。設計師可以輸入趨勢情緒板，生成器（靈感來自用於風格轉換的CycleGAN等模型）產生新的屬性組合，而預測器則評估其商業潛力，從而實現AI輔助設計高需求商品。
動態定價整合：模型可以擴展為一個需求函數 $D(屬性, 價格)$，從而為新商品制定最佳初始定價與降價策略。
跨領域適應：用於冷啟動預測的屬性嵌入核心方法論，可轉移到其他具有豐富產品屬性的零售垂直領域，例如電子產品、家具或化妝品。
可解釋人工智慧（XAI）：未來的工作可專注於解釋嵌入空間與模型決策，回答為何某個屬性組合被預測為成功，為採購人員提供有價值的回饋。
即時趨勢整合：以來自社交媒體（例如：Instagram、Pinterest）或搜尋趨勢的即時訊號來增強靜態屬性，可以使預測更能回應新興的流行風潮。

7. 參考文獻

Singh, P. K., Gupta, Y., Jha, N., & Rajan, A. (2019). Fashion Retail: Forecasting Demand for New Items. In Proceedings of the KDD 2019 Workshop on AI for Fashion.
Ferreira, K. J., Lee, B. H. A., & Simchi-Levi, D. (2015). Analytics for an Online Retailer: Demand Forecasting and Price Optimization. Manufacturing & Service Operations Management, 18(1), 69–88.
Mikolov, T., Chen, K., Corrado, G., & Dean, J. (2013). Efficient Estimation of Word Representations in Vector Space. arXiv preprint arXiv:1301.3781.
Zhu, J.-Y., Park, T., Isola, P., & Efros, A. A. (2017). Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks. In Proceedings of the IEEE International Conference on Computer Vision (ICCV). （為生成式設計概念而引用的CycleGAN論文）。
Academictorrents.com & arXiv.org - 作為機器學習與預測相關研究的代表性開放取用學術資料庫。

8. 分析師觀點

核心洞察：Myntra團隊的工作，是零售人工智慧領域超越時間序列崇拜的一次務實且必要的演進。他們的基本洞察——未來的時尚需求並非過去銷售曲線的函數，而是可分解、可學習的美學與商業屬性的函數——切中要害。他們本質上是在建立一個「品味引擎」，將設計的定性語言轉譯為預測銷量的定量語言。這將產業從反應式分析推向主動式、基於設計意圖的預測。

邏輯流程與技術價值：方法論是穩健的，明智地借鑒了自然語言處理在嵌入技術上的成功。將「船型領」或「動物紋印花」視為「時尚詞彙」中的詞元，並學習它們的語意關係，這種做法非常優雅。對不同神經網路架構的實驗，以及關鍵的具備商業成本意識的損失函數，展現了純機器學習研究常缺乏的成熟度。這不僅僅是關於降低誤差，更是關於降低財務損失。然而，本文若能更深入探討學習到的嵌入空間——模型學到了關於顏色或圖案之間的哪些「相似性」？若能像自然語言處理那樣將這些視覺化，可能會對潛在的時尚趨勢提供驚人的洞察。

優勢與缺陷：關鍵優勢在於其對價值數十億美元的冷啟動問題具有直接適用性。這是一個可供生產部署的藍圖。一個顯著的缺陷（雖被承認但未完全解決）是模型的靜態性質。時尚不僅僅是真空中的屬性；它關乎屬性在趨勢中的新穎性與生命週期。「荷葉邊」屬性在2014年可能具有正向權重，在2018年為中性，而在今天則為負向。模型需要一個時間維度來處理屬性的動量或疲勞度，或許可以透過使嵌入具有時間依賴性，或整合來自外部資料的趨勢速度訊號來實現，這是一流科技研究實驗室正在探索的技術。

可行動的洞察：對零售商而言，立即的行動是投資於豐富、一致且細緻的產品屬性分類體系。你的資料基礎設施現在是一項核心的設計資產。對技術團隊而言，應優先考慮非對稱、由商業定義的損失函數，而非單純的準確度指標。最後，不要僅將其視為一個預測工具，而應視為生成式設計系統的第一個組件。邏輯上的下一步是反轉模型：使用預測器作為評論家，來引導一個生成式人工智慧（例如時尚專用的擴散模型變體）創造高評分、新穎的屬性組合，從而有效地自動化初始設計腦力激盪過程。真正的顛覆性創新就在於此。