1. 서론
패션 리테일에서 수요 예측은 업계에서 가장 복잡한 도전 과제 중 하나입니다. 색상, 프린트, 커트, 패턴, 소재에 대한 트렌드의 일시적인 특성과 긴 디자인 주기, 대량 생산 요구 사항, 그리고 소비의 지역적 차이가 결합되어 리테일러에게는 고위험 환경을 조성합니다. 기존의 전통적인 예측 방법은 주로 기존 상품의 과거 판매 데이터에 크게 의존하므로, 완전히 새로운 디자인이나 스타일에 대한 수요를 예측하는 데는 적합하지 않습니다. 이 연구의 주요 초점은 바로 이 부분입니다.
KDD 2019 패션 AI 워크숍에서 발표된 본 논문은 이 중요한 격차를 해소합니다. Myntra Designs의 저자들은 과거 판매의 시계열 분석을 넘어서는 새로운 접근법을 제안합니다. 대신, 그들은 대규모 패션 판매 데이터를 분석하여 어떤 특정 제품 속성(예: 네크라인, 소매 유형, 원단)과 머천다이징 요소(예: 가격대, 브랜드)가 소비자 수요를 주도하는지 추론합니다. 그런 다음, 판매 이력이 전혀 존재하지 않는 상태에서도 이러한 속성만을 기반으로 신상품의 수요를 예측할 수 있는 일반화된 머신러닝 모델을 구축합니다.
2. 문제 정의 및 도전 과제
핵심 문제는 패션 예측에서의 "콜드 스타트" 시나리오, 즉 과거 판매 데이터가 전혀 없는 신상품의 수요를 예측하는 것입니다. 기존 기술은 다음과 같은 이유로 실패합니다:
- 비선형 상호작용: 여러 디자인 매개변수(색상, 패턴, 커트)가 복잡한 비선형 방식으로 상호작용하여 제품의 매력을 정의하므로, 단순한 외삽법은 불가능합니다.
- 직관에 대한 의존: 현재 업계 관행은 종종 머천다이저의 주관적 직관에 의존하여 높은 변동성, 제품 간 효과(대체 효과, 자사 제품 간 경쟁)를 고려하지 못함, 그리고 상당한 예측 오차를 초래합니다.
- 비즈니스 및 환경 비용: 부정확한 예측은 판매 기회 손실, 막대한 미판매 재고(운전 자본 손실), 그리고 과잉 생산 및 폐기로 인한 환경 피해를 초래합니다.
필요한 것은 제품 속성을 6-8개월 계획 기간에 대한 신뢰할 수 있는 수요 예측으로 변환하는 데이터 기반의 일반화 가능한 모델입니다.
3. 방법론 및 기술적 접근
저자들의 방법론은 시계열 모델링에서 패션 속성의 의미론적 공간 모델링으로 전환합니다.
3.1 데이터 및 속성 표현
이 모델은 풍부한 범주형 및 수치형 속성 집합으로 설명되는 대규모 역사적 패션 상품 데이터셋을 기반으로 구축됩니다. 그들의 접근법의 핵심은 속성 임베딩의 생성입니다. NLP의 단어 임베딩(Word2Vec 등)과 유사하게, 범주형 속성(예: "크루 넥", "플로럴 프린트")은 조밀하고 연속적인 벡터 표현으로 변환됩니다. 이를 통해 모델은 속성 간의 미묘한 관계와 유사성(예: "브이넥"과 "스쿱넥"이 "터틀넥"보다 서로 더 유사함)을 학습할 수 있습니다.
3.2 모델 아키텍처
본 논문은 여러 신경망 아키텍처와 전통적인 ML 방법을 실험합니다:
- 트리 기반 모델 (XGBoost, Random Forest): 혼합된 특성 유형의 테이블 데이터를 처리할 수 있는 강력한 기준선으로 사용됩니다.
- 순방향 신경망 (FFNN): 연결된 속성 임베딩과 수치형 특성을 입력으로 받는 표준 다층 퍼셉트론입니다.
- 장단기 메모리 네트워크 (LSTM): 시간적 판매 시퀀스를 위해 사용되는 것이 아니라, 속성 시퀀스를 모델링하거나 특성 처리 파이프라인의 종속성을 포착하기 위해 잠재적으로 사용됩니다. 논문은 이 비순차적 맥락에서의 유용성을 탐구합니다.
핵심 아키텍처는 각 범주형 속성에 대한 임베딩 레이어를 포함하며, 그 출력은 결합(예: 연결 또는 풀링)되어 최종 수요 예측을 위한 후속 신경망 레이어로 입력됩니다.
3.3 손실 함수
비즈니스 영향에 적합한 목표 함수를 선택하는 것이 중요합니다. 저자들은 표준 평균 제곱 오차(MSE)를 넘어서는 실험을 합니다. 그들은 과잉 재고(너무 높게 예측)와 재고 부족(너무 낮게 예측)을 다르게 패널티를 주는 비대칭 손실 함수를 고려하여, 모델의 최적화 목표를 리테일 재고 관리의 실제 비용 구조와 일치시킵니다. 단순화된 형태는 다음과 같을 수 있습니다:
$L(y, \hat{y}) = \begin{cases} c_{over} \cdot (\hat{y} - y) & \text{if } \hat{y} > y \\ c_{under} \cdot (y - \hat{y}) & \text{if } \hat{y} \leq y \end{cases}$
여기서 $c_{over}$와 $c_{under}$는 각각 과잉 예측과 과소 예측의 비용입니다.
4. 실험 결과 및 분석
본 논문은 제안된 속성 기반 모델의 강력한 성능을 입증합니다. 주요 결과는 (초록에서 추론한 바) 다음과 같을 것입니다:
- 기준선 대비 우월성: 속성 임베딩을 사용한 신경망 모델은 신상품 예측 작업에서 단순한 역사적 외삽 모델과 잠재적으로 전통적인 ML 모델을 크게 능가합니다.
- 일반화 능력: 모델은 보지 못한 속성 조합에 대한 일반화 능력을 보여주며, 수요가 분해 가능한 속성에 의해 주도된다는 핵심 가설을 검증합니다.
- 아키텍처 비교: 결과는 이 설정에서 FFNN 대 LSTM의 비교 분석을 제공하며, LSTM이 강력하지만 이 특정 속성-수요 매핑 문제에는 더 간단한 FFNN이 충분하고 효율적일 수 있다는 결론을 내릴 가능성이 높습니다.
- 손실 함수의 영향: 비즈니스 인식 비대칭 손실 함수로 훈련된 모델은 단순히 예측 오차뿐만 아니라 실제 재고 비용을 최소화하는 예측을 이끌어냅니다.
차트 설명 (추론): 막대 차트는 다양한 모델(순진한 기준선(예: 유사 카테고리의 평균 수요), 트리 기반 모델(XGBoost), FFNN, LSTM)에 대한 비교 지표(예: 평균 절대 백분율 오차 - MAPE, 또는 맞춤형 비용 기반 지표)를 보여줄 것입니다. 임베딩을 사용한 신경망 모델이 가장 낮은 오차를 보일 것입니다. 두 번째 차트는 맞춤형 손실 함수의 비대칭 매개변수에 따라 예측 오차가 어떻게 변하는지 보여주며, 비즈니스 최적 설정에서 명확한 최소값을 보일 것입니다.
5. 사례 연구: 프레임워크 적용
시나리오: 패스트 패션 리테일러가 다음 시즌을 위해 계획된 새로운 여성용 여름 드레스의 수요를 예측해야 합니다.
1단계 - 속성 정의: 제품 팀은 속성을 정의합니다: {카테고리: 드레스, 서브 카테고리: 미디, 네크라인: 브이넥, 소매: 숏, 패턴: 플로럴, 색상: 파스텔 블루, 소재: 코튼, 가격대: 중간, 브랜드: 인하우스 라벨}.
2단계 - 특성 벡터화: 각 범주형 속성(네크라인, 패턴 등)은 사전 훈련된 임베딩 레이어를 통과하여 "브이넥"과 "플로럴"을 조밀한 벡터(예: [0.2, -0.5, 0.8...])로 변환합니다. 가격과 같은 수치형 특성은 정규화됩니다.
3단계 - 모델 추론: 모든 속성 벡터와 수치형 특성이 단일 입력 벡터로 연결됩니다. 이 벡터는 훈련된 FFNN 모델에 입력됩니다.
4단계 - 수요 예측: 모델은 첫 시즌에 예측된 총 판매 수량을 나타내는 연속 값을 출력합니다. 이 예측은 생산 계획 및 재고 할당에 사용됩니다.
통찰: 모델은 내부적으로 "플로럴", "파스텔 블루", "미디" 길이의 조합이 여름 동안 "중간" 가격대에서 매우 성공적이었다는 것을 인식하여, 높은 신뢰도와 대량 예측을 이끌어낼 수 있습니다.
6. 향후 응용 및 발전 방향
개요된 접근법은 몇 가지 유망한 방향을 열어줍니다:
- 생성적 디자인 및 예측 루프: 이 예측 모델을 생성적 AI(텍스트에서 이미지 합성에 사용되는 GAN이나 Diffusion 모델과 유사)와 통합하면 폐쇄형 시스템을 만들 수 있습니다. 디자이너는 트렌드 무드 보드를 입력하고, 생성기(스타일 전환을 위한 CycleGAN과 같은 모델에서 영감을 받음)가 새로운 속성 조합을 생성하며, 예측기는 그들의 상업적 잠재력을 평가하여, 고수요 상품의 AI 지원 디자인을 가능하게 합니다.
- 동적 가격 책정 통합: 모델은 수요 함수 $D(속성, 가격)$로 확장되어 신상품에 대한 최적의 초기 가격 책정 및 할인 전략을 허용할 수 있습니다.
- 크로스 도메인 적용: 콜드 스타트 예측을 위한 속성 임베딩의 핵심 방법론은 전자제품, 가구, 화장품과 같이 풍부한 제품 속성을 가진 다른 리테일 부문으로 전이 가능합니다.
- 설명 가능한 AI (XAI): 향후 작업은 임베딩 공간과 모델 결정을 해석하는 데 초점을 맞추어, 왜 특정 속성 조합이 성공할 것으로 예측되는지 설명하고, 머천다이저에게 가치 있는 피드백을 제공할 수 있습니다.
- 실시간 트렌드 통합: 정적 속성에 소셜 미디어(예: 인스타그램, 핀터레스트) 또는 검색 트렌드의 실시간 신호를 추가하면 예측이 떠오르는 유행에 더 반응적으로 만들 수 있습니다.
7. 참고문헌
- Singh, P. K., Gupta, Y., Jha, N., & Rajan, A. (2019). Fashion Retail: Forecasting Demand for New Items. In Proceedings of the KDD 2019 Workshop on AI for Fashion.
- Ferreira, K. J., Lee, B. H. A., & Simchi-Levi, D. (2015). Analytics for an Online Retailer: Demand Forecasting and Price Optimization. Manufacturing & Service Operations Management, 18(1), 69–88.
- Mikolov, T., Chen, K., Corrado, G., & Dean, J. (2013). Efficient Estimation of Word Representations in Vector Space. arXiv preprint arXiv:1301.3781.
- Zhu, J.-Y., Park, T., Isola, P., & Efros, A. A. (2017). Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks. In Proceedings of the IEEE International Conference on Computer Vision (ICCV). (생성적 디자인 개념 참조를 위한 CycleGAN 논문).
- Academictorrents.com & arXiv.org - ML 및 예측 분야 관련 연구를 위한 대표적인 오픈 액세스 학술 데이터베이스.
8. 분석가 관점
핵심 통찰: Myntra 팀의 작업은 리테일 AI에서 시계열 숭배를 넘어선 실용적이고 필수적인 진화입니다. 그들의 근본적인 통찰—미래 패션 수요는 과거 판매 곡선의 함수가 아니라 분해 가능하고 학습 가능한 미적 및 상업적 속성의 함수라는 점—은 정확히 맞습니다. 그들은 본질적으로 "취향 엔진"을 구축하여, 디자인의 질적 언어를 예측된 수량의 양적 언어로 변환하고 있습니다. 이는 업계를 반응적 분석에서 선제적이고 디자인 의도를 반영한 예측으로 이동시킵니다.
논리적 흐름 및 기술적 가치: 방법론은 건전하며, NLP의 임베딩 성공 사례를 현명하게 차용합니다. "보트넥"이나 "애니멀 프린트"를 "패션 어휘"의 토큰으로 취급하고 그들의 의미론적 관계를 학습하는 것은 우아합니다. 다양한 신경망 아키텍처와, 결정적으로 비즈니스 비용 인식 손실 함수에 대한 실험은 순수 ML 연구에서 종종 빠지는 성숙도를 보여줍니다. 단순히 낮은 오차가 아니라 낮은 재정적 손실에 관한 것입니다. 그러나 논문은 학습된 임베딩 공간에 대한 더 깊은 탐구—모델이 색상이나 패턴 간의 "유사성"에 대해 무엇을 배우는가?—로부터 이익을 얻을 수 있을 것입니다. NLP에서와 같이 이를 시각화하면 잠재적 패션 트렌드에 대한 놀라운 통찰을 제공할 수 있습니다.
강점과 결점: 주요 강점은 수십억 달러 규모의 콜드 스타트 문제에 직접 적용 가능하다는 점입니다. 이는 프로덕션 준비가 된 청사진입니다. 인정되었지만 완전히 해결되지 않은 중요한 결점은 모델의 정적 특성입니다. 패션은 진공 상태의 속성에 관한 것만이 아닙니다. 그것은 트렌드 내에서의 새로움과 라이프사이클에 관한 것입니다. "펩플럼" 속성은 2014년에는 긍정적 가중치를, 2018년에는 중립적, 오늘날에는 부정적 가중치를 가질 수 있습니다. 모델은 속성의 모멘텀이나 피로도를 위한 시간적 차원이 필요하며, 아마도 임베딩을 시간 의존적으로 만들거나 외부 데이터의 트렌드 속도 신호를 통합함으로써 가능할 것입니다. 이는 선도적인 기술 연구실에서 탐구되는 기법입니다.
실행 가능한 통찰: 리테일러에게 즉각적인 조치는 풍부하고 일관적이며 세분화된 제품 속성 분류 체계에 투자하는 것입니다. 이제 데이터 인프라는 핵심 디자인 자산입니다. 기술 팀에게는 일반적인 정확도 지표보다 비대칭적이고 비즈니스 정의 손실 함수를 우선시하십시오. 마지막으로, 이것을 단독 예측 도구가 아닌 생성적 디자인 시스템의 첫 번째 구성 요소로 보십시오. 논리적 다음 단계는 모델을 반전시키는 것입니다: 예측기를 비평가로 사용하여 생성적 AI(패션 특화 Diffusion 모델 변형과 같은)를 안내하여 높은 점수를 받는 새로운 속성 조합을 생성하도록 하여, 초기 디자인 브레인스토밍 프로세스를 효과적으로 자동화하는 것입니다. 진정한 파괴는 바로 여기에 있습니다.