1. Utangulizi
Karatasi hii inashughulikia tatizo la vitendo katika upendekezo wa mitindo: "kipengele gani tunapaswa kuchagua ili kilingane na vipengee vilivyopewa vya mitindo na kuunda mavazi yanayolingana?" Changamoto kuu ni kukadiria kwa usahihi ustahiki wa mavazi. Mbinu za awali, zilizolenga ustahiki wa jozi ya vipengee au kuwakilisha mavazi kama mlolongo (mfano, kwa kutumia RNNs), hazikuweza kukamata uhusiano tata, usiofuata mlolongo kati ya vipengee vyote katika mavazi. Ili kushinda kikomo hiki, waandishi wanapendekeza uwakilishi mpya unaotegemea grafu na muundo unaolingana wa Mtandao wa Neural wa Grafu ya Kipekee kwa Nodi (NGNN).
2. Mbinu
Mfumo uliopendekezwa hubadilisha tatizo la ustahiki wa mavazi kuwa kazi ya kujifunza grafu.
2.1. Uundaji wa Grafu ya Mitindo
Mavazi yanawakilishwa kama Grafu ya Mitindo $G = (V, E)$.
- Nodi ($V$): Zinawakilisha aina za vipengee (mfano, Shati, Jeansi, Viatu).
- Kingo ($E$): Zinawakilisha uhusiano wa ustahiki au mwingiliano kati ya aina.
2.2. Mitandao ya Neural ya Grafu ya Kipekee kwa Nodi (NGNN)
Ubunifu mkuu ni safu ya NGNN kwa ajili ya kujifunza uwakilishi wa nodi (aina). Tofauti na GNN za kawaida ambazo zinaweza kutumia vigezo vilivyoshirikiwa kwenye kingo, NGNN inatumia vigezo vya kipekee kwa nodi ili kuiga mwingiliano tofauti. Ujumbe unaopitishwa kwa nodi $i$ kutoka kwa jirani $j$ unaweza kutengenezwa kama ifuatavyo: $$\mathbf{m}_{ij} = \text{MessageFunction}(\mathbf{h}_i^{(l)}, \mathbf{h}_j^{(l)}; \mathbf{W}_{ij})$$ ambapo $\mathbf{h}_i^{(l)}$ ni kipengele cha nodi $i$ kwenye safu $l$, na $\mathbf{W}_{ij}$ ni vigezo maalum kwa jozi ya nodi $(i, j)$. Ujumbe uliokusanywa kisha hutumiwa kusasisha uwakilishi wa nodi: $$\mathbf{h}_i^{(l+1)} = \text{UpdateFunction}(\mathbf{h}_i^{(l)}, \text{Aggregate}(\{\mathbf{m}_{ij}\}_{j \in \mathcal{N}(i)}))$$ Utaratibu wa umakini hatimaye huhesabu alama ya ustahiki kwa grafu nzima ya mavazi.
2.3. Ujumuishaji wa Vipengele vya Aina Nyingi
NGNN ina kubadilika na inaweza kuingiza vipengele kutoka kwa aina nyingi:
- Vipengele vya Kuonekana: Vinatolewa kutoka kwa picha za vipengee kwa kutumia CNN (mfano, ResNet).
- Vipengele vya Maandishi: Vinatolewa kutoka kwa maelezo ya vipengee au lebo kwa kutumia miundo ya NLP.
3. Majaribio & Matokeo
Majaribio yalifanywa kwenye kazi mbili za kawaida ili kuthibitisha ufanisi wa muundo.
3.1. Usanidi wa Majaribio
Muundo ulitathminiwa kwenye seti za data za ustahiki wa mitindo zinazopatikana kwa umma. Misingi ilijumuisha:
- Mbinu za jozi (mfano, Siamese CNN, Low-rank Mahalanobis).
- Mbinu zinazotegemea mlolongo (mfano, RNN, Bi-LSTM).
- Mbinu zingine zinazotegemea grafu (mfano, GCN ya kawaida, GAT).
3.2. Kazi ya Kujaza Pengo
Kwa kuzingatia mavazi yasiyokamilika, kazi ni kuchagua kipengee kinacholingana zaidi kutoka kwenye bahasha ya wagombea ili kujaza pengo. NGNN ilifanikiwa kwa ubora wa juu zaidi, ikishinda kwa kiasi kikubwa miundo ya mlolongo (RNN/Bi-LSTM) na aina nyingine za GNN. Hii inaonyesha uwezo wake bora wa kufikiri kwa mavazi yote kwa pamoja zaidi ya utegemezi wa ndani wa jozi au mlolongo.
3.3. Kazi ya Kutabiri Ustahiki
Kwa kuzingatia mavazi yaliyokamilika, kazi ni kutabiri lebo ya jozi (yanayolingana/hayalingani) au alama ya ustahiki. NGNN tena ilipata alama za juu zaidi za AUC na F1. Matokeo yalithibitisha kuwa kuiga mavazi kama grafu zilizo na mwingiliano wa kipekee kwa nodi kunakamata hali ya kina, ya uhusiano mwingi ya ustahiki wa mitindo kwa ufanisi zaidi.
4. Uchambuzi wa Kiufundi & Mawazo
Wazo la Msingi: Mafanikio ya msingi ya karatasi hii ni kutambua kwamba ustahiki wa mitindo ni tatizo la grafu la uhusiano, sio la jozi au la mlolongo. Utofautishaji wa grafu (Grafu ya Mitindo) unafaa zaidi kwa uwanja huu kuliko mlolongo, kama ilivyojadiliwa katika kazi muhimu juu ya upendeleo wa kufikiria uhusiano kwa ujifunzaji wa kina (Battaglia et al., 2018). Waandishi wanatambua kikomo cha RNNs kwa usahihi, ambazo huweka mpangilio wa kiholela kwenye seti za vipengee ambazo hazina mpangilio, dosari ambayo pia imeainishwa katika utafiti wa uwakilishi wa seti na grafu (Vinyals et al., 2015).
Mtiririko wa Mantiki: Hoja ni sahihi: 1) Tambua asili ya uhusiano ya tatizo, 2) Pendekeza uwakilishi wa data ulioundwa kwa grafu, 3) Buni muundo wa neural (NGNN) uliotengenezwa kwa muundo huo na mwingiliano tofauti wa kingo, 4) Thibitisha kwa njia ya majaribio. Mabadiliko kutoka mlolongo-hadi-grafu yanaonyesha mageuzi makubwa zaidi katika AI kutoka kwa usindikaji wa mifuatano hadi usindikaji wa mitandao, kama inavyoonekana katika uchambuzi wa mitandao ya kijamii na grafu za maarifa.
Nguvu & Kasoro: Nguvu kuu ni uwekezaji wa vigezo vya kipekee kwa nodi katika NGNN. Hii inaruhusu muundo kujifunza kwamba mwingiliano kati ya "blazer" na "dress" ni tofauti kabisa na ule kati ya "sneakers" na "soksi," ikikamata kanuni za mitindo maalum za aina. Hii ni hatua zaidi ya GCNs/GATs za kawaida. Kasoro inayowezekana, ya kawaida katika mifano ya kitaaluma, ni gharama ya hesabu. Kujifunza seti ya kipekee ya vigezo $\mathbf{W}_{ij}$ kwa kila jozi inayowezekana ya aina inaweza kukosa kuongezeka kwa katalogi kubwa, zenye maelezo mazuri na maelfu ya aina bila kushiriki kikubwa cha vigezo au mbinu za uainishaji.
Mawazo Yanayoweza Kutekelezwa: Kwa watendaji, utafiti huu unalazimisha mabadiliko katika uundaji wa data. Badala ya kuandaa data ya mavazi ya mlolongo, zingatia kujenga grafu tajiri za uhusiano wa aina. Muundo wa NGNN ni mpango tayari wa kutekelezwa kwa timu za teknolojia katika kampuni kama Stitch Fix au Amazon Fashion. Mbinu ya aina nyingi pia inapendekeza kuwekeza katika mifumo ya vipengele vilivyounganishwa kwa picha na maandishi. Hatua inayofuata mara moja inapaswa kuwa kuchunguza makadirio ya ufanisi ya vigezo vya kipekee kwa nodi (mfano, kwa kutumia hypernetworks au uainishaji wa tensor) ili kuhakikisha uwezekano wa viwanda.
5. Mfano wa Mfumo wa Uchambuzi
Hali: Kuchambua ustahiki wa mavazi ya mgombea: "Shati nyeupe ya Kitani, Jeansi za Bluu ya Giza, Viatu vya Ngozi ya Kahawia, Saa ya Fedha."
Utumiaji wa Mfumo (Sio Msimbo):
- Uundaji wa Grafu:
- Nodi: {Shati, Jeansi, Viatu, Saa}.
- Kingo: Zimeunganishwa kikamilifu au kulingana na grafu ya maarifa ya awali (mfano, Shati-Jeansi, Shati-Viatu, Jeansi-Viatu, Saa-Shati, n.k.).
- Uanzishaji wa Vipengele:
- Toa vipengele vya kuonekana: Rangi (nyeupe, bluu, kahawia, fedha), muundo (kitani, denim, ngozi, chuma), alama ya usawa rasmi.
- Toa vipengele vya maandishi: Maneno muhimu kutoka kwa maelezo ("ya kawaida," "rasmi," "majira ya joto," "kifaa cha ziada").
- Usindikaji wa NGNN:
- Nodi ya "Shati" inapokea ujumbe kutoka kwa "Jeansi," "Viatu," na "Saa." Vigezo $\mathbf{W}_{\text{Shati,Jeansi}}$ vinajifunza usawa wa mtindo wa kawaida, wakati $\mathbf{W}_{\text{Shati,Saa}}$ inaweza kujifunza kanuni za uratibu wa vifaa vya ziada.
- Baada ya safu kadhaa, kila nodi ina uwakilishi unaozingatia muktadha unaoonyesha jukumu lake katika mavazi haya maalum.
- Kupima Alama ya Ustahiki:
- Uwakilishi wa kiwango cha mwisho cha grafu hutiwa kwenye safu ya umakini/upimaji.
- Matokeo: Alama ya juu ya ustahiki (mfano, 0.87), ikionyesha mavazi yanayolingana, ya kisasa.
6. Matumizi ya Baadaye & Mwelekeo
- Ustahiki wa Kibinafsi: Kujumlisha wasifu wa mtumiaji, ununuzi wa zamani, na vipimo vya mwili kwenye grafu (mfano, kuongeza nodi ya "Mtumiaji") ili kuhama kutoka upendekezo wa jumla wa mavazi hadi wa kibinafsi. Utafiti katika kuchuja kwa ushirikiano kupitia GNNs (He et al., 2020, LightGCN) hutoa njia wazi.
- AI Inayoelezeka kwa Mitindo: Kuchukua faida ya mbinu za uelezaji wa GNN (mfano, GNNExplainer) ili kuangazia ni mwingiliano gani maalum wa jozi ya vipengee unaodhoofisha alama ya mavazi, na kutoa ushauri unaoweza kutekelezwa wa mitindo kwa watumiaji.
- Mitindo ya Kuvuka Vikoa & Metaverse: Kutumia mfumo huu kwenye kujaribu mtandaoni, mitindo ya dijitali katika michezo/metaverses, na mitindo ya kuvuka vikoa (mfano, kufananisha fanicha na mavazi kwa ajili ya "uzuri" unaolingana). Muundo wa grafu unaweza kujumuisha kwa urahisi nodi kutoka vikoa tofauti.
- Mitindo Endelevu & Duka la Nguo la Capsule: Kutumia muundo huu kutambua vipengee vya "msingi" vinavyoweza kubadilika zaidi ambavyo huunda mavazi yanayolingana na mengi mengine, na kusaidia katika kujenga duka la nguo endelevu la capsule na kupunguza matumizi ya kupita kiasi.
- Grafu za Mienendo & Za Wakati: Kuiga mitindo ya mienendo kwa muda kwa kujenga grafu za mitindo za wakati, na kuruhusu mfumo kupendekeza mavazi ambayo yanalingana na yanavutia kwa msimu wa sasa.
7. Marejeo
- Cui, Z., Li, Z., Wu, S., Zhang, X., & Wang, L. (2019). Dressing as a Whole: Outfit Compatibility Learning Based on Node-wise Graph Neural Networks. Proceedings of the 2019 World Wide Web Conference (WWW '19).
- Battaglia, P. W., et al. (2018). Relational inductive biases, deep learning, and graph networks. arXiv preprint arXiv:1806.01261.
- Vinyals, O., Bengio, S., & Kudlur, M. (2015). Order matters: Sequence to sequence for sets. arXiv preprint arXiv:1511.06391.
- He, X., Deng, K., Wang, X., Li, Y., Zhang, Y., & Wang, M. (2020). LightGCN: Simplifying and Powering Graph Convolution Network for Recommendation. Proceedings of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval.
- Veit, A., Kovacs, B., Bell, S., McAuley, J., Bala, K., & Belongie, S. (2015). Learning visual clothing style with heterogeneous dyadic co-occurrences. Proceedings of the IEEE International Conference on Computer Vision (ICCV).
- McAuley, J., Targett, C., Shi, Q., & van den Hengel, A. (2015). Image-based recommendations on styles and substitutes. Proceedings of the 38th International ACM SIGIR Conference on Research and Development in Information Retrieval.