ভাষা নির্বাচন করুন

বাতাস থেকে পরিধানে: AR/VR স্কেচিংয়ের মাধ্যমে ব্যক্তিগতকৃত ৩ডি ডিজিটাল ফ্যাশন সৃষ্টি

একটি অভিনব কাঠামো যা শর্তাধীন ডিফিউশন মডেল ও নতুন ডেটাসেটের মাধ্যমে AR/VR-এ স্বজ্ঞাত ৩ডি স্কেচিংয়ের মাধ্যমে সাধারণ ব্যবহারকারীদের উচ্চমানের ৩ডি পোশাক তৈরি করতে সক্ষম করে।
diyshow.org | PDF Size: 11.8 MB
রেটিং: 4.5/5
আপনার রেটিং
আপনি ইতিমধ্যে এই ডকুমেন্ট রেট করেছেন
PDF ডকুমেন্ট কভার - বাতাস থেকে পরিধানে: AR/VR স্কেচিংয়ের মাধ্যমে ব্যক্তিগতকৃত ৩ডি ডিজিটাল ফ্যাশন সৃষ্টি

সূচিপত্র

1. ভূমিকা ও সারসংক্ষেপ

এই গবেষণা ডিজিটাল ফ্যাশন সৃষ্টির গণতন্ত্রীকরণে একটি গুরুত্বপূর্ণ শূন্যতা পূরণ করে। যদিও AR/VR প্রযুক্তি মূলধারার ভোক্তা ইলেকট্রনিক্সে পরিণত হচ্ছে, তবুও এই নিমজ্জিত স্থানগুলির মধ্যে ৩ডি বিষয়বস্তু তৈরির সরঞ্জামগুলি অ-বিশেষজ্ঞদের জন্য জটিল ও দুর্গম থেকে যায়। এই গবেষণাপত্রটি একটি অভিনব এন্ড-টু-এন্ড কাঠামো প্রস্তাব করে যা দৈনন্দিন ব্যবহারকারীদের একটি স্বজ্ঞাত প্রক্রিয়ার মাধ্যমে ব্যক্তিগতকৃত ৩ডি পোশাক ডিজাইন করতে দেয়: AR/VR পরিবেশে হাতে আঁকা ৩ডি স্কেচিং। মূল উদ্ভাবনটি একটি জেনারেটিভ এআই মডেলে নিহিত যা এই অনির্ভুল, ব্যবহারকারীবান্ধব স্কেচগুলিকে ব্যাখ্যা করে এবং মেটাভার্স, ভার্চুয়াল ট্রাই-অন এবং ডিজিটাল অভিব্যক্তির জন্য উপযুক্ত উচ্চ-নির্ভুলতা, বিস্তারিত ৩ডি পোশাক মডেলে রূপান্তরিত করে।

সিস্টেমের তাৎপর্য দ্বিমুখী: এটি ৩ডি ফ্যাশন ডিজাইনের প্রযুক্তিগত বাধা কমায়, নিমজ্জিত প্রযুক্তির ভোক্তাকরণ প্রবণতার সাথে সামঞ্জস্য রেখে, এবং এটি ৩ডি বিষয়বস্তু সৃষ্টির জন্য একটি নতুন দৃষ্টান্ত উপস্থাপন করে যা জটিল সফ্টওয়্যার ইন্টারফেসের পরিবর্তে প্রাকৃতিক মানুষের মিথস্ক্রিয়া (স্কেচিং) কাজে লাগায়।

2. পদ্ধতি ও প্রযুক্তিগত কাঠামো

প্রস্তাবিত কাঠামো, যার নাম DeepVRSketch+, তিনটি মূল স্তম্ভের উপর নির্মিত: একটি নতুন ডেটাসেট, একটি শর্তাধীন জেনারেটিভ মডেল এবং একটি বিশেষায়িত প্রশিক্ষণ কৌশল।

2.1. KO3DClothes ডেটাসেট

স্কেচ-থেকে-৩ডি গবেষণার একটি প্রধান বাধা হল জোড়া ডেটার অভাব (৩ডি মডেল + সংশ্লিষ্ট ব্যবহারকারী স্কেচ)। এটি সমাধানের জন্য, লেখকরা KO3DClothes উপস্থাপন করেছেন, একটি নতুন ডেটাসেট যাতে হাজার হাজার জোড়া উচ্চ-মানের ৩ডি পোশাক মেশ এবং VR পরিবেশে ব্যবহারকারীদের তৈরি করা সংশ্লিষ্ট ৩ডি স্কেচ রয়েছে। বিমূর্ত, প্রায়শই এলোমেলো, মানুষের স্কেচ থেকে সুনির্দিষ্ট ৩ডি জ্যামিতিতে ম্যাপিং বোঝার জন্য মডেলকে প্রশিক্ষণ দিতে এই ডেটাসেট অত্যন্ত গুরুত্বপূর্ণ।

2.2. DeepVRSketch+ আর্কিটেকচার

মূল জেনারেটিভ মডেলটি একটি শর্তাধীন ডিফিউশন মডেল। স্ট্যান্ডার্ড GAN-গুলির থেকে ভিন্ন, যেগুলো মোড কোল্যাপ্স এবং প্রশিক্ষণের অস্থিরতায় ভুগতে পারে, ডিফিউশন মডেলগুলি DALL-E 2 এবং Stable Diffusion-এর মতো মডেলগুলির দ্বারা প্রমাণিত হিসাবে উচ্চ-মানের, বৈচিত্র্যময় আউটপুট তৈরি করতে অসাধারণ সাফল্য দেখিয়েছে। মডেলটি ইনপুট ৩ডি স্কেচের উপর জেনারেশন প্রক্রিয়াকে শর্তযুক্ত করে, যা একটি নিবেদিত স্কেচ এনকোডারের মাধ্যমে একটি লেটেন্ট উপস্থাপনায় এনকোড করা হয়। ডিফিউশন প্রক্রিয়াটি স্কেচের অভিপ্রায়ের সাথে মিলে যায় এমন একটি বাস্তবসম্মত ৩ডি পোশাক ভক্সেল বা পয়েন্ট ক্লাউড তৈরি করতে একটি এলোমেলো গাউসিয়ান বন্টনকে পুনরাবৃত্তভাবে ডিনয়েজ করে।

ফরোয়ার্ড ডিফিউশন প্রক্রিয়াটি $T$ ধাপে একটি বাস্তব ৩ডি পোশাক নমুনা $x_0$-এ নয়েজ যোগ করে: $q(x_t | x_{t-1}) = \mathcal{N}(x_t; \sqrt{1-\beta_t} x_{t-1}, \beta_t I)$। মডেল দ্বারা শেখা বিপরীত প্রক্রিয়াটি সংজ্ঞায়িত করা হয়: $p_\theta(x_{t-1} | x_t, c) = \mathcal{N}(x_{t-1}; \mu_\theta(x_t, t, c), \Sigma_\theta(x_t, t, c))$, যেখানে $c$ হল কন্ডিশনিং স্কেচ এমবেডিং।

2.3. অভিযোজিত পাঠ্যক্রম শিক্ষণ

নবীন ব্যবহারকারীদের স্কেচের মানের বিস্তৃত তারতম্য সামলানোর জন্য, লেখকরা একটি অভিযোজিত পাঠ্যক্রম শিক্ষণ কৌশল প্রয়োগ করেছেন। মডেলটিকে প্রথমে পরিষ্কার, সুনির্দিষ্ট স্কেচগুলির সাথে তাদের ৩ডি মডেল জোড়া দিয়ে প্রশিক্ষণ দেওয়া হয়। ধীরে ধীরে, প্রশিক্ষণের সময়, এটিকে ক্রমবর্ধমান মাত্রার নয়েজ এবং অপূর্ণতা সহ স্কেচের সংস্পর্শে আনা হয়, যা অ-বিশেষজ্ঞ ব্যবহারকারীদের বাস্তব-বিশ্বের ইনপুটের অনুকরণ করে। এটি মডেলটিকে অস্পষ্টতা এবং অনির্ভুলতার প্রতি সহনশীল হতে শেখায়।

3. পরীক্ষামূলক ফলাফল ও মূল্যায়ন

3.1. পরিমাণগত মেট্রিক্স

গবেষণাপত্রটি স্ট্যান্ডার্ড ৩ডি পুনর্গঠন মেট্রিক্স ব্যবহার করে বেশ কয়েকটি বেসলাইনের বিরুদ্ধে মডেলটির মূল্যায়ন করে:

  • চেমফার দূরত্ব (CD): উৎপন্ন পয়েন্ট ক্লাউড এবং গ্রাউন্ড ট্রুথের মধ্যে গড় নিকটতম বিন্দুর দূরত্ব পরিমাপ করে। DeepVRSketch+ সেরা বেসলাইনের তুলনায় ১৫% কম CD অর্জন করেছে।
  • আর্থ মুভার্স দূরত্ব (EMD): বিশ্বব্যাপী বন্টন সাদৃশ্য মূল্যায়ন করে। প্রস্তাবিত মডেলটি উচ্চতর কর্মক্ষমতা দেখিয়েছে।
  • ফ্রেচেট পয়েন্ট ক্লাউড দূরত্ব (FPD): ৩ডি পয়েন্ট ক্লাউডের জন্য ফ্রেচেট ইনসেপশন দূরত্বের একটি অভিযোজন, যা উৎপন্ন নমুনার গুণমান ও বৈচিত্র্য মূল্যায়ন করে।

3.2. গুণগত ফলাফল ও ব্যবহারকারী সমীক্ষা

গুণগতভাবে, Sketch2Mesh বা VR-SketchNet-এর মতো বেসলাইনগুলির তুলনায় DeepVRSketch+ থেকে উৎপন্ন পোশাকগুলি আরও বাস্তবসম্মত ড্রেপ, সূক্ষ্ম বিবরণ (যেমন ভাঁজ এবং কুঁচকি) এবং স্কেচের সামগ্রিক সিলুয়েটের সাথে ভালো আনুগত্য প্রদর্শন করে। ৫০ জন অংশগ্রহণকারীর (ডিজাইনার এবং অ-ডিজাইনারের মিশ্রণ) সাথে একটি নিয়ন্ত্রিত ব্যবহারকারী সমীক্ষা পরিচালিত হয়েছিল। অংশগ্রহণকারীরা পোশাক তৈরি করতে AR/VR স্কেচিং ইন্টারফেস ব্যবহার করে এবং সিস্টেমটিকে রেট দিয়েছে। মূল ফলাফল:

  • ব্যবহারযোগ্যতা স্কোর: ব্যবহারের সহজতার জন্য ৪.৩/৫.০।
  • আউটপুট সন্তুষ্টি: উৎপন্ন ৩ডি মডেলের গুণমানের জন্য ৪.১/৫.০।
  • Blender বা CLO3D-এর মতো ঐতিহ্যবাহী ৩ডি সফ্টওয়্যারের তুলনায় অ-ডিজাইনাররা প্রবেশের জন্য উল্লেখযোগ্যভাবে কম অনুভূত বাধার কথা জানিয়েছেন।
গবেষণাপত্রের চিত্র ১ পাইপলাইনটি দৃশ্যত সংক্ষিপ্ত করে: VR-এ ব্যবহারকারী স্কেচ করে -> এআই মডেল স্কেচ প্রক্রিয়া করে -> বাস্তবসম্মত ৩ডি মডেল তৈরি হয় -> ভিজ্যুয়ালাইজেশন/ভার্চুয়াল ট্রাই-অনের জন্য AR-তে মডেল প্রদর্শিত হয়।

4. মূল বিশ্লেষণ ও বিশেষজ্ঞ অন্তর্দৃষ্টি

মূল অন্তর্দৃষ্টি: এই গবেষণাপত্রটি শুধুমাত্র একটি ভালো ৩ডি মডেল জেনারেটর সম্পর্কে নয়; এটি নিমজ্জিত ওয়েবের জন্য গণতন্ত্রীকরণ পাইপলাইন-এ একটি কৌশলগত বাজি। লেখকরা সঠিকভাবে চিহ্নিত করেছেন যে ভোক্তা AR/VR-এর জন্য কিলার অ্যাপ শুধুমাত্র ভোগ নয়, বরং সৃষ্টি। স্কেচিংয়ের স্বজ্ঞাত ভাষাকে কাজে লাগিয়ে—যা একটি মৌলিক মানুষের দক্ষতা—তারা বহুভুজ মডেলিংয়ের খাড়া শিক্ষণ বক্ররেখাকে এড়িয়ে যায়, ব্যবহারকারী-উৎপাদিত ৩ডি বিষয়বস্তুর জন্য প্রধান গ্রহণযোগ্যতা ব্লকারকে সরাসরি আক্রমণ করে। তাদের পদ্ধতিটি Google-এর Quick Draw বা RunwayML-এর মতো সরঞ্জামগুলির দর্শনের প্রতিফলন ঘটায়, যা জটিল এআইকে সরল ইন্টারফেসে বিমূর্ত করে।

যুক্তিসঙ্গত প্রবাহ: যুক্তিটি আকর্ষণীয়: ১) AR/VR হার্ডওয়্যার কমোডিটাইজ হচ্ছে (Meta Quest, Apple Vision Pro)। ২) অতএব, নিমজ্জিত অভিজ্ঞতার জন্য একটি গণ ব্যবহারকারী ভিত্তি উদ্ভূত হচ্ছে। ৩) এটি ব্যক্তিগতকৃত ডিজিটাল সম্পদের চাহিদা তৈরি করে (ফ্যাশন একটি প্রধান প্রার্থী)। ৪) বিদ্যমান ৩ডি সৃষ্টি সরঞ্জামগুলি এই গণ বাজারের জন্য উপযুক্ত নয়। ৫) সমাধান: একটি মজবুত এআই অনুবাদকের (ডিফিউশন মডেল) মাধ্যমে একটি প্রায় সর্বজনীন মানুষের দক্ষতা (আঁকা) একটি জটিল ৩ডি আউটপুটের সাথে ম্যাপ করুন। KO3DClothes ডেটাসেটের পরিচয় হল এই অনুবাদকে সক্ষম করার জন্য একটি গুরুত্বপূর্ণ, প্রায়শই উপেক্ষিত, অবকাঠামোর অংশ, যা মনে করিয়ে দেয় কীভাবে ImageNet কম্পিউটার ভিশনকে অনুঘটক করেছিল।

শক্তি ও ত্রুটি: প্রধান শক্তি হল ইনপুট (VR স্কেচ) থেকে আউটপুট (ব্যবহারযোগ্য ৩ডি সম্পদ) পর্যন্ত সম্পূর্ণ পাইপলাইনের সামগ্রিক, ব্যবহারকারী-কেন্দ্রিক নকশা। একটি শর্তাধীন ডিফিউশন মডেলের ব্যবহার সর্বশেষ প্রযুক্তি এবং একটি একক স্কেচ থেকে সম্ভাব্য পোশাকের বহু-মোডাল বন্টন ক্যাপচার করার জন্য ভালভাবে ন্যায়সঙ্গত। যাইহোক, ত্রুটি—অনেক এআই-ফর-ক্রিয়েশন গবেষণাপত্রের সাধারণ—"সৃজনশীলতা"-এর মূল্যায়নে নিহিত। সিস্টেমটি একটি স্কেচ থেকে ব্যাখ্যা এবং এক্সট্রাপোলেশনে দক্ষ, কিন্তু এটি কি সত্যিকারের নতুনত্ব সক্ষম করে, নাকি এটি শুধুমাত্র তার প্রশিক্ষণ ডেটা থেকে প্যাটার্ন পুনরুদ্ধার এবং মিশ্রিত করে? ঝুঁকি হল শৈলীর একরূপতা, যা কিছু টেক্সট-টু-ইমেজ মডেলে দেখা গেছে। তদুপরি, একটি ভোক্তা VR সেটিংয়ে রিয়েল-টাইম ইনফারেন্সের জন্য ডিফিউশন মডেলগুলির গণনামূলক খরচ গভীরভাবে সমাধান করা হয়নি, যা নিরবচ্ছিন্ন মিথস্ক্রিয়ার জন্য একটি সম্ভাব্য বাধা তৈরি করে।

কার্যকরী অন্তর্দৃষ্টি: শিল্পের খেলোয়াড়দের জন্য, অবিলম্বে গ্রহণযোগ্য বিষয় হল যেকোনো মেটাভার্স বা নিমজ্জিত প্ল্যাটফর্ম কৌশলের একটি মূল উপাদান হিসাবে এআই-চালিত, স্বজ্ঞাত বিষয়বস্তু সৃষ্টি সরঞ্জাম-এ বিনিয়োগ করা। প্ল্যাটফর্ম ধারকদের (Meta, Apple, Roblox) তাদের অর্থনীতি বুটস্ট্র্যাপ করার জন্য এই ধরনের সরঞ্জামগুলিকে অপরিহার্য SDK উপাদান হিসাবে দেখা উচিত। ফ্যাশন ব্র্যান্ডগুলির জন্য, প্রোটোটাইপটি গ্রাহকদের কো-ডিজাইন এবং ভার্চুয়াল পণ্য ব্যক্তিগতকরণে ব্যাপকভাবে জড়িত করার জন্য একটি স্পষ্ট পথ উপস্থাপন করে। লক্ষ্য করার গবেষণা দিকটি হল ভক্সেল/পয়েন্ট ক্লাউড আউটপুট থেকে হালকা, অ্যানিমেটেবল এবং প্রোডাকশন-রেডি মেশ ফরম্যাটে স্থানান্তর, সম্ভাব্যভাবে ড্রেপের জন্য পদার্থবিজ্ঞান সিমুলেশন একীভূত করা, যেমন NVIDIA-এর এআই এবং পদার্থবিজ্ঞানের কাজে দেখা যায়।

5. প্রযুক্তিগত গভীর অনুসন্ধান

শর্তাধীন ডিফিউশন মডেলটি একটি শেখা লেটেন্ট স্পেসে কাজ করে। স্কেচ এনকোডার $E_s$ একটি ৩ডি স্কেচ পয়েন্ট ক্লাউড $S$-কে একটি লেটেন্ট ভেক্টর $z_s = E_s(S)$-এ প্রজেক্ট করে। এই কন্ডিশনিং ভেক্টর $z_s$ ক্রস-অ্যাটেনশন মেকানিজমের মাধ্যমে ডিফিউশন মডেলের ডিনয়েজিং U-Net-এ একাধিক স্তরে ইনজেক্ট করা হয়: $\text{Attention}(Q, K, V) = \text{softmax}(\frac{QK^T}{\sqrt{d}})V$, যেখানে $Q$ হল নয়েজি ইনপুট $x_t$-এর একটি প্রজেকশন, এবং $K, V$ হল স্কেচ লেটেন্ট $z_s$-এর প্রজেকশন। এটি মডেলটিকে বিভিন্ন রেজোলিউশনে স্কেচের জ্যামিতিক এবং শব্দার্থিক বৈশিষ্ট্যের সাথে ডিনয়েজিং প্রক্রিয়াকে সারিবদ্ধ করতে দেয়।

লস ফাংশনটি ডেটা সম্ভাবনার উপর একটি পরিবর্তিত ভ্যারিয়েশনাল লোয়ার বাউন্ড, যা প্রতিটি ধাপে যোগ করা নয়েজের পূর্বাভাস দেওয়ার উপর দৃষ্টি নিবদ্ধ করে: $L(\theta) = \mathbb{E}_{t, x_0, \epsilon} [\| \epsilon - \epsilon_\theta(x_t, t, z_s) \|^2]$, যেখানে $\epsilon$ হল সত্যিকারের নয়েজ এবং $\epsilon_\theta$ হল মডেলের পূর্বাভাস।

6. বিশ্লেষণ কাঠামো ও কেস স্টাডি

সৃজনশীল এআই সরঞ্জাম মূল্যায়নের কাঠামো:

  1. প্রবেশাধিকার: ইনপুট মড্যালিটির স্বাভাবিকতা (যেমন, স্কেচ বনাম কোড)।
  2. নির্ভুলতা: আউটপুটের গুণমান এবং অভিপ্রায়ের সাথে আনুগত্য (CD, EMD, ব্যবহারকারী সমীক্ষা দ্বারা পরিমাপিত)।
  3. নিয়ন্ত্রণযোগ্যতা: আউটপুটের উপর ব্যবহারকারীর নিয়ন্ত্রণের সূক্ষ্মতা (বৈশ্বিক আকৃতি বনাম স্থানীয় বিবরণ)।
  4. সাধারণীকরণ: বৈচিত্র্যময়, অদেখা ব্যবহারকারী ইনপুট এবং শৈলী পরিচালনা করার ক্ষমতা।
  5. উৎপাদন-প্রস্তুতি: আউটপুট ফরম্যাট সামঞ্জস্য (যেমন, .obj, .fbx, UV ম্যাপ)।

কেস স্টাডি: একটি "অপ্রতিসম ড্রেপড গাউন" ডিজাইন করা

  1. ব্যবহারকারীর ক্রিয়া: VR-এ, ব্যবহারকারী একটি কাঁধে উচ্চ কলার এবং প্রবাহিত, অসম হেমলাইন সহ একটি গাউনের সিলুয়েট স্কেচ করে।
  2. সিস্টেম প্রক্রিয়াকরণ: স্কেচ এনকোডারটি বৈশ্বিক অপ্রতিসম আকৃতি এবং ড্রেপের জন্য স্থানীয় অভিপ্রায় ক্যাপচার করে। এর উপর শর্তযুক্ত ডিফিউশন মডেলটি ডিনয়েজিং শুরু করে। পাঠ্যক্রম শিক্ষণ নিশ্চিত করে যে যদিও স্কেচটি আলগা, তবুও মডেলটি প্রবাহিত রেখাগুলিকে নরম কাপড়ের পদার্থবিজ্ঞানের সাথে যুক্ত করে।
  3. আউটপুট: সিস্টেমটি একটি গাউনের ৩ডি মেশ তৈরি করে। উচ্চ কলারটি একটি কাঠামোগত ভাঁজ হিসাবে উপলব্ধি করা হয়, যখন হেমলাইনে বৈচিত্র্যময়, প্রাকৃতিক দেখতে কুঁচকি রয়েছে। ব্যবহারকারী তখন ঘোরাতে পারে, একটি ভার্চুয়াল অবতারে AR-তে দেখতে পারে এবং ঐচ্ছিকভাবে আবার এলাকাগুলির উপর স্কেচ করে পরিমার্জন করতে পারে।
  4. কাঠামো দ্বারা মূল্যায়ন: প্রবেশাধিকার এবং সাধারণীকরণে উচ্চ (একটি অপ্রচলিত ডিজাইন পরিচালনা করেছে)। নির্ভুলতা বিষয়গতভাবে উচ্চ। নিয়ন্ত্রণযোগ্যতা মাঝারি—ব্যবহারকারী পোস্ট-জেনারেশনে কুঁচকির সঠিক সংখ্যা সহজে পরিবর্তন করতে পারে না, যা একটি ভবিষ্যতের গবেষণা ক্ষেত্রের দিকে ইঙ্গিত করে।

7. ভবিষ্যতের প্রয়োগ ও দিকনির্দেশনা

  • রিয়েল-টাইম সহ-সৃষ্টি ও সামাজিক ডিজাইন: একটি শেয়ার্ড VR স্পেসে একাধিক ব্যবহারকারী একই পোশাকে একই সাথে স্কেচিং এবং পুনরাবৃত্তি করছে, লাইভ এআই-জেনারেটেড প্রিভিউ সহ।
  • পদার্থবিজ্ঞান সিমুলেশনের সাথে একীকরণ: জেনারেটিভ মডেলটিকে রিয়েল-টাইম কাপড় সিমুলেটরের সাথে যুক্ত করা (যেমন, NVIDIA FleX বা PyBullet-এর উপর ভিত্তি করে) যাতে উৎপন্ন পোশাকগুলি অ্যানিমেটেড অবতারে শুরু থেকেই বাস্তবসম্মতভাবে নড়াচড়া করে এবং ড্রেপ করে।
  • টেক্সট ও ভয়েস-নির্দেশিত পরিমার্জন: বহু-মোডাল কন্ডিশনিং। যেমন, ভয়েস কমান্ড বা টেক্সট প্রম্পটের মাধ্যমে "হাতা আরও ফুলিয়ে দাও", প্রাথমিক স্কেচ-ভিত্তিক আউটপুট পরিমার্জন করে, InstructPix2Pix-এর মতো।
  • সরাসরি-থেকে-ডিজিটাল-ফেব্রিকেশন সেতু: শারীরিক ফ্যাশনের জন্য, পাইপলাইনটি প্রসারিত করে ৩ডি মডেল থেকে ২ডি সেলাই প্যাটার্ন তৈরি করা, বাস্তব-বিশ্বের পোশাক তৈরিতে সহায়তা করা।
  • ব্যক্তিগতকৃত এআই ফ্যাশন সহকারী: একটি এআই এজেন্ট যা ব্যবহারকারীর ব্যক্তিগত শৈলী তাদের স্কেচ ইতিহাস থেকে শেখে এবং পরিবর্তনের প্রস্তাব দিতে পারে, আংশিক স্কেচ সম্পূর্ণ করতে পারে বা তাদের রুচির সাথে সামঞ্জস্যপূর্ণ সম্পূর্ণ নতুন ধারণা তৈরি করতে পারে।

8. তথ্যসূত্র

  1. Zang, Y., Hu, Y., Chen, X., et al. "From Air to Wear: Personalized 3D Digital Fashion with AR/VR Immersive 3D Sketching." Journal of Latex Class Files, 2021.
  2. Ho, J., Jain, A., & Abbeel, P. "Denoising Diffusion Probabilistic Models." Advances in Neural Information Processing Systems (NeurIPS), 2020. (সেমিনাল ডিফিউশন মডেল গবেষণাপত্র)।
  3. Rombach, R., Blattmann, A., Lorenz, D., et al. "High-Resolution Image Synthesis with Latent Diffusion Models." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2022. (লেটেন্ট স্পেস ডিফিউশন সম্পর্কে)।
  4. Isola, P., Zhu, J., Zhou, T., & Efros, A. A. "Image-to-Image Translation with Conditional Adversarial Networks." CVPR, 2017. (Pix2Pix কাঠামো, শর্তাধীন জেনারেশনের জন্য মৌলিক)।
  5. NVIDIA. "NVIDIA Cloth & Physics Simulation." https://www.nvidia.com/en-us/design-visualization/technologies/cloth-physics-simulation/
  6. Meta. "Presence Platform: Insight SDK for Hand Tracking." https://developer.oculus.com/documentation/unity/ps-hand-tracking/ (ইনপুট মড্যালিটির জন্য প্রাসঙ্গিক)।