ডিপ জেনারেটিভ ইমেজ মডেলের জ্যামিতি এবং এর প্রয়োগ

রিম্যানিয়ান মেট্রিক্স ব্যবহার করে জিএএন লেটেন্ট স্পেস বিশ্লেষণের জ্যামিতিক কাঠামো, যা ব্যাখ্যাযোগ্য অক্ষ আবিষ্কার এবং জেনারেটিভ মডেলে দক্ষ অপ্টিমাইজেশন সক্ষম করে।
diyshow.org | PDF Size: 18.6 MB
ডিপ জেনারেটিভ ইমেজ মডেলের জ্যামিতি এবং এর প্রয়োগ

ডিপ জেনারেটিভ ইমেজ মডেলের জ্যামিতি এবং এর প্রয়োগ

বিনক্সু ওয়াং এবং কার্লোস আর. পন্স | স্নায়ুবিজ্ঞান বিভাগ, ওয়াশিংটন ইউনিভার্সিটি ইন সেন্ট লুইস

আইসিএলআর ২০২১-এ কনফারেন্স পেপার হিসেবে প্রকাশিত

সারসংক্ষেপ

জেনারেটিভ অ্যাডভারসারিয়াল নেটওয়ার্ক (জিএএন) প্রকৃত বিশ্বের ডেটা সেটের পরিসংখ্যানগত প্যাটার্ন মডেল করার জন্য একটি শক্তিশালী আনসুপারভাইজড পদ্ধতি হিসেবে আবির্ভূত হয়েছে, যেমন প্রাকৃতিক চিত্র। এই নেটওয়ার্কগুলি তাদের লেটেন্ট স্পেসে র্যান্ডম ইনপুটগুলিকে শেখানো ডেটার প্রতিনিধিত্বকারী নতুন নমুনায় ম্যাপ করতে প্রশিক্ষিত হয়। যাইহোক, জেনারেটরের উচ্চ মাত্রিকতা এবং অ-রৈখিকতার কারণে লেটেন্ট স্পেসের কাঠামো বোঝা কঠিন, যা মডেলগুলির কার্যকারিতা সীমিত করে।

লেটেন্ট স্পেস বোঝার জন্য বিদ্যমান বাস্তব-বিশ্বের চিত্রগুলির জন্য ইনপুট কোড সনাক্ত করার একটি উপায় (ইনভার্সন) এবং পরিচিত চিত্র রূপান্তর সহ দিকগুলি সনাক্ত করার একটি উপায় (ব্যাখ্যাযোগ্যতা) প্রয়োজন। এখানে, আমরা উভয় সমস্যা একসাথে সমাধান করতে একটি জ্যামিতিক কাঠামো ব্যবহার করি। আমরা জিএএন দ্বারা তৈরি চিত্র ম্যানিফোল্ডের রিম্যানিয়ান মেট্রিক্স গণনা করার জন্য একটি আর্কিটেকচার-অজ্ঞেয়বাদী পদ্ধতি তৈরি করি। মেট্রিক্সের আইজেন-ডিকম্পোজিশন বিভিন্ন স্তরের চিত্র পরিবর্তনশীলতা বিবেচনা করে এমন অক্ষগুলিকে বিচ্ছিন্ন করে।

বেশ কয়েকটি প্রি-ট্রেন্ড জিএএন-এর একটি অভিজ্ঞতামূলক বিশ্লেষণ দেখায় যে প্রতিটি অবস্থানের চারপাশের চিত্রের পরিবর্তন আশ্চর্যজনকভাবে কম সংখ্যক প্রধান অক্ষ বরাবর কেন্দ্রীভূত হয় (স্থানটি অত্যন্ত অ্যানিসোট্রপিক) এবং এই বৃহৎ পরিবর্তন তৈরি করে এমন দিকগুলি স্থানের বিভিন্ন অবস্থানে একই রকম (স্থানটি সমজাতীয়)। আমরা দেখাই যে অনেক শীর্ষ আইজেনভেক্টর চিত্র স্থানে ব্যাখ্যাযোগ্য রূপান্তরের সাথে মিলে যায়, যেখানে আইজেনস্পেসের একটি উল্লেখযোগ্য অংশ গৌণ রূপান্তরের সাথে মিলে যায় যা সংকুচিত করা যেতে পারে।

এই জ্যামিতিক বোধ জিএএন ব্যাখ্যাযোগ্যতা সম্পর্কিত পূর্ববর্তী মূল ফলাফলগুলিকে একত্রিত করে। আমরা দেখাই যে এই মেট্রিক্সের ব্যবহার লেটেন্ট স্পেসে আরও দক্ষ অপ্টিমাইজেশন (যেমন জিএএন ইনভার্সন) ermöglicht এবং ব্যাখ্যাযোগ্য অক্ষগুলির আনসুপারভাইজড আবিষ্কার সহজতর করে। আমাদের ফলাফলগুলি চিত্রিত করে যে জিএএন চিত্র ম্যানিফোল্ডের জ্যামিতি সংজ্ঞায়িত করা জিএএন বোঝার জন্য একটি সাধারণ কাঠামো হিসাবে কাজ করতে পারে।

ভূমিকা

ডিপ জেনারেটিভ মডেল, বিশেষ করে জেনারেটিভ অ্যাডভারসারিয়াল নেটওয়ার্ক (জিএএন), অত্যন্ত বাস্তবসম্মত এবং বৈচিত্র্যময় চিত্র তৈরি করতে সক্ষম হয়ে আনসুপারভাইজড লার্নিং ক্ষেত্রে বিপ্লব ঘটিয়েছে। ফটোরিয়ালিস্টিক নমুনা তৈরি করতে তাদের অসাধারণ সাফল্য সত্ত্বেও, তাদের লেটেন্ট স্পেসের অন্তর্নিহিত কাঠামো এখনও দুর্বলভাবে বোঝা যায়। এই স্থানগুলির উচ্চ-মাত্রিক, অ-রৈখিক প্রকৃতি ব্যাখ্যা এবং ব্যবহারিক প্রয়োগের জন্য উল্লেখযোগ্য চ্যালেঞ্জ উপস্থাপন করে।

এই গবেষণাপত্র জিএএন-এর লেটেন্ট স্পেস বিশ্লেষণ এবং বোঝার জন্য একটি জ্যামিতিক দৃষ্টিকোণ উপস্থাপন করে। জেনারেটরকে লেটেন্ট স্পেস থেকে চিত্র স্থানে একটি মসৃণ ম্যাপিং হিসাবে বিবেচনা করে, আমরা ফলস্বরূপ চিত্র ম্যানিফোল্ডের কাঠামো চিহ্নিত করতে রিম্যানিয়ান জ্যামিতি থেকে সরঞ্জামগুলি প্রয়োগ করতে পারি। এই পদ্ধতিটি জিএএন গবেষণায় দুটি মৌলিক চ্যালেঞ্জ মোকাবেলার জন্য একটি একীভূত কাঠামো প্রদান করে: লেটেন্ট স্পেস ইনভার্সন (বাস্তব চিত্রের জন্য কোড খোঁজা) এবং ব্যাখ্যাযোগ্যতা (লেটেন্ট স্পেসে অর্থপূর্ণ দিকগুলি সনাক্ত করা)।

আমাদের কাজ প্রদর্শন করে যে জিএএন ম্যানিফোল্ডের রিম্যানিয়ান মেট্রিক্স তার জ্যামিতি সম্পর্কে গুরুত্বপূর্ণ বৈশিষ্ট্য প্রকাশ করে, যার মধ্যে অ্যানিসোট্রপি এবং সমজাতীয়তা অন্তর্ভুক্ত, যা জেনারেটিভ মডেলগুলির তাত্ত্বিক বোধ এবং ব্যবহারিক প্রয়োগ উভয়ের জন্যই প্রত্যক্ষ প্রভাব ফেলে।

পটভূমি

জেনারেটিভ অ্যাডভারসারিয়াল নেটওয়ার্ক জটিল ডেটাসেটগুলিকে চিহ্নিত করে এমন প্যাটার্ন শেখে এবং পরবর্তীতে সেই সেটের প্রতিনিধিত্বকারী নতুন নমুনা তৈরি করে। সাম্প্রতিক বছরগুলিতে, উচ্চ-রেজোলিউশন এবং ফটোরিয়ালিস্টিক চিত্র তৈরি করতে জিএএন প্রশিক্ষণে অসাধারণ সাফল্য অর্জিত হয়েছে। ভালভাবে প্রশিক্ষিত জিএএনগুলি তাদের লেটেন্ট ইনপুট স্পেসে ইন্টারপোলেট করার সময় চিত্র আউটপুটের মধ্যে মসৃণ রূপান্তর দেখায়, যা উচ্চ-স্তরের চিত্র সম্পাদনা (মুখের বৈশিষ্ট্য পরিবর্তন করা), বস্তুর মতো প্রয়োগে তাদের দরকারী করে তোলে।