AMD ने स्थिर प्रसार 3 मध्यम मॉडल को Ryzen AI लैपटॉप पर 4-मेगापिक्सेल छवि पीढ़ी के लिए समर्थन के साथ समर्थन किया

AMD ने XDNA 2 न्यूरल प्रोसेसिंग यूनिट्स (NPU) के लिए अनुकूलित एक नया स्थिर डिफ्यूजन 3 मीडियम आर्टिफिशियल इंटेलिजेंस (AI) मॉडल जारी किया है। चिपमेकर ने दावा किया कि यह दुनिया का पहला एआई मॉडल है जो BF16 प्रारूप में आउटपुट को संसाधित करता है। मॉडल को कम से कम 24GB रैम के साथ नए Ryzen AI लैपटॉप द्वारा समर्थित किया जाएगा, जब उपयोगकर्ता Tensorstack के Amuse 3.1 बीटा सॉफ़्टवेयर को डाउनलोड करते हैं। स्थिर प्रसार 3 माध्यम एक ऑन-डिवाइस इमेज जनरेशन मॉडल है जिसे इंटरनेट कनेक्टिविटी की आवश्यकता नहीं होती है।
AMD की छवि पीढ़ी मॉडल प्रिंट-तैयार चित्र उत्पन्न कर सकता है
एक प्रेस विज्ञप्ति में, सांता क्लारा-आधारित टेक दिग्गज ने नई छवि पीढ़ी मॉडल को विस्तृत किया। AI मॉडल स्थिर प्रसार 3 माध्यम पर आधारित है, जो कंपनी के XDNA NPU के लिए अनुकूलित है और 2024 में जारी किए गए Ryzen AI लैपटॉप में सुसज्जित है और नए।
कंपनी का दावा है कि मॉडल का उपयोग पाठ संकेतों से स्टॉक-गुणवत्ता छवियों को उत्पन्न करने के लिए किया जा सकता है। मॉडल 1024 × 1024 रिज़ॉल्यूशन छवियों को उत्पन्न करता है, जो तब एनपीयू की क्षमताओं का उपयोग करके 2048 × 2048 प्रिंट-रेडी रिज़ॉल्यूशन के लिए तैयार हैं।
नया AI मॉडल AMD और Tensorstack के नए Amuse 3.1 डेस्कटॉप ऐप का हिस्सा है, जो डाउनलोड और इंस्टॉल करने के लिए स्वतंत्र है। चूंकि इमेज जेनरेशन मॉडल पूरी तरह से स्थानीय रूप से चलता है, इसलिए यह तब भी काम करता है जब डिवाइस इंटरनेट से जुड़ा नहीं होता है। डेटा-प्रोसेसिंग ऑन-डिवाइस, XDNA 2 NPU द्वारा संचालित होता है।
एएमडी ने कहा कि इसने एआई मॉडल की मेमोरी आवश्यकताओं पर काम किया है, और अब इसे 32 जीबी रैम के बजाय 24 जीबी रैम की आवश्यकता है जो स्थिर प्रसार एक्सएल टर्बो मॉडल के लिए आवश्यक था। इसके अतिरिक्त, नया छवि मॉडल सक्रिय होने पर केवल 9GB रैम का उपभोग करता है। कंपनी ने ब्लॉक फ्लोटिंग पॉइंट 16 या ब्लॉक FP16 (BF16) मेमोरी-कुशल प्रारूप का उपयोग करके इसे हासिल किया।
टेक दिग्गज ने कहा कि स्थिर प्रसार 3 मध्यम एआई मॉडल सख्ती से शीघ्र, संरचना और आदेश का पालन करता है। एएमडी ने कहा कि मॉडल को आज़माने वाले उपयोगकर्ताओं को पहले छवि के प्रकार, फिर संरचनात्मक घटकों, और अंत में विवरण और अन्य संदर्भ का वर्णन करना चाहिए। छवि से तत्वों को हटाने के लिए नकारात्मक संकेतों का उपयोग किया जा सकता है, और पूर्ण विराम के प्लेसमेंट से मॉडल की संदर्भ समझ बदल सकती है।