اسنپ چت با رویکرد جدیدی که مدلی سریعتر برای ساخت تصاویر بر اساس پرس و جوهای متنی ارائه می دهد، به دنبال تسریع زمان پاسخ ایجاد تصویر هوش مصنوعی مولد است.
که من فکر نمی کردم مانع بزرگی برای استفاده باشد. اکثر ابزارهای مولد هوش مصنوعی در حال حاضر، شاید 30 ثانیه یا بیشتر طول می کشد تا چنین تصاویری را تولید کنند، حتی در دستگاه های تلفن همراه. اما اسنپ میگوید که سیستم جدیدش میتواند تصاویر مشابهی را در کمتر از دو ثانیه تولید کند – که اگرچه ممکن است یک تغییر دهنده اصلی بازی نباشد، اما یک پیشرفت جالب در زمینه گستردهتر فرآیند هوش مصنوعی مولد است.
همانطور که اسنپ توضیح داده است:
“SnapFusion زمان اجرای مدل را از ورودی متن تا تولید تصویر در تلفن همراه به کمتر از دو ثانیه کاهش میدهد – سریعترین زمان منتشر شده تا به امروز توسط جامعه دانشگاهی. Snap Research با بهینه سازی معماری شبکه و فرآیند حذف نویز به این موفقیت دست یافت و در عین حال کیفیت تصویر را حفظ کرد. بنابراین، اکنون میتوان این مدل را برای تولید تصاویر بر اساس پیامهای متنی اجرا کرد و همانطور که تحقیقات دیگر نشان میدهد، تصاویر واضح و شفاف را در عرض چند ثانیه در موبایل به جای چند دقیقه یا ساعت دریافت کرد.

اینها نمونه هایی از تصاویر تولید شده توسط فرآیند SnapFusion هستند، که هنوز هم بسیار شبیه همان نوع تصاویر مولد هوش مصنوعی هستند که از هر برنامه دیگری دریافت می کنید (یعنی بسیار نزدیک اما کمی عجیب و غریب). اما آنها بسیار سریعتر به کاربر بازگردانده شدند، که اسنپ می گوید می تواند طیف وسیعی از مزایای را داشته باشد.
بهبود تجربه کاربری یکی از عوامل است، اما اسنپ همچنین خاطرنشان میکند که فرآیند جدید میتواند با محدود کردن اشتراکگذاری دادهها به اشخاص ثالث، بهبود حریم خصوصی را تسهیل کند و در عین حال هزینههای پردازش را برای توسعهدهندگان نیز کاهش دهد.
اگرچه تحقیقات اسنپ شامل چند ستاره است، از جمله مهمترین آنها این است که اکثر آزمایشات آن بر روی آیفون پرو 14 انجام شده است که به قول خود اسنپقدرت محاسباتی بیشتری نسبت به بسیاری از گوشی های دیگر دارد. به این ترتیب، احتمالاً این احتمال وجود دارد که چیزی کمتر از این بتواند این معیارهای سرعت را برآورده کند – اما همچنان احتمالاً سریعتر از سیستم های فعلی خواهد بود.
اسنپ در مقاله کامل خود در مورد این فرآیند، یک نمای کلی از «دود زدایی» به همراه معادلات ریاضی بسیار زیاد ارائه کرده است که می توانید آن را برای خودتان از اینجا دانلود کنید.
این یک آزمایش جالب است که به آینده هوش مصنوعی مولد نیز اشاره می کند، که در نهایت می تواند به نشانه های کاربر در زمان واقعی پاسخ دهد، که می تواند طیف وسیعی از گزینه های استفاده جدید را فعال کند، مانند ترجمه بلادرنگ، ایجاد پاسخگوی فزاینده، و بیشتر.