در حالی که ممکن است هنوز در زمینه هوش مصنوعی مولد پیشتاز هزینه عمومی نباشد، متا در حال توسعه طیف وسیعی از گزینههای ایجاد هوش مصنوعی است که سالها روی آنها کار میکرد، اما اکنون به دنبال انتشار بیشتر تحقیقات خود برای مصرف عمومی است.
این به دلیل علاقه ناگهانی به ابزارهای هوش مصنوعی مولد است، اما متا مدتی است که این ابزارها را توسعه داده است، حتی اگر با برنامه راه اندازی جدیدتر خود تا حدودی واکنش نشان دهد.
آخرین مقاله هوش مصنوعی مولد متا به فرآیند جدیدی نگاه می کند که آن را ” می نامد.معماری پیشگویانه تعبیه مشترک تصویر‘ (I-JEPA)، که مدلسازی بصری پیشبینیکننده را ممکن میسازد، بر اساس درک وسیعتر از یک تصویر، برخلاف تطبیق پیکسل.

بخشهای درون جعبههای آبی در اینجا خروجیهای سیستم I-JEPA را نشان میدهند و نشان میدهند که چگونه درک متنی بهتری از شکل ظاهری تصاویر براساس ورودیهای کسری ایجاد میکند.
که تا حدودی شبیه ابزارهای «خارجی» است که در دیگر ابزارهای هوش مصنوعی مولد ظاهر شدهاند، مانند مثال زیر از DALL-E، که کاربران را قادر میسازد تا همه پسزمینههای جدید را بر اساس نشانههای موجود بسازند.

تفاوت در رویکرد متا این است که مبتنی بر یادگیری ماشین واقعی از زمینه است، که فرآیندی پیشرفتهتر است که تفکر انسان را شبیهسازی میکند، برخلاف تطبیق آماری.
همانطور که متا توضیح داد:
“کار ما بر روی I-JEPA (و مدلهای معماری پیشگویانه تعبیه شده مشترک (JEPA) به طور کلی) مبتنی بر این واقعیت است که انسانها مقدار زیادی دانش پسزمینه درباره جهان را فقط با مشاهده غیرفعال آن میآموزند. این فرضیه وجود دارد که این اطلاعات عقل سلیم کلیدی برای فعال کردن رفتار هوشمندانه مانند کسب نمونه کارآمد از مفاهیم جدید، زمینه سازی و برنامه ریزی است.
کار در اینجا، با تحقیق از دانشمند ارشد هوش مصنوعی متا هدایت می شود یان لکون، گام دیگری به سوی شبیه سازی پاسخ های بیشتر شبیه انسان در برنامه های کاربردی هوش مصنوعی است، که گذرگاه مرزی واقعی است که می تواند ابزارهای هوش مصنوعی را به مرحله بعدی برساند.
اگر بتوان به ماشینها یاد داد که فکر کنند، برخلاف حدس زدن صرفاً بر اساس احتمال، هوش مصنوعی مولد زندگی خودش را خواهد گرفت. چیزی که برخی افراد را به وحشت می اندازد، اما می تواند به استفاده های جدید برای چنین سیستم هایی منجر شود.
“ایده پشت I-JEPA پیش بینی اطلاعات از دست رفته در یک نمایش انتزاعی است که بیشتر شبیه به درک عمومی افراد است. در مقایسه با روشهای تولیدی که در فضای پیکسل/توکن پیشبینی میکنند، I-JEPA از اهداف پیشبینی انتزاعی استفاده میکند که جزئیات غیرضروری در سطح پیکسل به طور بالقوه حذف میشوند، در نتیجه مدل را به یادگیری ویژگیهای معنایی بیشتر سوق میدهد.
این جدیدترین ابزار هوش مصنوعی متا است که اکنون شامل تولید متن، ابزارهای ویرایش بصری، یادگیری چندوجهی، تولید موسیقی و غیره میشود. هنوز همه اینها در دسترس کاربران قرار نگرفته است، اما پیشرفتهای مختلف، کار مداوم متا در این زمینه را برجسته میکند، که با ورود سایر سیستمهای هوش مصنوعی مولد به بازار مصرف، تمرکز بیشتری پیدا کرده است.
مجدداً، متا ممکن است به نظر برسد که در حال بازی کردن است، اما مانند گوگل، در واقع در این زمینه به خوبی پیشرفته است و در موقعیت مناسبی قرار دارد تا ابزارهای هوش مصنوعی جدیدی را عرضه کند که سیستمهایش را در طول زمان بهبود بخشد.
این فقط محتاط تر است – که با توجه به نگرانی های مختلف در مورد سیستم های هوش مصنوعی مولد و اطلاعات غلط و اشتباهاتی که چنین ابزارهایی اکنون به صورت آنلاین منتشر می شوند، می تواند چیز خوبی باشد.
در اینجا می توانید اطلاعات بیشتری در مورد پروژه I-JEPA متا بخوانید.