پیشرفت ۳ هوش مصنوعی بزرگ در تولید تصاویر

پیشرفت ۳ هوش مصنوعی بزرگ در تولید تصاویر

به گزارش آتی جو، مدتی است که با تصاویر تولیدشده توسط هوش مصنوعی زندگی می نماییم، اما این هفته، بعضی از بازیگران اصلی این حوزه، گامهای بزرگی رو به جلو برداشته اند. بطور دقیق تر در اینجا در مورد بروزرسانی های مهم میدجرنی(Midjourney)، مدل جدید گوگل و گروک(Grok) صحبت می نماییم.


به گزارش آتی جو به نقل از ایسنا، هر یک از شرکتها نشان می دهند که فناوری با سرعت و در جهات مختلف درحال تکامل است و هر شرکت نشان میدهد که پیشرفت ها تا کجا پیش رفته است.
به نقل از دیجیتال ترندز، با میدجرنی(Midjourney) شروع نماییم که بی سر و صدا یک ویرایشگر وب جدید را اواخر روز پنجشنبه منتشر نموده است که برخی از ابزارهای مفید دستکاری تصویر را در یک رابط کاربری جمع می کند.
قبل از این، عملکردهایی مانند قاب بندی مجدد، رنگ آمیزی مجدد گسترش مرزهای تصویر و تولید محتوا برای پر کردن آن و بزرگنمایی همگی نیاز به ابزار خاص خود داشتند و در چندین لیست قرار گرفته بودند و از سازندگان خواسته می شد که دائما بین این لیست ها جابه جا شوند. این رابط کاربری جدید پروسه ویرایش منسجم تر و ساده تری را ارائه می دهد.
بگفته دیوید هولز(David Holz)، مدیر عامل میدجرنی در دیسکورد، ویرایشگر وب جدید به شکلی طراحی شده است که ویرایش تصاویر تولید شده با هوش مصنوعی را آسان تر و بدون مشکل تر می کند. او نوشت: ما فکر می نماییم که این کار ویرایش تصاویر را بسیار آسان تر از قبل می کند و گام بزرگی رو به جلو است.
این شرکت همین طور ابزار گزینش جدیدی را معرفی کرده است که مانند یک قلمو دیجیتال کار می کند و جایگزین ابزار انتخاب مربعی و بیضی می شود.
ویرایشگر جدید برای همه کاربران میدجرنی که قبل از این بالاتر از ۱۰ تصویر روی پلت فرم ساخته اند، دردسترس است. واکنش های اولیه از طرف جامعه تا حد زیادی مثبت بوده است.
این ویرایشگر دو هفته بعد از انتشار میدجرنی ۶.۱ ارائه می شود که کیفیت و انسجام تصویر مانند تعداد صحیح انگشتان و همین طور زمان پردازش و درک دقت متن را بطور قابل توجهی بهبود بخشید.

گروک-۲(Grok-2) هیولا را آزاد می کند

بروزرسانی میدجرنی نیز تنها دو روز بعد از انتشار گروک-۲ توسط استارت آپ xAI ایلان ماسک ارائه می شود که اتفاق بزرگ بعدی این هفته است.
محبوبیت قابلیت های تولید تصویر گروک به سبب کیفیت تصویر چشم گیر و قابلیت استفاده رایگان، به سرعت درحال افزایش است.
بزرگترین بحث در مورد گروک-۲ فقط کیفیت آن نیست، بلکه دستورالعمل های ظاهرا تعریف نشده آنست. برخلاف خیلی از تولیدکننده های تصویر هوش مصنوعی، بنظر می رسد گروک-۲ از نظر دستورالعمل های مربوط به مالکیت معنوی، خشونت و سایر محتواها چیز کمی برای گفتن دارد.
مردم قبل از این محدودیت های آنرا آزمایش کرده اند و انواع تصاویر وحشتناک و عجیب و غریب را به وجود آورده اند که روزهای اولیه تولید تصویر هوش مصنوعی را تداعی می کند. اما اگر به سخنان ماسک اعتقاد دارید، فقدان دستورالعمل های گروک-۲ هدفمند بنظر می رسد و در نهایت می تواند به چگونگی تکامل این فناوری در آینده شکل دهد.

گوگل با ایمجن ۳(Imagen 3) خود وارد رقابت شد

در نهایت، گوگل مدل جدید هوش مصنوعی ایمجن ۳(3 Imagen) خودرا معرفی نمود که در روز پنجشنبه برای همه کاربران آمریکایی منتشر گردید. گوگل آنرا «با کیفیت ترین مدل تبدیل متن به تصویر» خود می نامد که حالا می تواند «جزئیات بهتر، نور غنی تر و مصنوعات کمتری نسبت به مدلهای قبلی» تولید نماید. گوگل همین طور می گوید که ایمجن ۳ در رندر کردن متن بهتر است و الان در نسخه های مختلفی ارائه می شود.


1403/05/28
10:34:31
5.0 / 5
210
تگهای خبر: آمریكا , آینده , استارت آپ , پلت فرم
این مطلب را می پسندید؟
(1)
(0)

تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب
لطفا شما هم نظر دهید
= ۲ بعلاوه ۱
لینک دوستان آتی جو
آتی جو