گی پی تی-۴ فاش شد: بهبود بزرگ بعدی ChatGPT اینجاست

تصویر-اتفاقیه-۱۴-مارس-۲۰۲۳-ساعت-۱-۱۳-۴۱-ظهر.jpg

قابلیت های پیشرفته ی ChatGPT، نظیر اصلاح کدها و نوشتن مقاله یا شوخی ، منجر به محبوبیت چشمگیر آن شده است. با وجود توانایی های این سامانه، کمک آن تا به حال تنها محدود به متن بوده است - اما این در حال تغییر است.

در روز سه‌شنبه، OpenAI مدل GPT-4 را معرفی کرد، یک مدل بزرگ چندحالته که ورودی‌های متنی و تصویری را می‌پذیرد و خروجی متنی تولید می‌کند.

همچنین: چگونه می توان از ChatGPT به عنوان منبع و استناد استفاده کرد

تفاوت بین GPT-3.5 و GPT-4 در گفتگوی روزمره "ناچیز" خواهد بود. اما مدل جدید به لحاظ پایداری، خلاقیت و حتی هوش بسیار قدرتمندتر خواهد بود.

به گفته OpenAI، GPT-4 در بررسی شبیه‌سازی شده‌ای از آزمون مجازی نوشتاری، در ۱۰٪ برتر‌ترین نتایج دست یافت، در حالی که GPT-3.5 در ۱۰٪ پایین‌ترین نتایج قرار گرفت. همچنین GPT-4 در سری آزمون‌های بنچمارک بهتر از GPT-3.5 عمل کرد که در نمودار زیر قابل مشاهده است.

تصویر اسکرین‌شات-۲۳/۰۳/۱۴-ساعت-۱:۴۰:۳۲ ب.ظ.jpg

برای توضیحات بیشتر، ChatGPT روی یک مدل زبانی تیون شده از مدل سری 3.5 اجرا می‌شود که محدودکننده چت بات را در خروجی متنی قرار می‌دهد.

اعلام GPT-4 از سوی OpenAI پس از سخنرانی آندرئاس براون، CTO مایکروسافت آلمان، هفته گذشته اتفاق افتاد که در آن او گفت که GPT-4 به زودی عرضه خواهد شد و امکان تولید متن به ویدیو را فراهم می کند.

همچنین: چگونه ChatGPT کار می‌کند؟

"هفته آینده ما GPT-4 را معرفی خواهیم کرد؛ در آنجا ما مدل های چند حالته ای را خواهیم داشت که امکانات کاملا متفاوتی را ارائه خواهند داد - به عنوان مثال، ویدیوها" گفته است برون به گزارش هایس، یک خبرگزاری آلمانی در رویداد.

با وجود اینکه GPT-4 چندحالتی است، ادعاهای یک مولد متن-ویدئو کمی بی‌منطق بودند. این مدل هنوز نمی‌تواند به طور کامل ویدئو تولید کند، اما می‌تواند ورودی‌های بصری را پذیرفته، که یک تغییر عمده نسبت به مدل قبلی است.

یکی از نمونه هایی که اپن‌ای‌ای در اینجا ارائه داد تا قابلیت اسکن تصویر توسط ChatGPT را نشان دهد، تلاش ChatGPT برای فهمیدن آنچه درباره عکس خنده دار بوده است، با توجه به ورودی کاربر است.

تصویر-ابرنمای-2023-03-14-ساعت-1-36-02-ب-ظ

مثال‌های دیگر شامل بارگذاری تصویری از یک نمودار و درخواست انجام محاسبات توسط GPT-4 یا بارگذاری یک کاربرد و درخواست حل سوالات از آن می‌شود.

همچنین: 5 راه که ChatGPT می‌تواند به شما در نوشتن مقاله کمک کند

OpenAI اعلام کرده است که قابلیت ورودی متنی GPT-4 را از طریق ChatGPT و API خود از طریق لیست انتظار عرضه خواهد کرد. برای قابلیت ورودی تصویر باید کمی صبر کنید زیرا OpenAI در حال همکاری با یک شریک واحد است تا به شروع آن برسد.

اگر شما از عدم وجود یک مولد متن به ویدئو ناراضی هستید، نگران نباشید، این یک مفهوم کاملاً جدید نیست. شرکت‌های فناوری بزرگ مانند متا و گوگل در حال حاضر مدل‌هایی را در حال بررسی دارند. متا Make-A-Video و گوگل ایمیجن ویدئو را دارند، هر دوی اینها با استفاده از هوش مصنوعی ویدئو را از ورودی کاربر تولید می‌کنند.

GPT-4 معرفی شد: بهبود بزرگ بعدی ChatGPT در اینجاست

مقالات مرتبط