![تصویر-اتفاقیه-۱۴-مارس-۲۰۲۳-ساعت-۱-۱۳-۴۱-ظهر.jpg](https://static-lib.s3.amazonaws.com/cms/screenshot_2023_03_14_at_1_13_41_pm_da5958b43b.jpg)
قابلیت های پیشرفته ی ChatGPT، نظیر اصلاح کدها و نوشتن مقاله یا شوخی ، منجر به محبوبیت چشمگیر آن شده است. با وجود توانایی های این سامانه، کمک آن تا به حال تنها محدود به متن بوده است - اما این در حال تغییر است.
در روز سهشنبه، OpenAI مدل GPT-4 را معرفی کرد، یک مدل بزرگ چندحالته که ورودیهای متنی و تصویری را میپذیرد و خروجی متنی تولید میکند.
همچنین: چگونه می توان از ChatGPT به عنوان منبع و استناد استفاده کرد
تفاوت بین GPT-3.5 و GPT-4 در گفتگوی روزمره "ناچیز" خواهد بود. اما مدل جدید به لحاظ پایداری، خلاقیت و حتی هوش بسیار قدرتمندتر خواهد بود.
به گفته OpenAI، GPT-4 در بررسی شبیهسازی شدهای از آزمون مجازی نوشتاری، در ۱۰٪ برترترین نتایج دست یافت، در حالی که GPT-3.5 در ۱۰٪ پایینترین نتایج قرار گرفت. همچنین GPT-4 در سری آزمونهای بنچمارک بهتر از GPT-3.5 عمل کرد که در نمودار زیر قابل مشاهده است.
![تصویر اسکرینشات-۲۳/۰۳/۱۴-ساعت-۱:۴۰:۳۲ ب.ظ.jpg](https://static-lib.s3.amazonaws.com/cms/screenshot_2023_03_14_at_1_40_32_pm_c7577ae6e4.jpg)
برای توضیحات بیشتر، ChatGPT روی یک مدل زبانی تیون شده از مدل سری 3.5 اجرا میشود که محدودکننده چت بات را در خروجی متنی قرار میدهد.
اعلام GPT-4 از سوی OpenAI پس از سخنرانی آندرئاس براون، CTO مایکروسافت آلمان، هفته گذشته اتفاق افتاد که در آن او گفت که GPT-4 به زودی عرضه خواهد شد و امکان تولید متن به ویدیو را فراهم می کند.
همچنین: چگونه ChatGPT کار میکند؟
"هفته آینده ما GPT-4 را معرفی خواهیم کرد؛ در آنجا ما مدل های چند حالته ای را خواهیم داشت که امکانات کاملا متفاوتی را ارائه خواهند داد - به عنوان مثال، ویدیوها" گفته است برون به گزارش هایس، یک خبرگزاری آلمانی در رویداد.
با وجود اینکه GPT-4 چندحالتی است، ادعاهای یک مولد متن-ویدئو کمی بیمنطق بودند. این مدل هنوز نمیتواند به طور کامل ویدئو تولید کند، اما میتواند ورودیهای بصری را پذیرفته، که یک تغییر عمده نسبت به مدل قبلی است.
یکی از نمونه هایی که اپنایای در اینجا ارائه داد تا قابلیت اسکن تصویر توسط ChatGPT را نشان دهد، تلاش ChatGPT برای فهمیدن آنچه درباره عکس خنده دار بوده است، با توجه به ورودی کاربر است.
![تصویر-ابرنمای-2023-03-14-ساعت-1-36-02-ب-ظ](https://static-lib.s3.amazonaws.com/cms/screenshot_2023_03_14_at_1_36_02_pm_af3a113b01.jpg)
مثالهای دیگر شامل بارگذاری تصویری از یک نمودار و درخواست انجام محاسبات توسط GPT-4 یا بارگذاری یک کاربرد و درخواست حل سوالات از آن میشود.
همچنین: 5 راه که ChatGPT میتواند به شما در نوشتن مقاله کمک کند
OpenAI اعلام کرده است که قابلیت ورودی متنی GPT-4 را از طریق ChatGPT و API خود از طریق لیست انتظار عرضه خواهد کرد. برای قابلیت ورودی تصویر باید کمی صبر کنید زیرا OpenAI در حال همکاری با یک شریک واحد است تا به شروع آن برسد.
اگر شما از عدم وجود یک مولد متن به ویدئو ناراضی هستید، نگران نباشید، این یک مفهوم کاملاً جدید نیست. شرکتهای فناوری بزرگ مانند متا و گوگل در حال حاضر مدلهایی را در حال بررسی دارند. متا Make-A-Video و گوگل ایمیجن ویدئو را دارند، هر دوی اینها با استفاده از هوش مصنوعی ویدئو را از ورودی کاربر تولید میکنند.