GPT-4، برخی معتقدند که "سطح بعدی" و مخرب است، اما واقعیت چه خواهد بود؟
مدیرعامل سام التمان به سوالات درباره GPT-4 و آینده هوش مصنوعی پاسخ میدهد.
حقایقی که نشان میدهد GPT-4 یک هوش مصنوعی چندحالتی خواهد بود؟
در یک مصاحبه پادکست (هوش مصنوعی برای دوران بعد) از ۱۳ سپتامبر ۲۰۲۲، صمیم آلتمن، مدیرعامل OpenAI، درباره آینده نزدیک فناوری هوش مصنوعی بحث کرد.
از جمله چیزهای جالب، او گفت که مدل چند حالتی در آینده نزدیکی خواهد بود.
مولتیمدال به معنای توانایی عملکرد در چند حالت، مانند متن، تصاویر و صداها است.
OpenAI با انسان ها از طریق ورودی های متنی تعامل دارد. برخلاف Dall-E یا ChatGPT ، تنها یک تعامل متنی است.
یک هوش مصنوعی با قابلیتهای چندحالته میتواند از طریق گفتار تعامل داشته باشد. این هوش مصنوعی میتواند به دستورات گوش کرده و اطلاعاتی را ارائه یا یک وظیفه را انجام دهد.
التمان جزئیات مشوقی در مورد آنچه که به زودی انتظار داشته باشید ارائه داد:
« فکر میکنم به زودی ما مدلهای چندحالته خواهیم داشت و این چیزهای جدیدی ایجاد خواهد کرد. »
« باور میکنم مردم کارهای شگفتانگیزی را با مامورانی که میتوانند با کامپیوترها چیزها را برای شما انجام دهند و از برنامه ها استفاده کنند و از این ایده یک رابط زبانی که شما یک زبان طبیعی میگویید و عقب و جلو در این نوع گفتگو دارید ، کار خوبی انجام میدهند. »
« شما میتوانید به آن مراجعه و آن را بازنگری و بهبود بدهید و کامپیوتر فقط آنرا برای شما انجام میدهد. »
« در نسخه های اولیه DALL-E و CoPilot این اتفاق را میبینید. »
آلتمان بطور مشخص نگفت که GPT-4 چند حالته خواهد بود. اما او اشاره کرد که در مدت زمان کوتاهی آماده خواهد شد.
ویژگی جالب این است که او دستگاه های هوش مصنوعی چندحالته را به عنوان یک پلتفرم برای ساختن مدل های کسب و کار جدیدی که امروزه ممکن نیستند، تصور می کند.
او چندمودال نیروی هوش مصنوعی را با پلتفرم موبایل مقایسه کرد و نشان داد که چگونه این به هزاران فرصت و شغل جدید منجر شده است.
آلتمن گفت:
«... فکر میکنم که این یک روند بسیار بزرگ خواهد شد و کسب و کارهای بسیار بزرگی با این رابط ساخته خواهند شد و به طور کلی [فکر میکنم] که این مدلهای بسیار قدرتمند یکی از بسترهای فناوری جدید حقیقی خواهند بود که از زمان تلفن همراه به بعد نداشتهایم.
و همیشه پس از آن انفجاری از شرکتهای جدید ظهور میکند، پس برای همه خوب خواهد بود.»
وقتی درباره مرحله بعدی تکامل هوش مصنوعی سوال شد، او با ویژگیهایی که گفته بود یقینی هستند، پاسخ داد.
«فکر میکنم ما موفق خواهیم شد مدلهای چندحالتی واقعی را به کار ببندیم.
بنابراین نه فقط متن و تصاویر، بلکه هر حالتی که در یک مدل وجود دارد، قادر است به راحتی و به شکل همسیال بین موارد جابجا شود.»
مدلهای هوش مصنوعی که خود را بهبود میبخشند؟
چیزی که به آن به طور گستردهای پرداخت نمیشود این است که محققان هوش مصنوعی میخواهند یک هوش مصنوعی ایجاد کنند که بتواند به تنهایی یاد بگیرد.
این توانایی به طور خارج از دستیابی به فهم و ترجمه بین زبانها پدید میآید.
توانایی اتفاقی برای انجام کارها به اصطلاح واگشا خوانده میشود. هنگامی است که تواناییهای جدید از افزایش حجم دادههای آموزشی ظاهر میشوند.
اما هوش مصنوعی که خودش یاد میگیرد چیز دیگری است که وابسته به حجم بزرگ دادههای آموزشی نیست.
آنچه آلتمن توصیف می کند یک هوش مصنوعی است که در واقع یادگیری می کند و توانایی های خود را به طور خودکار بهبود می بخشد.
علاوه بر این، این نوع هوش مصنوعی فراتر از الگوی نسخهبندیهایی است که نرمافزارها به طور سنتی دنبال میکنند، جایی که یک شرکت نسخه 3 را عرضه کرده، نسخه 3.5 و غیره.
او یک مدل هوش مصنوعی را تصور میکند که آموزش میبیند و سپس به تنهایی یاد میگیرد و با رشد خود به یک نسخه بهبود یافته پیش میرود.
آلتمن اشارهای نکرد که GPT-4 این قابلیت را خواهد داشت.
او این را به عنوان چیزی که آنها به آن هدف دارند، اعلام کرد، به ظاهر یک چیزی که در حوزهٔ امکانات متمایز قرار دارد.
او یک هوش مصنوعی با قابلیت خودآموزی توضیح داد:
«فکر میکنم ما خواهیم داشت مدلهایی که به طور پیوسته یاد میگیرند.
بنابراین در حال حاضر، اگر از GPT هر چیزی استفاده کنید، در زمانی که آموزش دیده شده محصور است. و هر چه از آن استفاده بیشترو با آن کار کنید، بهتر نمیشود و تمام اینها.
فکر میکنم ما آن را تغییر خواهیم داد.
بنابراین من بسیار مشتاقانه منتظر همه اینها هستم.»
مشخص نیست که آلتمن در مورد هوش مصنوعی کلیه (AGI) صحبت میکند، اما کمی شبیه به آن به نظر میرسد.
التمان اخيراً نظرية وجود AGI لأوبن اي ای را رد کرد که بعداً در این مقاله نقل قول شد.
آلتمن توسط مصاحبهکننده به خوبی توضیح دادند که تمام ایدههایی که درباره آنها صحبت میکرد در واقع هدفها و سناریوهای قابل قبولی هستند و نه فقط نظراتی درباره آنچه که او میخواهد OpenAI انجام دهد.
مصاحبه کننده پرسید:
"یک چیزی که فکر میکنم مفید است به اشتراک گذاشته شود - زیرا مردم نمیفهمند که در واقع شما این پیشبینیهای قوی را از نقطه نظری کاملاً انتقادی میکنید، نه فقط "ما میتوانیم آن تپه را به دست آوریم"..."
التمان توضیح داد که همه ی این چیزهایی که او درباره آنها صحبت میکند پیش بینی هایی هستند که بر اساس تحقیقات به او اجازه میدهند یک مسیر قابل قبول برای انتخاب پروژه بزرگ بعدی را با اطمینان انتخاب کند.
او به اشتراک گذاشت:
"ما دوست داریم پیشبینیهایی بکنیم که بتوانیم در مقدمه باشیم و قانونهای مقیاسپذیری را درک کنیم (یا از پژوهشهایی که قبلاً انجام دادهایم) به طوری که بتوانیم بگوییم: 'خب، این چیز جدید کار خواهد کرد و از آن پیشبینیکردن خواهیم کرد.'
و اینکه چگونه ما سعی میکنیم OpenAI را اداره کنیم، این است که کار بعدی را که در مقابلمان است و مطمئنیم، انجام دهیم و 10٪ از شرکت را مختص کاوش تماماً آزاد کنیم، که منجر به پیروزیهای بزرگی شده است."
آیا OpenAI با GPT-4 میتواند به دستاوردهای جدید برسد؟
یکی از چیزهایی که برای رهبری اَپنایآی لازم است، پول و منابع محاسباتی عظیم است.
مایکروسافت تاکنون سه میلیارد دلار در اوپنایای سرازیر کرده است و به گزارش نیویورک تایمز، در مذاکرات برای سرمایهگذاری ۱۰ میلیارد دلار دیگر قرار دارد.
مطبوعات نیویورک تایمز گزارش کرد که انتظار می رود GPT-4 در فصل اول سال ۲۰۲۳ عرضه شود.
راهنمایی شد که GPT-4 ممکن است قابلیت های چندوجهی داشته باشد، با اقتباس از یک سرمایه گذار ریسک مشتریان به نام Matt McIlwain که درباره GPT-4 اطلاعاتی دارد.
تایمز گزارش کرده است:
"OpenAI در حال کار بر روی یک سیستم حتی قدرتمندتر به نام GPT-4 است که ممکن است در این سه ماهه عرضه شود"، بر اساس آقای مکایلوین و چهار نفر دیگری که اطلاعاتی درباره تلاش آنها دارند.
…ساخته شده با استفاده از شبکه بزرگ مایکروسافت برای مراکز داده کامپیوتری، گپبات جدید ممکن است یک سیستمی مانند چتجیپیتی باشد که صرفاً متن تولید میکند. یا ممکن است علاوه بر متن، تصاویر را نیز مدیریت کند.
برخی سرمایه گذاران ریسک و کارمندان مایکروسافت قبلاً این سرویس را در حال عمل مشاهده کردهاند.
اما OpenAI هنوز تصمیم نگرفته است که آیا سیستم جدید با قابلیت های مرتبط با تصاویر منتشر شود یا خیر."
پول دنباله میکند OpenAI
در حالی که اوپنآی مشخصاتی را با عموم جمعیت به اشتراک نگذاشته است، اما جزئیاتی را با جامعه سرمایهگذاری در حال به اشتراک گذاشتن بوده است.
در حال حاضر در مذاکرات است که ارزش شرکت را به ارزش ۲۹ میلیارد دلار برساند.
این یک دستاورد قابل توجه است زیرا حالا OpenAI در آمد قابل توجهی درآورد نمیکند و شرایط اقتصادی کنونی باعث کاهش ارزش شرکتهای فناوری بسیاری شده است.
مشاهدهگر گزارش کرد:
"شرکت های سرمایه گذاری ونچر کپیتال و فاندرز فاند از جمله سرمایه گذارانی هستند که علاقهمند به خرید کلیه سهام به ارزش ۳۰۰ میلیون دلاری OpenAI هستند. معامله به عنوان یک پیشنهاد تندر بنا شده است، به این معنی که سرمایه گذاران سهام را از سهامداران موجود، از جمله کارکنان خریداری می کنند."
ارزش بالای OpenAI میتواند به عنوان تاییدیه ای برای آینده فناوری در نظر گرفته شود، و آیندهای که در حال حاضر GPT-4 است.
سام آلتمن به سوالهای درباره GPT-4 پاسخ میدهد
سام آلتمن به تازگی برنامه StrictlyVC را مصاحبه کرده است ، جایی که او تأیید می کند که OpenAI در حال کار بر روی یک مدل ویدئویی است ، که به نظر بسیار شگفت انگیز می آید اما می تواند منجر به نتایج منفی جدی هم شود.
با اینکه گفته نشده بود که بخش ویدیو جزئی از GPT-4 باشد، اما چیزی که جالب و احتمالاً مربوط به آن بود، این بود که آلتمن تا زمان اطمینان از امنیت آن، از انتشار GPT-4 خودداری خواهد کرد.
قسمت مربوطه از مصاحبه در لحظه ۴:۳۷ دقیقه رخ میدهد:
راوی پرسید:
"آیا میتوانید نظری راجع به اینکه آیا GPT-4 در ربع اول یا نیمه اول سال منتشر میشود بیان کنید؟"
سام التماس پاسخ داد:
«این در نهایت در هنگامی که مطمئن شویم که میتوانیم آن را به صورت ایمن و مسئولانه انجام دهیم، به بیرون خواهد آمد.
به طور کلی فکر میکنم که ما فناوری را به طور آهستهتر از آنچه که مردم میپسندند، منتشر خواهیم کرد.
ما آن را بسیار بیشتر از آنچه که مردم میخواهند نگه میداریم.
و در نهایت مردم با رویکرد ما به این موضوع راضی خواهند شد.
اما در آن زمان متوجه شدم که مردم میخواهند اسباب بازی براق را داشته باشند و این امر سخت است و کاملاً درک میکنم.»
توییتر دست به دست هم میرسد با شایعاتی که دشوار است تأیید شوند. یکی از این شایعات تأیید نشدهای نیست که آن را مبنی بر داشتن 100 هزار بیلیون پارامتر (نسبت به 175 میلیارد پارامتر GPT-3) دارد.
این شایعه توسط سام آلتمن در برنامه مصاحبه StrictlyVC مورد رد پایی قرار گرفت، جایی که او همچنین گفت که OpenAI هوش مصنوعی عمومی (AGI) را ندارد، که توانایی یادگیری هرچیزی که انسان می تواند داشته باشد.
التمان توضیح داد:
“من این را در توییتر دیدم. این کاملاً سخنان بیمعنی است.
آسیاب شایعات GPT چیزی بسیار احمقانه است.
...مردم تقاضای ناامیدی میکنند و خواهند شد.
...ما یک AGI واقعی نداریم و فکر میکنم به خوبی این انتظار از ماست و بله... ما این افراد را ناامید خواهیم کرد."
شایعات زیاد، حقایق کم
دو واقعیت درباره GPT-4 که قابل اطمینان هستند این است که OpenAI تا حدی از GPT-4 پوشیده پروانه است به طوری که عموم درباره آن تقریباً هیچ چیز نمی دانند و دیگر اینکه OpenAI تا زمانی که مطمئن شود امن است، محصولی را رونمایی نخواهد کرد.
تا این لحظه، سخت است با اطمینان بگوییم چگونه GPT-4 خواهد بود و چه قابلیتهایی خواهد داشت.
اما یک توییت از نویسنده فناوری رابرت اسکوبل مدعی است که این امر به سطح بعدی می رود و یک اختلال است.
همچنین بخوانید: آیا هوش مصنوعی میتواند SEO را انجام دهد؟ آزمایش با GPT-3 از OpenAI