آتش بازی OpenAI: آموزش GPT-4 با استفاده از داده‌های مشتری API ندارد

تغییرات-حریم-خصوصی-ایپن‌ای-۶۴۵۷d3fd3d25f-sej-۷۶۰x۴۰۰.png

در یک تغییر قابل توجه از شیوه های قبلی خود، اوپن‌ای‌ای اعلام کرده است که دیگر از داده های مشتری ارسال شده از طریق رابط‌های برنامه نویسی اپلیکشن‌هایش برای آموزش مدل های گسترده زبانی خود، مانند چهارگانه GPT، استفاده نخواهد کرد.

تغییر توسط سام آلتمن، مدیرعامل اوپن‌آی. (OpenAI)، در یک مصاحبه اخیر با سی‌ان‌بی‌سی تایید شد.

رویکرد جدید OpenAI به داده های کاربر

تغییر در سیاست OpenAI در تاریخ 1 مارس 2023 اعمال شد. در این تاریخ، این شرکت به آرامی شرایط خدمات خود را بروزرسانی کرد تا این تعهد جدید خود در حفظ حریم خصوصی کاربران را نشان دهد.

التمان روشن کرد: "مشتریان به طور جدی نمی‌خواهند ما از داده‌هایشان برای آموزش استفاده کنیم، بنابراین برنامه‌های خود را تغییر داده‌ایم: این کار را انجام نخواهیم داد."

API ها یا رابط برنامه نویسی برنامه ریزی، چارچوب های فناوری هستند که به مشتریان اجازه می دهند به طور مستقیم به نرم افزار OpenAI متصل شوند.

آلتمن اعلام کرد که OpenAI برای آموزش مدل ها از داده های API استفاده نمی کند "به مدتی" ، که نشان می دهد که این اعلان رسمی یک روش موجود را شکل می دهد.

تبعات برای مشتریان تجاری

حرکت OpenAI پیامدهای گسترده‌ای دارد، به ویژه برای مشتریان تجاری آن که شامل شرکت‌های بزرگی مانند مایکروسافت، سیلزفورس و اسنپچت هستند.

این شرکت‌ها احتمالاً از قابلیت‌های واسط برنامه‌نویسی اپن‌ای‌آی استفاده بیشتری در عملیات خود بهره‌مند می‌شوند، بنابراین تغییرات مربوط به حفظ حریم خصوصی و محافظت از داده‌ها به ویژه برای آن‌ها مهم است.

با این حال، تدابیر جدید محافظت از داده ها فقط برای مشتریانی که از خدمات API شرکت استفاده می کنند اعمال می شود. در توسعه ترم های خدمات به روز شده OpenAI آمده است: "ممکن است از محتوا از خدمات دیگر به جز API ما استفاده کنیم."

بنابراین، سایر اشکال ورودی داده مانند متن وارد شده به چت‌بات معروف ChatGPT هنوز هم می‌تواند توسط OpenAI استفاده شود، مگر اینکه اطلاعات از طریق واسط برنامه‌نویسی اپلیکیشن (API) به اشتراک گذاشته شود.

تأثیر گسترده‌تر در صنعت

تغییر سیاست OpenAI در هنگامی روی می‌دهد که صنایع با تاثیرات پتانسیلی از مدل‌های زبانی بزرگ، مانند ChatGPT شرکت OpenAI، در جایگزینی محتواهایی که به طور سنتی توسط انسان‌ها ایجاد شده‌اند، دست و پنجه نرم می‌کنند.

به عنوان مثال، اتحادیه نویسندگان آمریکا اخیراً پس از شکست مذاکرات بین اتحادیه و استودیوهای سینمایی، اعتصاب را آغاز کرد. این اتحادیه تاکنون برای محدودیت استفاده از ChatGPT از OpenAI برای تولید یا بازنویسی اسکریپت، پشتیبانی می‌کرده است.

تصمیم شرکت OpenAI برای عدم استفاده از داده‌های مشتریان برای آموزش، لحظه‌ای بحرانی را در گفتگوی مداوم درباره حریم خصوصی داده و هوش مصنوعی مشخص می‌کند. همانطور که شرکت‌ها ادامه می‌دهند تا در گسترش و پیشرفت فناوری هوش مصنوعی تلاش کنند، تأمین حریم خصوصی کاربران و حفظ اعتماد احتمالاً همچنان در مرکز این بحث‌ها قرار خواهد گرفت.

تکامل چت‌جیپی‌تی: از GPT-3 به GPT-4

مهم است به یاد داشته باشید که تعهد OpenAI برای عدم استفاده از داده‌های مشتری برای آموزش، برای مدل زبانی جدیدتر GPT-4 که در تاریخ 14 مارس 2023 منتشر شده است، اعمال می‌شود.

GPT-4 پیشرفت‌های متعددی نسبت به نسخه قبلی خود، یعنی GPT-3، به همراه داشت، از جمله افزایش قابل توجه در اندازه محدودیت تعداد کلمات (به طور مقایسه با محدودیت ۳,۰۰۰ کلمه در ChatGPT به ۲۵,۰۰۰ کلمه)، افزایش در اندازه پنجره متناسب با متن، و بهبود قابلیتهای استدلال و فهم.

یک ویژگی قابل ذکر دیگر در GPT-4 قابلیت چند صورتی آن است، یعنی توانایی درک و استنتاج اطلاعات از تصاویر علاوه بر متن. این مدل جدیدتر متن‌هایی مانند انسان تر تولید می‌کند، از ویژگی‌هایی مانند ایموجی‌ها برای ایجاد یک احساس شخصی‌تر استفاده می‌کند.

با این حال، سایز و معماری دقیق GPT-4 هنوز آشکار نشده است و این باعث تامل درباره جزئیات مدل می‌شود.

با وجود این شایعات، مدیر عامل OpenAI ادعاهای خاص درباره اندازه مدل را رد کرده است.

درباره عملکرد، GPT-4 در تولید متن نقاط قوتی را نشان داده است اما همچنین محدودیت‌هایی نیز دارد. به عنوان مثال، در امتحان نوشتاری دانشگاهی (GRE) در درجهٔ 54 قرار گرفت و در امتحان محاسباتی پیشرفتهٔ AP Calculus BC در درجهٔ 43 - 59 عملکرد داشت.

علاوه بر این، این عملکرد خوبی در وظایف کد نویسی آسان لیتکود داشت، اما با افزایش سختی وظایف عملکرد آن کاهش یافت.

اگرچه جزئیات فرآیند آموزش GPT-4 به طور رسمی مستند نشده است، اما معروف است که مدل‌های GPT به طور کلی شامل یادگیری ماشین در مقیاس بزرگ با مجموعه‌ای گسترده از متن‌های اینترنتی هستند.

به آینده نگاه کنید

به علت تغییرات در سیاست استفاده از داده‌های OpenAI، داده های استفاده شده برای آموزش مدل های زبانی آن شامل اطلاعاتی که از طریق رابط برنامه نویسی (API) به اشتراک گذاشته نشده است، مگر اینکه کاربران به طور صریح با اهداف این آموزش این اطلاعات را ارسال نمایند.

با پیشرفت این فناوری و نقش مهمتری که در زندگی ما ایفا می‌کند، جالب است که چگونه شرکت‌ها برای مقابله با نگرانی‌های مربوط به حفظ اطلاعات شخصی و به دست آوردن اعتماد مردم، جهت تغییر و پاسخگویی به آنها عمل می‌کنند.

دورانبزرگی نسبی OpenAI: آموزش GPT-4 بر داده های مشتری API صورت نمی‌گیرد

رویکرد جدید OpenAI به داده های کاربر

تبعات برای مشتریان تجاری

تأثیر گسترده‌تر در صنعت

تکامل چت‌جیپی‌تی: از GPT-3 به GPT-4

به آینده نگاه کنید

مقالات مرتبط