ChatGPT چگونه کار می کند؟

ChatGPT یکی از درخشان‌ترین ابزارهای جدید مبتنی بر هوش مصنوعی است، اما الگوریتم‌هایی که در پس‌زمینه کار می‌کنند در واقع از سال 2020 طیف وسیعی از برنامه‌ها و سرویس‌ها را تامین می‌کنند. بنابراین برای درک نحوه عملکرد ChatGPT، باید با صحبت در مورد زبان اصلی شروع کنیم. موتوری که به آن نیرو می دهد

GPT در ChatGPT بیشتر GPT-3 یا Generative Pre-trained Transformer 3 است، اگرچه GPT-4 اکنون برای مشترکین ChatGPT Plus در دسترس است — و احتمالاً به زودی گسترده تر خواهد شد. مدل‌های GPT توسط OpenAI (شرکت سازنده ChatGPT و تولیدکننده تصویر DALL·E 2) توسعه یافته‌اند، اما همه چیز را از ویژگی‌های هوش مصنوعی Bing گرفته تا ابزارهای نوشتن مانند Jasper و Copy.ai را تامین می‌کنند. در واقع، اکثر تولیدکنندگان متن هوش مصنوعی موجود در حال حاضر از GPT-3 استفاده می کنند و احتمالاً GPT-4 را به عنوان مرحله بعدی ارائه خواهند کرد.

ChatGPT GPT-3 را در کانون توجه قرار داد زیرا فرآیند تعامل با یک تولید کننده متن هوش مصنوعی را ساده و مهمتر از همه رایگان برای همه کرد. به علاوه، این یک ربات چت است و مردم از زمان SmarterChild عاشق یک چت بات خوب بوده اند.

در حالی که GPT-3 و GPT-4 محبوب ترین مدل های زبان بزرگ (LLM) در حال حاضر هستند، در چند سال آینده، احتمالا رقابت بسیار بیشتری وجود خواهد داشت. به عنوان مثال، گوگل Bard - ربات چت هوش مصنوعی خود - را دارد که توسط موتور زبان خود Pathways Language Model (PaLM 2) پشتیبانی می‌شود. اما در حال حاضر، پیشنهاد OpenAI استاندارد صنعت واقعی است. این ساده‌ترین ابزاری است که افراد می‌توانند به آن دست پیدا کنند.

بنابراین پاسخ به "چطور ChatGPT کار می کند؟" اساساً عبارتند از: GPT-3 و GPT-4. اما بیایید کمی عمیق تر کاوش کنیم.

ChatGPT چیست؟

ChatGPT یک برنامه ساخته شده توسط OpenAI است. با استفاده از مدل‌های زبان GPT، می‌تواند به سؤالات شما پاسخ دهد، کپی بنویسد، ایمیل‌ها را پیش‌نویس کند، مکالمه داشته باشد، کدها را به زبان‌های برنامه‌نویسی مختلف توضیح دهد، زبان طبیعی را به کد ترجمه کند، و موارد دیگر – یا حداقل تلاش کند – همه بر اساس زبان طبیعی. از شما می خواهد که آن را تغذیه کنید. این یک ربات چت است، اما یک ربات واقعا، واقعا خوب.

در حالی که اگر می‌خواهید مثلاً یک غزل شکسپیر در مورد حیوان خانگی خود بنویسید یا چند ایده برای خطوط موضوعی برخی از ایمیل‌های بازاریابی دارید، بازی کردن با آن جالب است، اما برای OpenAI نیز خوب است. این راهی برای دریافت داده‌های زیادی از کاربران واقعی است و به عنوان یک نسخه نمایشی فانتزی برای قدرت GPT عمل می‌کند، که در غیر این صورت ممکن است کمی مبهم به نظر برسد، مگر اینکه عمیقاً در یادگیری ماشین باشید.

در حال حاضر، ChatGPT دو مدل GPT ارائه می دهد. پیش فرض، GPT-3.5، قدرت کمتری دارد اما به صورت رایگان در دسترس همه است. GPT-4 پیشرفته تر به مشترکین ChatGPT Plus محدود می شود و حتی آنها هر روز فقط تعداد محدودی سؤال دریافت می کنند.

یکی از ویژگی‌های بزرگ ChatGPT این است که می‌تواند مکالمه‌ای که با آن دارید را به خاطر بسپارد. این بدان معناست که می‌تواند زمینه را از هر آنچه قبلاً از آن خواسته‌اید جمع‌آوری کند و سپس از آن برای اطلاع‌رسانی به مکالمه‌اش با شما استفاده کند. همچنین می‌توانید درخواست اصلاحات و اصلاحات کنید، و به هر آنچه قبلاً در مورد آن صحبت می‌کردید اشاره می‌کند. این باعث می شود که تعامل با هوش مصنوعی مانند یک رفت و برگشت واقعی باشد.

اگر می‌خواهید واقعاً احساسی نسبت به آن داشته باشید، بروید و اکنون پنج دقیقه با ChatGPT بازی کنید (رایگان است!)، و سپس برای مطالعه نحوه عملکرد آن برگردید.

ChatGPT چگونه کار می کند؟

این مجموعه داده عظیم برای تشکیل یک شبکه عصبی یادگیری عمیق [ ... ] که از مغز انسان مدل شده استفاده شد - که به ChatGPT اجازه داد تا الگوها و روابط را در داده های متنی بیاموزد [ ... ] و پیش بینی کند چه متنی باید در هر جمله داده شده بعدی بیاید. .

ChatGPT با تلاش برای درک پیام شما و سپس بیرون ریختن رشته‌هایی از کلماتی که پیش‌بینی می‌کند بهترین پاسخ به سؤال شما را بر اساس داده‌هایی که روی آن آموزش داده شده است، کار می‌کند.

بیایید در واقع در مورد آن آموزش صحبت کنیم. این فرآیندی است که در آن به هوش مصنوعی نوپا برخی از قوانین اساسی داده می‌شود، و سپس یا در موقعیت‌هایی قرار می‌گیرد یا داده‌های زیادی برای کار به منظور توسعه الگوریتم‌های خود داده می‌شود.

GPT-3 بر روی تقریباً 500 میلیارد «توکن» آموزش داده شد، که به مدل‌های زبانی آن اجازه می‌دهد تا به راحتی معنا را تعیین کنند و متن بعدی قابل قبول را پیش‌بینی کنند. بسیاری از کلمات به نشانه‌های منفرد نگاشت می‌شوند، اگرچه کلمات طولانی‌تر یا پیچیده‌تر اغلب به چندین نشانه تقسیم می‌شوند. به طور متوسط، توکن‌ها تقریباً چهار کاراکتر دارند. OpenAI درباره عملکرد درونی GPT-4 سکوت کرده است، اما می‌توانیم با خیال راحت فرض کنیم که این مجموعه بر روی همان مجموعه داده آموزش داده شده است زیرا حتی قدرتمندتر است.

تمام توکن ها از مجموعه عظیمی از داده های نوشته شده توسط انسان ها به دست آمده اند. این شامل کتاب‌ها، مقاله‌ها و سایر اسناد در تمام موضوعات، سبک‌ها و ژانرهای مختلف و مقدار باورنکردنی محتوایی است که از اینترنت باز حذف شده است. اساساً اجازه داده شد که از مجموع دانش بشری خرد شود.

این مجموعه داده عظیم برای تشکیل یک شبکه عصبی یادگیری عمیق - یک الگوریتم پیچیده، چند لایه و وزن‌دار که از مغز انسان مدل‌سازی شده است - استفاده شد که به ChatGPT اجازه داد الگوها و روابط را در داده‌های متنی بیاموزد و از توانایی ایجاد انسان‌مانند استفاده کند. پاسخ ها را با پیش بینی اینکه چه متنی باید در هر جمله داده شده بعدی بیاید.

اگرچه واقعاً، این امر به میزان قابل توجهی باعث کم فروشی چیزها می شود. ChatGPT در سطح جمله کار نمی کند - در عوض، متنی از کلمات، جملات، و حتی پاراگراف ها یا بند ها را تولید می کند. این متن پیشگویانه روی تلفن شما نیست که صراحتاً کلمه بعدی را حدس می‌زند. تلاش برای ایجاد پاسخ های کاملاً منسجم به هر درخواستی است.

برای اصلاح بیشتر توانایی ChatGPT برای پاسخ به انواع درخواست های مختلف، برای گفتگو با تکنیکی به نام یادگیری تقویتی با بازخورد انسانی (RLHF) بهینه شد. اساساً، انسان ها یک مدل پاداش با داده های مقایسه ای ایجاد کردند (که در آن دو یا چند پاسخ مدل توسط مربیان هوش مصنوعی رتبه بندی شدند)، بنابراین هوش مصنوعی می توانست یاد بگیرد که بهترین پاسخ کدام است.

بازگشت به شبکه عصبی که تشکیل داد. بر اساس تمام آن آموزش‌ها، شبکه عصبی GPT-3 دارای 175 میلیارد پارامتر یا متغیر است که به آن اجازه می‌دهد یک ورودی - درخواست شما - و سپس، بر اساس مقادیر و وزن‌هایی که به پارامترهای مختلف می‌دهد (و مقدار کمی تصادفی) دریافت کند. )، هر آنچه را که فکر می کند با درخواست شما منطبق است را خروجی می دهد. OpenAI نگفته است که GPT-4 چند پارامتر دارد، اما می توان حدس زد که بیش از 175 میلیارد و کمتر از 100 تریلیون پارامتری است که زمانی شایعه شده بود. صرف نظر از تعداد دقیق، پارامترهای بیشتر به طور خودکار به معنای بهتر نیست. برخی از افزایش قدرت GPT-4 احتمالاً ناشی از داشتن پارامترهای بیشتر از GPT-3 است، اما بسیاری از موارد احتمالاً به بهبود نحوه آموزش آن بستگی دارد.

در پایان، ساده ترین راه برای تصور آن مانند یکی از آن بازی های "جمله را تمام کن" است که در کودکی انجام داده اید.

در پایان، ساده ترین راه برای تصور آن مانند یکی از آن بازی های "جمله را تمام کن" است که در کودکی انجام داده اید. به عنوان مثال، وقتی به ChatGPT با استفاده از GPT-3 دستور دادم، "Zapier is…" پاسخ داد و گفت:

Zapier یک ابزار اتوماسیون مبتنی بر وب است که به کاربران اجازه می‌دهد تا برنامه‌های وب مختلف را به یکدیگر متصل کنند تا کارهای تکراری را خودکار کرده و گردش کار را بهبود بخشد.

این جمله‌ای است که می‌توانید در صدها مقاله در توصیف کارهای زاپیر پیدا کنید. اما وقتی ویرایشگر من همان دستور را داد، گفت:

Zapier یک ابزار اتوماسیون مبتنی بر وب است که به کاربران اجازه می‌دهد تا برنامه‌های وب مختلف را به هم متصل کرده و گردش کار بین آنها را خودکار کنند.

این تقریباً شبیه است، اما دقیقاً همان پاسخ نیست. این تصادفی بودن (که می‌توانید در برخی از برنامه‌های GPT-3 با تنظیمی به نام «دما» کنترل کنید) تضمین می‌کند که ChatGPT فقط به تک تک پاسخ‌ها با همان پاسخ سهام پاسخ نمی‌دهد. هر بار هر فرمان را در کل شبکه عصبی اجرا می کند، و چند تاس را اینجا و آنجا می اندازد تا همه چیز را تازه نگه دارد. به احتمال زیاد نمی توان ادعا کرد که Zapier رنگی از مریخ است، اما کلمات زیر را بر اساس احتمال نسبی آنها مخلوط می کند.

(در هنگام اجرا بر روی GPT-4، ChatGPT گفت: " Zapier یک ابزار اتوماسیون مبتنی بر وب است که به کاربران اجازه می دهد وظایف را بین برنامه ها و سرویس های آنلاین مختلف یکپارچه و خودکار کنند."

تف کردن کلمات، نه دانش

سازندگان ChatGPT اولین کسانی هستند که می‌گویند می‌تواند اطلاعات نادرست (و احتمالاً مضر) تولید کند، اگرچه سخت برای رفع آن تلاش می‌کنند.

در اینجا یک مثال رام است. وقتی از ChatGPT با استفاده از GPT-3 و GPT-4 خواستم به "هری گینس است..." پاسخ دهد، GPT-3 ابتدا با پرسیدن کدام هری گینس پاسخ داد. سوال عالی - ما به معنای واقعی کلمه دو نفر هستیم! بنابراین من گفتم: "هری گینس نویسنده" (این من هستم). GPT-4 بلافاصله حدس زد که من کی هستم، اگرچه هر دو پاسخ جذاب بودند:

GPT-3: هری گینس نویسنده و روزنامه نگار مستقل مقیم ایرلند است. او برای نشریات مختلفی از جمله نیویورک تایمز، گاردین، هافینگتون پست و Popular Mechanics نوشته است. او موضوعاتی از فناوری و عکاسی گرفته تا سفر و فرهنگ را پوشش می دهد.

GPT-4: هری گینس نویسنده، عکاس و متخصص فناوری ایرلندی است. او برای نشریات مختلفی از جمله How-To Geek، Lifehacker و Tuts+ نوشته است. کار او در درجه اول بر فناوری، آموزش ها و نکات و همچنین عکاسی و ویرایش تصویر متمرکز است. گینس برای ایجاد راهنماهای دقیق که به خوانندگان کمک می کند موضوعات پیچیده را درک کنند یا مشکلات را به روشی ساده حل کنند، شهرت دارد.

اولین و آخرین خط GPT-3 تقریباً به کلمه از وب سایت های مختلف و بیوگرافی نویسنده من در سراسر وب استخراج می شود (اگرچه من معمولاً خودم را به عنوان یک نویسنده و عکاس آزاد و نه یک روزنامه نگار معرفی می کنم). اما فهرست نشریات اساسا ساخته شده است. من برای نیویورک تایمز نوشته ام، اما نه برای گاردین ، هافینگتون پست ، یا Popular Mechanics (من به طور منظم برای Popular Science می نویسم، بنابراین ممکن است از آنجا آمده باشد).

GPT-4 بخش عکاسی را به درستی دریافت می کند و در واقع برخی از نشریات را که برای آنها نوشته ام فهرست می کند، که بسیار چشمگیر است، اگرچه آنها کسانی نیستند که من به آنها افتخار می کنم. این یک مثال عالی از این است که چگونه OpenAI توانسته است دقت GPT-4 را نسبت به GPT-3 افزایش دهد، اگرچه ممکن است همیشه صحیح ترین پاسخ را ارائه ندهد.

اما بیایید به GPT-3 برگردیم زیرا خطای آن مثال جالبی از آنچه در پشت صحنه در ChatGPT می گذرد را ارائه می دهد. در واقع چیزی در مورد من نمی داند. حتی کپی/پیست کردن از اینترنت و اعتماد به منبع اطلاعات نیست. در عوض، صرفاً یک رشته از کلمات را پیش‌بینی می‌کند که بر اساس میلیاردها نقطه داده‌ای که دارد، بعدی خواهند آمد.

به عنوان مثال: نیویورک تایمز بسیار بیشتر با The Guardian و The Huffington Post گروه بندی می شود تا با مکان هایی که من برای آنها نوشته ام، مانند Wired ، Outside ، The Irish Times ، و البته Zapier. بنابراین وقتی باید مشخص کند که چه چیزی باید از نیویورک تایمز دنبال شود، از اطلاعات منتشر شده درباره من استفاده نمی کند. لیستی از نشریات بزرگ را از تمام داده های آموزشی که دارد استخراج می کند. این بسیار هوشمندانه است و قابل قبول به نظر می رسد، اما این واقعیت ندارد.

GPT-4 کار بسیار بهتری انجام می دهد و نشریات را میخکوب می کند، اما بقیه چیزهایی که می گوید واقعاً شبیه جملات بعدی قابل قبول است. فکر نمی‌کنم قدردانی زیادی برای شهرت من داشته باشد: این فقط همان چیزی است که یک بیو می‌گوید. در پنهان کردن نحوه عملکرد آن بسیار بهتر از GPT-3 است، اگرچه در واقع از همان تکنیک استفاده می کند.

با این حال، بسیار چشمگیر است که چقدر GPT قبلاً بهبود یافته است. در حال حاضر، GPT-4 پشت یک اشتراک ممتاز قفل شده است، بنابراین بیشتر محتوای ChatGPT که می بینید به GPT-3 متکی هستند، اما ممکن است در مدت زمان آینده تغییر کند. چه کسی می داند GPT-5 چه چیزی را به ارمغان خواهد آورد.

ChatGPT API چیست؟

OpenAI با فناوری خود نگرش فقط ما را ندارد. این شرکت دارای یک پلت فرم API است که به توسعه دهندگان اجازه می دهد تا قدرت ChatGPT را در برنامه ها و سرویس های خود ادغام کنند (البته با قیمتی).

Zapier از ChatGPT API برای تقویت یکپارچه سازی ChatGPT خود استفاده می کند، که به شما امکان می دهد ChatGPT را به هزاران برنامه دیگر متصل کنید و هوش مصنوعی را به جریان های کاری حیاتی کسب و کار خود اضافه کنید. در اینجا چند مثال برای شروع شما آورده شده است، اما می توانید ChatGPT را اساساً از هر برنامه ای فعال کنید.

همچنین می‌توانید از مدل‌های دیگر OpenAI مانند DALL·E و Whisper با ادغام OpenAI Zapier استفاده کنید. گردش‌های کاری را که شامل تولید تصویر و رونویسی صدا می‌شود، مستقیماً از برنامه‌هایی که قبلاً استفاده می‌کنید، خودکار کنید.

مطالب مرتبط: چگونه می توانید (و زمانی که نباید) از ChatGPT برای نوشتن کپی بازاریابی استفاده کنید

ChatGPT چگونه کار می کند؟

ChatGPT چیست؟

ChatGPT چگونه کار می کند؟

تف کردن کلمات، نه دانش

ChatGPT API چیست؟

مقالات مرتبط