![new-green.jpg](../../../../cms/new_green_dadf793188.jpg)
ChatGPT یکی از درخشانترین ابزارهای جدید مبتنی بر هوش مصنوعی است، اما الگوریتمهایی که در پسزمینه کار میکنند در واقع از سال 2020 طیف وسیعی از برنامهها و سرویسها را تامین میکنند. بنابراین برای درک نحوه عملکرد ChatGPT، باید با صحبت در مورد زبان اصلی شروع کنیم. موتوری که به آن نیرو می دهد
GPT در ChatGPT بیشتر GPT-3 یا Generative Pre-trained Transformer 3 است، اگرچه GPT-4 اکنون برای مشترکین ChatGPT Plus در دسترس است — و احتمالاً به زودی گسترده تر خواهد شد. مدلهای GPT توسط OpenAI (شرکت سازنده ChatGPT و تولیدکننده تصویر DALL·E 2) توسعه یافتهاند، اما همه چیز را از ویژگیهای هوش مصنوعی Bing گرفته تا ابزارهای نوشتن مانند Jasper و Copy.ai را تامین میکنند. در واقع، اکثر تولیدکنندگان متن هوش مصنوعی موجود در حال حاضر از GPT-3 استفاده می کنند و احتمالاً GPT-4 را به عنوان مرحله بعدی ارائه خواهند کرد.
ChatGPT GPT-3 را در کانون توجه قرار داد زیرا فرآیند تعامل با یک تولید کننده متن هوش مصنوعی را ساده و مهمتر از همه رایگان برای همه کرد. به علاوه، این یک ربات چت است و مردم از زمان SmarterChild عاشق یک چت بات خوب بوده اند.
در حالی که GPT-3 و GPT-4 محبوب ترین مدل های زبان بزرگ (LLM) در حال حاضر هستند، در چند سال آینده، احتمالا رقابت بسیار بیشتری وجود خواهد داشت. به عنوان مثال، گوگل Bard - ربات چت هوش مصنوعی خود - را دارد که توسط موتور زبان خود Pathways Language Model (PaLM 2) پشتیبانی میشود. اما در حال حاضر، پیشنهاد OpenAI استاندارد صنعت واقعی است. این سادهترین ابزاری است که افراد میتوانند به آن دست پیدا کنند.
بنابراین پاسخ به "چطور ChatGPT کار می کند؟" اساساً عبارتند از: GPT-3 و GPT-4. اما بیایید کمی عمیق تر کاوش کنیم.
ChatGPT چیست؟
ChatGPT یک برنامه ساخته شده توسط OpenAI است. با استفاده از مدلهای زبان GPT، میتواند به سؤالات شما پاسخ دهد، کپی بنویسد، ایمیلها را پیشنویس کند، مکالمه داشته باشد، کدها را به زبانهای برنامهنویسی مختلف توضیح دهد، زبان طبیعی را به کد ترجمه کند، و موارد دیگر – یا حداقل تلاش کند – همه بر اساس زبان طبیعی. از شما می خواهد که آن را تغذیه کنید. این یک ربات چت است، اما یک ربات واقعا، واقعا خوب.
![2.png](../../../../cms/2_b2aa2d7aa2.png)
در حالی که اگر میخواهید مثلاً یک غزل شکسپیر در مورد حیوان خانگی خود بنویسید یا چند ایده برای خطوط موضوعی برخی از ایمیلهای بازاریابی دارید، بازی کردن با آن جالب است، اما برای OpenAI نیز خوب است. این راهی برای دریافت دادههای زیادی از کاربران واقعی است و به عنوان یک نسخه نمایشی فانتزی برای قدرت GPT عمل میکند، که در غیر این صورت ممکن است کمی مبهم به نظر برسد، مگر اینکه عمیقاً در یادگیری ماشین باشید.
در حال حاضر، ChatGPT دو مدل GPT ارائه می دهد. پیش فرض، GPT-3.5، قدرت کمتری دارد اما به صورت رایگان در دسترس همه است. GPT-4 پیشرفته تر به مشترکین ChatGPT Plus محدود می شود و حتی آنها هر روز فقط تعداد محدودی سؤال دریافت می کنند.
یکی از ویژگیهای بزرگ ChatGPT این است که میتواند مکالمهای که با آن دارید را به خاطر بسپارد. این بدان معناست که میتواند زمینه را از هر آنچه قبلاً از آن خواستهاید جمعآوری کند و سپس از آن برای اطلاعرسانی به مکالمهاش با شما استفاده کند. همچنین میتوانید درخواست اصلاحات و اصلاحات کنید، و به هر آنچه قبلاً در مورد آن صحبت میکردید اشاره میکند. این باعث می شود که تعامل با هوش مصنوعی مانند یک رفت و برگشت واقعی باشد.
اگر میخواهید واقعاً احساسی نسبت به آن داشته باشید، بروید و اکنون پنج دقیقه با ChatGPT بازی کنید (رایگان است!)، و سپس برای مطالعه نحوه عملکرد آن برگردید.
ChatGPT چگونه کار می کند؟
این مجموعه داده عظیم برای تشکیل یک شبکه عصبی یادگیری عمیق [ ... ] که از مغز انسان مدل شده استفاده شد - که به ChatGPT اجازه داد تا الگوها و روابط را در داده های متنی بیاموزد [ ... ] و پیش بینی کند چه متنی باید در هر جمله داده شده بعدی بیاید. .
ChatGPT با تلاش برای درک پیام شما و سپس بیرون ریختن رشتههایی از کلماتی که پیشبینی میکند بهترین پاسخ به سؤال شما را بر اساس دادههایی که روی آن آموزش داده شده است، کار میکند.
بیایید در واقع در مورد آن آموزش صحبت کنیم. این فرآیندی است که در آن به هوش مصنوعی نوپا برخی از قوانین اساسی داده میشود، و سپس یا در موقعیتهایی قرار میگیرد یا دادههای زیادی برای کار به منظور توسعه الگوریتمهای خود داده میشود.
GPT-3 بر روی تقریباً 500 میلیارد «توکن» آموزش داده شد، که به مدلهای زبانی آن اجازه میدهد تا به راحتی معنا را تعیین کنند و متن بعدی قابل قبول را پیشبینی کنند. بسیاری از کلمات به نشانههای منفرد نگاشت میشوند، اگرچه کلمات طولانیتر یا پیچیدهتر اغلب به چندین نشانه تقسیم میشوند. به طور متوسط، توکنها تقریباً چهار کاراکتر دارند. OpenAI درباره عملکرد درونی GPT-4 سکوت کرده است، اما میتوانیم با خیال راحت فرض کنیم که این مجموعه بر روی همان مجموعه داده آموزش داده شده است زیرا حتی قدرتمندتر است.
![image3.png](../../../../cms/image3_92d2d3322d.png)
![image4.png](../../../../cms/image4_6a191f4ec9.png)
تمام توکن ها از مجموعه عظیمی از داده های نوشته شده توسط انسان ها به دست آمده اند. این شامل کتابها، مقالهها و سایر اسناد در تمام موضوعات، سبکها و ژانرهای مختلف و مقدار باورنکردنی محتوایی است که از اینترنت باز حذف شده است. اساساً اجازه داده شد که از مجموع دانش بشری خرد شود.
این مجموعه داده عظیم برای تشکیل یک شبکه عصبی یادگیری عمیق - یک الگوریتم پیچیده، چند لایه و وزندار که از مغز انسان مدلسازی شده است - استفاده شد که به ChatGPT اجازه داد الگوها و روابط را در دادههای متنی بیاموزد و از توانایی ایجاد انسانمانند استفاده کند. پاسخ ها را با پیش بینی اینکه چه متنی باید در هر جمله داده شده بعدی بیاید.
اگرچه واقعاً، این امر به میزان قابل توجهی باعث کم فروشی چیزها می شود. ChatGPT در سطح جمله کار نمی کند - در عوض، متنی از کلمات، جملات، و حتی پاراگراف ها یا بند ها را تولید می کند. این متن پیشگویانه روی تلفن شما نیست که صراحتاً کلمه بعدی را حدس میزند. تلاش برای ایجاد پاسخ های کاملاً منسجم به هر درخواستی است.
برای اصلاح بیشتر توانایی ChatGPT برای پاسخ به انواع درخواست های مختلف، برای گفتگو با تکنیکی به نام یادگیری تقویتی با بازخورد انسانی (RLHF) بهینه شد. اساساً، انسان ها یک مدل پاداش با داده های مقایسه ای ایجاد کردند (که در آن دو یا چند پاسخ مدل توسط مربیان هوش مصنوعی رتبه بندی شدند)، بنابراین هوش مصنوعی می توانست یاد بگیرد که بهترین پاسخ کدام است.
![5.png](../../../../cms/5_fcd0cc8ec6.png)
بازگشت به شبکه عصبی که تشکیل داد. بر اساس تمام آن آموزشها، شبکه عصبی GPT-3 دارای 175 میلیارد پارامتر یا متغیر است که به آن اجازه میدهد یک ورودی - درخواست شما - و سپس، بر اساس مقادیر و وزنهایی که به پارامترهای مختلف میدهد (و مقدار کمی تصادفی) دریافت کند. )، هر آنچه را که فکر می کند با درخواست شما منطبق است را خروجی می دهد. OpenAI نگفته است که GPT-4 چند پارامتر دارد، اما می توان حدس زد که بیش از 175 میلیارد و کمتر از 100 تریلیون پارامتری است که زمانی شایعه شده بود. صرف نظر از تعداد دقیق، پارامترهای بیشتر به طور خودکار به معنای بهتر نیست. برخی از افزایش قدرت GPT-4 احتمالاً ناشی از داشتن پارامترهای بیشتر از GPT-3 است، اما بسیاری از موارد احتمالاً به بهبود نحوه آموزش آن بستگی دارد.
در پایان، ساده ترین راه برای تصور آن مانند یکی از آن بازی های "جمله را تمام کن" است که در کودکی انجام داده اید.
در پایان، ساده ترین راه برای تصور آن مانند یکی از آن بازی های "جمله را تمام کن" است که در کودکی انجام داده اید. به عنوان مثال، وقتی به ChatGPT با استفاده از GPT-3 دستور دادم، "Zapier is…" پاسخ داد و گفت:
Zapier یک ابزار اتوماسیون مبتنی بر وب است که به کاربران اجازه میدهد تا برنامههای وب مختلف را به یکدیگر متصل کنند تا کارهای تکراری را خودکار کرده و گردش کار را بهبود بخشد.
این جملهای است که میتوانید در صدها مقاله در توصیف کارهای زاپیر پیدا کنید. اما وقتی ویرایشگر من همان دستور را داد، گفت:
Zapier یک ابزار اتوماسیون مبتنی بر وب است که به کاربران اجازه میدهد تا برنامههای وب مختلف را به هم متصل کرده و گردش کار بین آنها را خودکار کنند.
این تقریباً شبیه است، اما دقیقاً همان پاسخ نیست. این تصادفی بودن (که میتوانید در برخی از برنامههای GPT-3 با تنظیمی به نام «دما» کنترل کنید) تضمین میکند که ChatGPT فقط به تک تک پاسخها با همان پاسخ سهام پاسخ نمیدهد. هر بار هر فرمان را در کل شبکه عصبی اجرا می کند، و چند تاس را اینجا و آنجا می اندازد تا همه چیز را تازه نگه دارد. به احتمال زیاد نمی توان ادعا کرد که Zapier رنگی از مریخ است، اما کلمات زیر را بر اساس احتمال نسبی آنها مخلوط می کند.
(در هنگام اجرا بر روی GPT-4، ChatGPT گفت: " Zapier یک ابزار اتوماسیون مبتنی بر وب است که به کاربران اجازه می دهد وظایف را بین برنامه ها و سرویس های آنلاین مختلف یکپارچه و خودکار کنند."
تف کردن کلمات، نه دانش
سازندگان ChatGPT اولین کسانی هستند که میگویند میتواند اطلاعات نادرست (و احتمالاً مضر) تولید کند، اگرچه سخت برای رفع آن تلاش میکنند.
در اینجا یک مثال رام است. وقتی از ChatGPT با استفاده از GPT-3 و GPT-4 خواستم به "هری گینس است..." پاسخ دهد، GPT-3 ابتدا با پرسیدن کدام هری گینس پاسخ داد. سوال عالی - ما به معنای واقعی کلمه دو نفر هستیم! بنابراین من گفتم: "هری گینس نویسنده" (این من هستم). GPT-4 بلافاصله حدس زد که من کی هستم، اگرچه هر دو پاسخ جذاب بودند:
GPT-3: هری گینس نویسنده و روزنامه نگار مستقل مقیم ایرلند است. او برای نشریات مختلفی از جمله نیویورک تایمز، گاردین، هافینگتون پست و Popular Mechanics نوشته است. او موضوعاتی از فناوری و عکاسی گرفته تا سفر و فرهنگ را پوشش می دهد.
GPT-4: هری گینس نویسنده، عکاس و متخصص فناوری ایرلندی است. او برای نشریات مختلفی از جمله How-To Geek، Lifehacker و Tuts+ نوشته است. کار او در درجه اول بر فناوری، آموزش ها و نکات و همچنین عکاسی و ویرایش تصویر متمرکز است. گینس برای ایجاد راهنماهای دقیق که به خوانندگان کمک می کند موضوعات پیچیده را درک کنند یا مشکلات را به روشی ساده حل کنند، شهرت دارد.
اولین و آخرین خط GPT-3 تقریباً به کلمه از وب سایت های مختلف و بیوگرافی نویسنده من در سراسر وب استخراج می شود (اگرچه من معمولاً خودم را به عنوان یک نویسنده و عکاس آزاد و نه یک روزنامه نگار معرفی می کنم). اما فهرست نشریات اساسا ساخته شده است. من برای نیویورک تایمز نوشته ام، اما نه برای گاردین ، هافینگتون پست ، یا Popular Mechanics (من به طور منظم برای Popular Science می نویسم، بنابراین ممکن است از آنجا آمده باشد).
GPT-4 بخش عکاسی را به درستی دریافت می کند و در واقع برخی از نشریات را که برای آنها نوشته ام فهرست می کند، که بسیار چشمگیر است، اگرچه آنها کسانی نیستند که من به آنها افتخار می کنم. این یک مثال عالی از این است که چگونه OpenAI توانسته است دقت GPT-4 را نسبت به GPT-3 افزایش دهد، اگرچه ممکن است همیشه صحیح ترین پاسخ را ارائه ندهد.
اما بیایید به GPT-3 برگردیم زیرا خطای آن مثال جالبی از آنچه در پشت صحنه در ChatGPT می گذرد را ارائه می دهد. در واقع چیزی در مورد من نمی داند. حتی کپی/پیست کردن از اینترنت و اعتماد به منبع اطلاعات نیست. در عوض، صرفاً یک رشته از کلمات را پیشبینی میکند که بر اساس میلیاردها نقطه دادهای که دارد، بعدی خواهند آمد.
به عنوان مثال: نیویورک تایمز بسیار بیشتر با The Guardian و The Huffington Post گروه بندی می شود تا با مکان هایی که من برای آنها نوشته ام، مانند Wired ، Outside ، The Irish Times ، و البته Zapier. بنابراین وقتی باید مشخص کند که چه چیزی باید از نیویورک تایمز دنبال شود، از اطلاعات منتشر شده درباره من استفاده نمی کند. لیستی از نشریات بزرگ را از تمام داده های آموزشی که دارد استخراج می کند. این بسیار هوشمندانه است و قابل قبول به نظر می رسد، اما این واقعیت ندارد.
GPT-4 کار بسیار بهتری انجام می دهد و نشریات را میخکوب می کند، اما بقیه چیزهایی که می گوید واقعاً شبیه جملات بعدی قابل قبول است. فکر نمیکنم قدردانی زیادی برای شهرت من داشته باشد: این فقط همان چیزی است که یک بیو میگوید. در پنهان کردن نحوه عملکرد آن بسیار بهتر از GPT-3 است، اگرچه در واقع از همان تکنیک استفاده می کند.
با این حال، بسیار چشمگیر است که چقدر GPT قبلاً بهبود یافته است. در حال حاضر، GPT-4 پشت یک اشتراک ممتاز قفل شده است، بنابراین بیشتر محتوای ChatGPT که می بینید به GPT-3 متکی هستند، اما ممکن است در مدت زمان آینده تغییر کند. چه کسی می داند GPT-5 چه چیزی را به ارمغان خواهد آورد.
ChatGPT API چیست؟
OpenAI با فناوری خود نگرش فقط ما را ندارد. این شرکت دارای یک پلت فرم API است که به توسعه دهندگان اجازه می دهد تا قدرت ChatGPT را در برنامه ها و سرویس های خود ادغام کنند (البته با قیمتی).
Zapier از ChatGPT API برای تقویت یکپارچه سازی ChatGPT خود استفاده می کند، که به شما امکان می دهد ChatGPT را به هزاران برنامه دیگر متصل کنید و هوش مصنوعی را به جریان های کاری حیاتی کسب و کار خود اضافه کنید. در اینجا چند مثال برای شروع شما آورده شده است، اما می توانید ChatGPT را اساساً از هر برنامه ای فعال کنید.
همچنین میتوانید از مدلهای دیگر OpenAI مانند DALL·E و Whisper با ادغام OpenAI Zapier استفاده کنید. گردشهای کاری را که شامل تولید تصویر و رونویسی صدا میشود، مستقیماً از برنامههایی که قبلاً استفاده میکنید، خودکار کنید.
مطالب مرتبط: چگونه می توانید (و زمانی که نباید) از ChatGPT برای نوشتن کپی بازاریابی استفاده کنید