بالاترین شکست‌های ChatGPT از OpenAI هنگام پاسخ دادن

تقریباً ۶ ماه است که چت‌جی‌پی‌تی از OpenAI عرضه شده است. در واقع، اخیراً شرکت چت‌جی‌پی‌تی ۴ را راه اندازی کرده است. این فناوری به جهان به سطح بعدی رسیده است.

چت‌جی‌پی‌تی چهره مدل زبانی است که توسط هوش مصنوعی قدرت گرفته و برای انجام فعالیت‌های گوناگونی از جمله ترجمه زبان‌ها، خلاصه‌سازی اطلاعات و پاسخگویی به سوالات آموزش دیده است. قابلیت های استثنایی این مدل توجه فراوانی به خود جلب و در نتیجه، بسیاری از افراد شروع به شک کردن در مورد فرصت های شغلی خود کرده اند.

مدل پردازش زبان GPT-4 قادر است اطلاعات بسیار زیادی را تجزیه و تحلیل کند و سپس محتواهایی بر اساس یافته‌های تجزیه و تحلیل تولید کند. همچنین، این فناوری جدید قادر است به تجزیه و تحلیل حجم عظیمی از متن بپردازد تا به مصرف کنندگان اطلاعاتی درباره یک نقطه داده خاص ارائه دهد.

بدون شک فناوری برای مدت طولانی همراه می‌ماند. بطور قطع این فناوری به کاربران در جهات مختلف کمک می‌کند. در موارد بسیاری ، توانایی انجام هر چیز از نوشتن اسکریپت تا حل سوالات دشوارترین کاغذهای سوال را نشان داده است. هیچ چیزی وجود ندارد که ChatGPT نتواند انجام دهد. با این حال ، برخی از مسائل نیز برای ChatGPT سخت‌تر هستند.

۱. ChatGPT، پر قدرت با هوش مصنوعی، در آزمون برتری اشتراکی ورودی مشترک (JEE) در هند به شکست مسخت (ناکام) شد. این آزمون برتری اشتراکی بخاطر سختی‌اش معروف است و هر سال هزاران دانش آموزی را جذب می‌کند که علاقه‌مند به ورود به مدارس مهندسی معتبر هند هستند. این یکی از سخت‌ترین آزمون‌های کمی است که شامل نمودارها و اعداد پیچیده می‌شود.

دانشجویانی که علاقه‌مند به حضور در موسسات آموزشی معتبر مانند IIT و NIT هستند، باید ابتدا در آزمون ورودی مشترک شرکت کنند. طبق گزارشات، ChatGPT در آزمون JEE Advanced عملکرد خوبی نداشته است.

نتایج عملکرد چت‌جی‌پی‌تی در آزمون کمتر از انتظار بود، زیرا فقط توانست 11 سوال از کل تعداد سوالات در آزمون را حل کند.

2. چتGPT در گذشته در تست های بسیاری که هم مشهور و هم دشوار بودند، موفق بوده است. به شکل قابل توجهی، چتGPT تمامی ۲۰۰ سوال از امتحان ورودی و راهیابی ملی برای دانشکده های پزشکی (NEET) را که نیازمندی هایی برای پاسخ به ۱۸۰ سوال از جمعاً ۲۰۰ سوال میباشد، امتحان کرد و با موفقیت به آنها پاسخ داد.

با این حال، ChatGPT تلاش کرد تا همه 200 سوال را پاسخ دهد و نتایج عملکرد آن 359 از 800 بود. به طور خاص، ChatGPT در بخش زیست‌شناسی آزمون NEET، عملکرد بسیار خوبی داشت و دقت بهتری در پاسخ دادن به سوالاتی که در آن بخش پرسیده شده بود، از خود نشان داد. عملکرد ChatGPT در آزمون NEET نشان می‌دهد که این قابلیت را دارد تا در حوزه‌های دیگر نیز بهترین عملکرد را از خود نشان دهد، با این حال که آزمون JEE Advanced را پاس نکرد.

شکستی که چت‌جی‌پی‌تی در آزمون JEE Advanced تجربه کرد نشانگر محدودیت‌هایی است که حتی در پیشرفته‌ترین مدل‌های هوش مصنوعی وجود دارد. با وجودی که هوش مصنوعی قدرتی دارد که می‌تواند صنایع مختلفی را در هم بریزد، هنوز مسیر طولانی‌ای را پیش رو دارد تا بتواند در وظایف دشوار با هوش انسان رقابت کند.

ربات چت ChatGPT شرکت OpenAI در یک مسابقه رقابتی دیگر بی‌نتیجه ماند.

3. چت جی‌پی‌تی درخواست مجله Analytics India (AIM) امتحان کارگزاری خدمات عمومی اتحادیه (UPSC) را داد. امتحان UPSC معتبرترین امتحانات رقابتی در جهان محسوب می‌شود. بیش از 10 لکه از افراد علاقه‌مند هر سال در امتحان UPSC شرکت می‌کنند، اما تنها 5 درصد از آنها موفق می‌شوند.

AIM با ۱۰۰ سوال از آزمون UPSC Prelims ۲۰۲۲ به ChatGPT فراهم کرد.

چت‌بات خیلی ناکام عمل کرد در آزمون UPSC Prelims 2022 و فقط ۵۴ از ۱۰۰ نمره را در سوالنامه ۱ (ست A) کسب کرد در حالی که نمره مورد نیاز ۸۷.۵۴ بود. این نشان می دهد که چتGPT آزمون UPSC را قبول نکرد.

سوالات براساس موضوعات علم عمومی، تاریخ، جغرافیا، اقتصاد، بوم‌شناسی و رویدادهای کنونی در هند بودند. ربات چت در سوالات مربوط به مکان‌ها و اقتصادها موفق عمل کرد، اما زمانی که درباره رویدادهای تاریخی قبل از سال 2021 سوال شد، به طور وحشتناکی شکست خورد.

این واقعیت که مجموعه داده‌های چت‌GPT تنها تا سال 2021 توسعه یافته است، احتمالاً عامل تصمیم‌گیری در ناتوانی ربات هوش مصنوعی در پاسخ دادن به تمامی سوالات امتحان است.

۴. به جز آن، نتایج آزمون CLAT برای ChatGPT هم به طور مشابهی بالاتر از میانگین بودند. در طول آزمون CLAT UG، این ابزار هوش مصنوعی تنها در حل دقیق ۵۰.۸۳ درصد از سوالات موفق بود. در دسته بندی سوالات منطقی و محاسباتی، ChatGPT موفق نبود. اما در دسته بندی انگلیسی و موضوعات کنونی عملکرد بسیار خوبی داشت. هنگام معرفی سوالات مبتنی بر مفاهیم، این ابزار به شدت دچار مشکل شد.

در نوامبر ۲۰۲۲ منتشر شد، ChatGPT تاکنون در ایالات متحده عملکرد بسیار خوبی داشته است. این فناوری هوش مصنوعی با موفقیت در امتحان کنکور پزشکی ایالات متحده (USMLE) و امتحانات MBA مختلف در آمریکا عملکرد موفقیت آمیزی داشته است. علاوه بر آن، با موفقیت در امتحانات مصاحبه کدنویسی گوگل برای مهندسان سطح ۳ عملکرد موفقیت آمیزی داشت.

تعجب حرفه‌ایان دامپزشکی اخیراً زمانی که چتGPT قادر بود شرایط سلامتی یک سگ را به درستی تشخیص دهد و جان حیوان را نجات دهد.

کشورهای بسیاری به‌صورت متفاوتی دربارهٔ ChatGPT عقایدی دارند و آماده‌اند به‌طور قاطعانه علیه این نوآوری جدید اقدام کنند. اخیراً این فناوری در دو کشور بزرگ، از جمله آلمان و ایتالیا، ممنوع شده است. این کشورها ادعا می‌کنند که ChatGPT از سیستم‌های محافظتی جهت جلوگیری از انتشار محتواهای غیراخلاقی واقعیتی مانند سامانهٔ تایید سن عاجز است.

اولریش کلبر، کمیسیونر محافظت اطلاعات آلمان، هشدار داده که نرم افزار Chat-GPT ممکن است مورد ممنوعیت در آلمان قرار گیرد به دلیل مخاوف مربوط به امنیت داده های کاربران، به طرز مشابهی که در ایتالیا رخ داد.

خب، بیایید ببینیم چگونه فناوری قدرتمند هوش مصنوعی در آینده عمل خواهد کرد.

متشکرم که خواندید! منتظر مقالات اطلاعاتی بیشتری باشید!

بالا ChatGPT از OpenAI شکست می‌خورد در حین پاسخ دادن

مقالات مرتبط