در حالی که GPT-4 اکثر آزمایشات را در 10 درصد بالای گروه انجام داد، نسخه اصلی ChatGPT معمولاً در 10 درصد پایین قرار داشت.
آخرین نسخه چت ربات هوش مصنوعی (AI) ChatGPT، GPT-4 می تواند امتحانات دبیرستان و امتحانات دانشکده حقوق را با امتیاز 90 درصد قبول کند و دارای قابلیت های پردازش جدیدی است که در نسخه قبلی امکان پذیر نیست.
ارقام نمرات آزمون GPT-4 توسط سازنده آن OpenAI در 14 مارس به اشتراک گذاشته شد و نشان داد که می تواند تصاویر، ورودی های صوتی و تصویری را به متن تبدیل کند و همچنین “دستورالعمل های بسیار پیچیده تر” را خلاقانه تر و قابل اعتمادتر پردازش کند.
OpenAI اضافه کرد: «10 درصد برتر شرکت کنندگان در آزمون یک آزمون وکالت شبیه سازی شده را با نمره حدودی قبول می کنند. در مقابل، امتیاز GPT-3.5 حدود 10 درصد پایین بود.
اعداد نشان می دهد که GPT-4 در صدک 88 در امتحان LSAT امتیاز 163 را کسب کرده است—دانشجویان کالج برای قبولی در دانشکده حقوق باید در ایالات متحده قبول شوند.

امتیاز GPT4 آن را به خوبی در 20 دانشکده حقوق برتر قرار می دهد و تنها چند امتیاز کمتر از نمرات گزارش شده برای پذیرش در دانشکده های معتبر مانند هاروارد، استنفورد، پرینستون یا ییل است.
نسخه قبلی ChatGPT تنها امتیاز 149 را در LSAT کسب کرد و آن را در 40 درصد پایینی قرار داد.
GPT-4 همچنین امتیاز 298 از 400 را در آزمون یکنواخت وکالت، امتحانی برای دانشجویانی که اخیراً فارغالتحصیل شدهاند، کسب کرد که به آنها اجازه میدهد به عنوان وکیل در هر حوزه قضایی ایالات متحده فعالیت کنند.

نسخه قدیمی ChatGPT در این آزمون با کسب امتیاز 213 از 400، در رده 10 درصدی پایین قرار گرفت.
GPT-4 به ترتیب در صدک های 93 و 89 در آزمون های SAT Evidence-based Reading and Writing و SAT Mathematics که توسط دانش آموزان دبیرستانی ایالات متحده برای اندازه گیری آمادگی دانشگاهی آنها گرفته شده بود، امتیاز گرفت.
GPT-4 همچنین در علوم “سخت” عالی بود و در AP زیست شناسی (85-100٪)، شیمی (71-88٪) و فیزیک 2 (66-84٪) امتیاز بسیار بالاتری از میانگین کسب کرد.

با این حال، امتیاز حساب دیفرانسیل و انتگرال AP نسبتاً متوسط بود و بین صدک های 43 و 59 قرار داشت.
حوزه دیگری که GPT-4 فاقد آن بود، آزمونهای ادبیات انگلیسی بود که در دو آزمون مجزا از صدک 8 تا 44 نمره میگرفت.
OpenAI گفت که GPT-4 و GPT-3.5 این آزمون ها را از آزمون های عملی 2022-2023 گرفته اند و “هیچ آموزش خاصی” توسط ابزارهای پردازش زبان دریافت نکرده اند:
ما هیچ آموزش خاصی برای این امتحانات انجام ندادیم. تعداد کمی از مشکلات در امتحانات توسط مدل در طول آموزش مشاهده شد، اما ما معتقدیم که نتایج نشان دهنده است.
نتایج همچنین باعث ایجاد ترس در جامعه توییتر شد.
مرتبط با: ChatGPT چگونه بر دامنه Web3 تأثیر می گذارد؟ صنعت پاسخ می دهد
نیک آلموند، موسس FactoryDAO گفت در 14 مارس، 14300 دنبالکننده توییتر گفتند که GPT4 مردم را میترساند و سیستم آموزشی جهانی را «فروپاش میکند».
چندین سال است که نظریه ارزشیابی بخش بزرگی از زندگی من است. سال ها پیش داشتم از آمدن این روز صحبت می کردم. در آن زمان به معنای واقعی کلمه شبیه لنگ تعبیه شده بودم.
اما… واقعاً، این بدان معناست که از این نقطه به بعد، همه ارزیابیها به جز بدون نظارت تمام شده است.
— drnick ️² (@DrNickA) 14 مارس 2023
Conor Grogan مدیر سابق Coinbase گفت که او یک قرارداد هوشمند اتریوم زنده را به GPT-4 اضافه کرد و بلافاصله به چندین “آسیب پذیری” اشاره کرد و نحوه سوء استفاده از کد را تشریح کرد:
من یک قرارداد زنده اتریوم را به GPT-4 انداختم.
در یک لحظه، تعدادی از آسیبپذیریها را برجسته کرد و به مناطق سطحی اشاره کرد که میتوان از قرارداد بهرهبرداری کرد. سپس روش خاصی را تأیید کرد که من میتوانم از قرارداد استفاده کنم. pic.twitter.com/its5puakUW
— کنر (@jconorgrogan) 14 مارس 2023
بررسیهای قبلی قراردادهای هوشمند در ChatGPT نشان داد که نسخه اول همچنین میتواند خطاهای کد را تا حد معقولی تشخیص دهد.
روآن چئونگ، بنیانگذار خبرنامه هوش مصنوعی “The Rundown”، ویدئویی از GPT به اشتراک گذاشت که یک وب سایت جعلی با دست طراحی شده را روی یک تکه کاغذ رمزگشایی می کند.
من به تازگی تماشا کردم که GPT-4 یک طرح دستی را به یک وب سایت کاربردی تبدیل می کند.
این دیوانگی است. pic.twitter.com/P5nSjrk7Wn
— روآن چونگ (@rowancheung) 14 مارس 2023
نویسنده: Brayden Lindrea