ChatGPT V4 از نوار، SAT ها فراتر می رود و می تواند شکاف های قراردادهای ETH را شناسایی کند

امیر کرمی
مارس 15, 2023
7:17 ق.ظ
بدون نظر
بازدید: 213

در حالی که GPT-4 اکثر آزمایشات را در 10 درصد بالای گروه انجام داد، نسخه اصلی ChatGPT معمولاً در 10 درصد پایین قرار داشت.

آخرین نسخه چت ربات هوش مصنوعی (AI) ChatGPT، GPT-4 می تواند امتحانات دبیرستان و امتحانات دانشکده حقوق را با امتیاز 90 درصد قبول کند و دارای قابلیت های پردازش جدیدی است که در نسخه قبلی امکان پذیر نیست.

ارقام نمرات آزمون GPT-4 توسط سازنده آن OpenAI در 14 مارس به اشتراک گذاشته شد و نشان داد که می تواند تصاویر، ورودی های صوتی و تصویری را به متن تبدیل کند و همچنین “دستورالعمل های بسیار پیچیده تر” را خلاقانه تر و قابل اعتمادتر پردازش کند.

OpenAI اضافه کرد: «10 درصد برتر شرکت کنندگان در آزمون یک آزمون وکالت شبیه سازی شده را با نمره حدودی قبول می کنند. در مقابل، امتیاز GPT-3.5 حدود 10 درصد پایین بود.

اعداد نشان می دهد که GPT-4 در صدک 88 در امتحان LSAT امتیاز 163 را کسب کرده است—دانشجویان کالج برای قبولی در دانشکده حقوق باید در ایالات متحده قبول شوند.

*نتایج آزمون GPT-4 و GPT-3.5 در یک سری امتحانات جدید ایالات متحده است. منبع:* *OpenAI*

امتیاز GPT4 آن را به خوبی در 20 دانشکده حقوق برتر قرار می دهد و تنها چند امتیاز کمتر از نمرات گزارش شده برای پذیرش در دانشکده های معتبر مانند هاروارد، استنفورد، پرینستون یا ییل است.

نسخه قبلی ChatGPT تنها امتیاز 149 را در LSAT کسب کرد و آن را در 40 درصد پایینی قرار داد.

GPT-4 همچنین امتیاز 298 از 400 را در آزمون یکنواخت وکالت، امتحانی برای دانشجویانی که اخیراً فارغ‌التحصیل شده‌اند، کسب کرد که به آنها اجازه می‌دهد به عنوان وکیل در هر حوزه قضایی ایالات متحده فعالیت کنند.

*نمرات UBE باید برای وکالت در هر حوزه قضایی ایالات متحده پذیرفته می شد. منبع:* *همایش ملی بازرسان وکالت*

نسخه قدیمی ChatGPT در این آزمون با کسب امتیاز 213 از 400، در رده 10 درصدی پایین قرار گرفت.

GPT-4 به ترتیب در صدک های 93 و 89 در آزمون های SAT Evidence-based Reading and Writing و SAT Mathematics که توسط دانش آموزان دبیرستانی ایالات متحده برای اندازه گیری آمادگی دانشگاهی آنها گرفته شده بود، امتیاز گرفت.

GPT-4 همچنین در علوم “سخت” عالی بود و در AP زیست شناسی (85-100٪)، شیمی (71-88٪) و فیزیک 2 (66-84٪) امتیاز بسیار بالاتری از میانگین کسب کرد.

با این حال، امتیاز حساب دیفرانسیل و انتگرال AP نسبتاً متوسط بود و بین صدک های 43 و 59 قرار داشت.

حوزه دیگری که GPT-4 فاقد آن بود، آزمون‌های ادبیات انگلیسی بود که در دو آزمون مجزا از صدک 8 تا 44 نمره می‌گرفت.

OpenAI گفت که GPT-4 و GPT-3.5 این آزمون ها را از آزمون های عملی 2022-2023 گرفته اند و “هیچ آموزش خاصی” توسط ابزارهای پردازش زبان دریافت نکرده اند:

ما هیچ آموزش خاصی برای این امتحانات انجام ندادیم. تعداد کمی از مشکلات در امتحانات توسط مدل در طول آموزش مشاهده شد، اما ما معتقدیم که نتایج نشان دهنده است.

نتایج همچنین باعث ایجاد ترس در جامعه توییتر شد.

مرتبط با: ChatGPT چگونه بر دامنه Web3 تأثیر می گذارد؟ صنعت پاسخ می دهد

نیک آلموند، موسس FactoryDAO گفت در 14 مارس، 14300 دنبال‌کننده توییتر گفتند که GPT4 مردم را می‌ترساند و سیستم آموزشی جهانی را «فروپاش می‌کند».

چندین سال است که نظریه ارزشیابی بخش بزرگی از زندگی من است. سال ها پیش داشتم از آمدن این روز صحبت می کردم. در آن زمان به معنای واقعی کلمه شبیه لنگ تعبیه شده بودم.

اما… واقعاً، این بدان معناست که از این نقطه به بعد، همه ارزیابی‌ها به جز بدون نظارت تمام شده است.

— drnick ️² (@DrNickA) 14 مارس 2023

Conor Grogan مدیر سابق Coinbase گفت که او یک قرارداد هوشمند اتریوم زنده را به GPT-4 اضافه کرد و بلافاصله به چندین “آسیب پذیری” اشاره کرد و نحوه سوء استفاده از کد را تشریح کرد:

من یک قرارداد زنده اتریوم را به GPT-4 انداختم.

در یک لحظه، تعدادی از آسیب‌پذیری‌ها را برجسته کرد و به مناطق سطحی اشاره کرد که می‌توان از قرارداد بهره‌برداری کرد. سپس روش خاصی را تأیید کرد که من می‌توانم از قرارداد استفاده کنم. pic.twitter.com/its5puakUW

— کنر (@jconorgrogan) 14 مارس 2023

بررسی‌های قبلی قراردادهای هوشمند در ChatGPT نشان داد که نسخه اول همچنین می‌تواند خطاهای کد را تا حد معقولی تشخیص دهد.

روآن چئونگ، بنیانگذار خبرنامه هوش مصنوعی “The Rundown”، ویدئویی از GPT به اشتراک گذاشت که یک وب سایت جعلی با دست طراحی شده را روی یک تکه کاغذ رمزگشایی می کند.

من به تازگی تماشا کردم که GPT-4 یک طرح دستی را به یک وب سایت کاربردی تبدیل می کند.

این دیوانگی است. pic.twitter.com/P5nSjrk7Wn

— روآن چونگ (@rowancheung) 14 مارس 2023

نویسنده: Brayden Lindrea

اشتراک گذاری و حمایت

امیر کرمی

کارشناس تولید محتوا و علاقه مند به ارز دیجیتال و دنیای فناوری 😉

دیدگاهتان را بنویسید لغو پاسخ

برای نوشتن دیدگاه باید وارد بشوید.