Anthropic کلود 2 را در میان آشفتگی های مداوم هوش مصنوعی منتشر کرد


مدل جدید پیشرفت‌های قابل‌اندازه‌گیری را در چندین دسته نشان می‌دهد، از جمله زمان‌های پاسخ پرس و جو تقریباً فوری و توانایی تجزیه ورودی‌ها تا اندازه 100000 توکن.

Anthropic، یک شرکت هوش مصنوعی (AI) و “خدمات عمومی”، Claude 2 را در 11 ژوئیه راه اندازی کرد و نقطه عطف دیگری را در سالی پر از پیشرفت ظاهراً بدون وقفه از صنعت در حال رشد هوش مصنوعی رقم زد.

طبق یک پست وبلاگ شرکت، Claude 2 تقریباً در هر دسته بندی قابل اندازه گیری پیشرفت هایی را نشان می دهد. شاید بارزترین تفاوت بین سلف آن، نحوه بحث محققان درباره کار آن باشد.

پست وبلاگی که Claude 2 را اعلام می کند، هیچ اشاره ای به معیارهای یادگیری ماشین سنتی یا امتیازات محاسباتی در برابر مدل های مشابه ندارد. در عوض، Anthropic هر دو کلود و کلود 2 را به عنوان آزمون دانش، مهارت ها و حل مسئله در دنیای واقعی قرار می دهد.

به گفته آنتروپیک، کلود 2 در دانش، کدنویسی و سایر آزمون‌ها پیشی گرفت و حتی در برابر میانگین‌های انسانی نیز امتیاز کسب کرد:

در مقایسه با دانشجویانی که برای تحصیلات تکمیلی درخواست می‌کنند، کلود 2 در آزمون‌های خواندن و نوشتن GRE بالاتر از صدک 90 نمره می‌گیرد و در استدلال کمی مشابه متقاضی میانه است.

شایان ذکر است که بسیاری از کارشناسان بر این باورند که مقایسه بین آزمون‌دهندگان انسان و هوش مصنوعی به دلیل ماهیت استدلال شناختی انسان و احتمال اینکه مجموعه داده‌های آموزشی مدل زبانی بزرگ حاوی اطلاعات آزمون باشد، بی‌اثر است. اساساً، آزمایش‌های طراحی‌شده برای انسان‌ها ممکن است توانایی استدلال هوش مصنوعی را «آزمایش» نکنند یا نشانی مناسب از دانش یا مهارت واقعی ارائه نکنند.

با انتشار Claude 2، Anthropic یک نسخه بتا از یک رابط مبتنی بر وب “Talk to Claude” را منتشر کرد که دسترسی عمومی به چت بات را برای کاربران در مناطق ایالات متحده و بریتانیا فراهم می کند.

مرتبط با: چگونه به عنوان یک مهندس سریع هوش مصنوعی شغلی با درآمد بالا پیدا کنیم؟

Cointelegraph یک آزمایش کوتاه برای نسخه جدید انجام داد و به طور حکایتی، پیشرفت ها بلافاصله قابل توجه است. کلود 2 تقریباً بلافاصله با پاسخ‌های واضح و مختصر به درخواست‌های ما پاسخ داد.

اسکرین شات: با کلود 2 از طریق وب سایت آنتروپیک گپ بزنید.

به گفته آنتروپیک، سقف ادعای مدل جدید 100000 سکه یا معادل حدود 75000 کلمه است. رابط کاربری سایت بیان می کند که کاربران می توانند PDF، TXT، CSV و اسناد مشابه را برای تجزیه آپلود کنند، اما این عملکرد در آزمایش محدود ما قبل از انتشار این مقاله کار نمی کرد.




نویسنده: Tristan Greene

اشتراک گذاری و حمایت

امیر کرمی

امیر کرمی

کارشناس تولید محتوا و علاقه مند به ارز دیجیتال و دنیای فناوری 😉

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *