مدل جدید پیشرفتهای قابلاندازهگیری را در چندین دسته نشان میدهد، از جمله زمانهای پاسخ پرس و جو تقریباً فوری و توانایی تجزیه ورودیها تا اندازه 100000 توکن.
Anthropic، یک شرکت هوش مصنوعی (AI) و “خدمات عمومی”، Claude 2 را در 11 ژوئیه راه اندازی کرد و نقطه عطف دیگری را در سالی پر از پیشرفت ظاهراً بدون وقفه از صنعت در حال رشد هوش مصنوعی رقم زد.
با کلود 2 آشنا شوید! آخرین مدل ما عملکرد در کدنویسی، ریاضی و استدلال را بهبود بخشیده است. میتواند پاسخهای طولانیتری ایجاد کند و در ایالات متحده و بریتانیا در یک وبسایت بتا عمومی جدید به آدرس https://t.co/uLbS2JNczH در دسترس است. pic.twitter.com/jSkvbXnqLd
– Anthropic (@AnthropicAI) 11 ژوئیه 2023
طبق یک پست وبلاگ شرکت، Claude 2 تقریباً در هر دسته بندی قابل اندازه گیری پیشرفت هایی را نشان می دهد. شاید بارزترین تفاوت بین سلف آن، نحوه بحث محققان درباره کار آن باشد.
پست وبلاگی که Claude 2 را اعلام می کند، هیچ اشاره ای به معیارهای یادگیری ماشین سنتی یا امتیازات محاسباتی در برابر مدل های مشابه ندارد. در عوض، Anthropic هر دو کلود و کلود 2 را به عنوان آزمون دانش، مهارت ها و حل مسئله در دنیای واقعی قرار می دهد.
به گفته آنتروپیک، کلود 2 در دانش، کدنویسی و سایر آزمونها پیشی گرفت و حتی در برابر میانگینهای انسانی نیز امتیاز کسب کرد:
در مقایسه با دانشجویانی که برای تحصیلات تکمیلی درخواست میکنند، کلود 2 در آزمونهای خواندن و نوشتن GRE بالاتر از صدک 90 نمره میگیرد و در استدلال کمی مشابه متقاضی میانه است.
شایان ذکر است که بسیاری از کارشناسان بر این باورند که مقایسه بین آزموندهندگان انسان و هوش مصنوعی به دلیل ماهیت استدلال شناختی انسان و احتمال اینکه مجموعه دادههای آموزشی مدل زبانی بزرگ حاوی اطلاعات آزمون باشد، بیاثر است. اساساً، آزمایشهای طراحیشده برای انسانها ممکن است توانایی استدلال هوش مصنوعی را «آزمایش» نکنند یا نشانی مناسب از دانش یا مهارت واقعی ارائه نکنند.
با انتشار Claude 2، Anthropic یک نسخه بتا از یک رابط مبتنی بر وب “Talk to Claude” را منتشر کرد که دسترسی عمومی به چت بات را برای کاربران در مناطق ایالات متحده و بریتانیا فراهم می کند.
مرتبط با: چگونه به عنوان یک مهندس سریع هوش مصنوعی شغلی با درآمد بالا پیدا کنیم؟
Cointelegraph یک آزمایش کوتاه برای نسخه جدید انجام داد و به طور حکایتی، پیشرفت ها بلافاصله قابل توجه است. کلود 2 تقریباً بلافاصله با پاسخهای واضح و مختصر به درخواستهای ما پاسخ داد.

به گفته آنتروپیک، سقف ادعای مدل جدید 100000 سکه یا معادل حدود 75000 کلمه است. رابط کاربری سایت بیان می کند که کاربران می توانند PDF، TXT، CSV و اسناد مشابه را برای تجزیه آپلود کنند، اما این عملکرد در آزمایش محدود ما قبل از انتشار این مقاله کار نمی کرد.
نویسنده: Tristan Greene