
OpenAI از GPT-۴.۵ رونمایی کرد

به گزارش خبرنگار اقتصاد معاصر؛ اوایل این ماه سم آلتمن، مدیرعامل OpenAI، نقشه راه مدلهای آینده این شرکت، یعنی GPT-۴.۵ و GPT-۵ را به اشتراک گذاشت.
وی در پستی در شبکه اجتماعی X اعلام کرد که GPT-۴.۵ با نام رمز «Orion» آخرین مدل این شرکت خواهد بود که از روش استدلال زنجیرهای (Chain-of-Thought) بهره نمیبرد و جزئیات این مدل در هالهای از ابهام باقی مانده بود.
صبح پنجشنبه OpenAI، به طور مرموزی اعلام شد که این شرکت قصد دارد تا ۴.۵ ساعت بعد یک پخش زنده برگزار کند که در واقع اشارهای به مدل جدید خود داشت. در جریان این رویداد، OpenAI از GPT-۴.۵ رونمایی کرد و آن را به عنوان بزرگترین و دانشمندترین مدل خود معرفی کرد. همچنین OpenAI، در پستی نوشت: «GPT-۴.۵ وارد چت شد.»
طبق اعلام OpenAI، کاربران در هنگام استفاده از GPT-۴.۵ بهبود کلی، از جمله کاهش توهمات، درک بهتر نیت کاربر و افزایش هوش هیجانی مدل را تجربه خواهند کرد. در کل تعامل با این مدل بیشتر شبیه یک مکالمه طبیعی خواهد بود، زیرا دارای دانش عمیقتر و درک متنی بهتری است.
استفاده از روشهای جدید یادگیری
این مدل بر پایه روشهای یادگیری بدون نظارت (Unsupervised Learning) و بهبود استدلال آموزش دیده است. اگرچه این مدل از استدلال زنجیرهای پشتیبانی نمیکند اما همچنان سطح بالایی از استدلال را با سرعت بالاتر و درک اجتماعی بهتر ارائه میدهد. به عنوان مثال، در یک آزمایش از دو مدل GPT-۴.۵ و o۱ خواسته شد که یک پیام متنی با محتوای نفرتآمیز تولید کنند. مدل o۱ مدت زمان بیشتری را طول داد تا پاسخ دهد و فقط یک پاسخ ارائه کرد که بسیار جدی و خشک بود اما GPT-۴.۵ دو پاسخ مختلف ارائه داد، یکی با لحن نرمتر و دیگری جدیتر اما هیچکدام از آنها مستقیما محتوای نفرتآمیز نداشتند و در عوض مدل ناامیدی خود را از رفتار کاربر ابراز کرد.
همچنین هنگام پاسخ به سوالات فنی GPT-۴.۵، پاسخهای طبیعیتر ارائه داد، در حالی که مدل o۱ خروجیهای ساختارمندتری داشت. این ویژگی GPT-۴.۵ را برای انجام وظایف روزمره مانند نوشتن متن و حل مسائل عملی مناسبتر میکند.
بهبود عملکرد و کاهش خطاها
مدل جدید با استفاده از روشهای نظارت جدید و روشهای سنتی مانند یادگیری تقویتی از طریق بازخورد انسانی (RLHF) بهبود یافته است. در یک آزمایش از همه مدلهای قبلی OpenAI (از GPT-۱ تا GPT-۴.۵) خواسته شد که به سوال «چرا آب شور است؟» پاسخ دهند. همان طور که انتظار میرفت، هر مدل نسبت به مدل قبلی پاسخ بهتری ارائه کرد اما وجه تمایز GPT-۴.۵، باعث شد پاسخ آن از نظر زبانی جذابتر و خواندنیتر باشد.
مدل GPT-۴.۵ با برخی از ویژگیهای پیشرفته ChatGPT، از جمله جستوجو (Search)، بوم (Canvas) و آپلود فایل و تصویر سازگار است اما در حال حاضر از قابلیتهای چندحالته مانند «Voice Mode»، ویدئو و اشتراکگذاری صفحه پشتیبانی نمیکند.
عملکرد در تستهای معیار (Benchmarks)
OpenAI برای ارزیابی GPT-۴.۵ از چندین آزمون استاندارد، از جمله ریاضیات رقابتی (AIME ۲۰۲۴)، سوالات علمی در سطح دکتری (GPQA Diamond)، آزمون SWE-Bench برای برنامهنویسی استفاده کرده که در همه این موارد GPT-۴.۵، عملکرد بهتری نسبت به مدل قبلی خود یعنی GPT-۴o داشت.
همچنین در مقایسه با مدل o۳-mini (یک مدل استدلالی جدید که قبل از پاسخ دادن فکر میکند)، GPT-۴.۵ توانست عملکردی نزدیک به این مدل داشته باشد و در برخی آزمونها از آن نیز پیشی بگیرد. یکی از مهمترین مشکلات مدلهای زبانی خطاهای توهمی یا اطلاعات نادرست است، OpenAI، در دو آزمایش مربوط به این موضوع (SimpleQA Accuracy و SimpleQA Hallucination) نشان داد که GPT-۴.۵ دقت بیشتری نسبت به GPT-۴o، o۱ و o۳-mini دارد و کمتر دچار توهم میشود.
امنیت مدل
همانند مدلهای قبلی OpenAI، مدل جدید را تحت آزمایشهای امنیتی قرار داده و تاکید کرده که هرچه توانایی مدلها افزایش پیدا کند، امکان ایمنتر شدن آنها نیز بیشتر میشود. در نسخه GPT-۴.۵، تکنیکهای جدید نظارت با روش یادگیری تقویتی از بازخورد انسانی (RLHF) ترکیب شدهاند.
دسترسی به GPT-۴.۵
GPT-۴.۵ در حال حاضر در مرحله پیشنمایش تحقیقاتی برای کاربران Pro در دسترس است و میتوان از طریق انتخابگر مدل (Model Picker) در نسخههای وب، موبایل و دسکتاپ به آن دسترسی داشت. OpenAI اعلام کرد که هفته آینده این مدل را برای کاربران Plus و Team منتشر خواهد کرد. همچنین کاربران Enterprise و Edu دو هفته دیگر به آن دسترسی خواهند داشت.
مدل GPT-۴.۵ برای توسعهدهندگان نیز در دسترس است و در تمامی برنامههای پولی API (از جمله Chat Completions API ،Assistants API و Batch API) قابل استفاده خواهد بود. همچنین آلتمن در شبکه X اعلام کرد که هدف OpenAI، این بود که مدل را همزمان برای کاربران Pro و Plus منتشر کند اما به دلیل کمبود GPU این اتفاق نیفتاد.
وی افزود که هفته آینده دهها هزار GPU جدید اضافه خواهند شد و مدل به کاربران Plus نیز ارائه خواهد شد.
به طور کلی مدل GPT-۴.۵ با بهبود درک متنی، کاهش توهمات و افزایش تعامل طبیعیتر قویترین مدل عمومی OpenAI، تاکنون محسوب میشود. این مدل با برخی از پیشرفتهترین قابلیتهای ChatGPT سازگار است اما هنوز در حالت چندحالته (Multimodal) ارائه نشده است.