به گزارش خبرنگار اقتصاد معاصر؛ گوگل روز سهشنبه از جدیدترین و پیشرفتهترین مدل پایه هوش مصنوعی خود، Gemini ۳ رونمایی کرد. این مدل که تنها هفت ماه پس از عرضه Gemini ۲.۵ منتشر شده، قدرتمندترین مدل زبان بزرگ گوگل تا به امروز است و به سرعت به یکی از جدیترین رقبا در بازار هوش مصنوعی تبدیل شده است. عرضه Gemini ۳ همزمان با انتشار GPT ۵.۱ توسط OpenAI و Sonnet ۴.۵ توسط Anthropic، نشاندهنده سرعت بالای توسعه مدلهای پیشرفته است. نسخه تحقیقاتیتر این مدل با نام Gemini ۳ Deepthink در هفتههای آینده پس از آنکه مراحل بیشتری از تستهای ایمنی را پشت سر بگذارد، برای مشترکین Google AI Ultra عرضه خواهد شد.
تولسی دوشی، مدیر محصول مدل Gemini در گوگل درباره Gemini ۳ گفت که این مدل جهش عظیمی در توانایی استدلال ایجاد کرده و پاسخهای آن با عمق و ظرافتی ارائه میشود که پیشتر دیده نشده است. این توانایی استدلال در بنچمارکهای مستقل نیز مشهود است؛ Gemini ۳ با کسب امتیاز ۳۷.۴ در بنچمارک Humanity’s Last Exam، بالاترین امتیاز ثبتشده را به دست آورده و GPT-۵ Pro را پشت سر گذاشته است. همچنین این مدل در بنچمارک LMArena که رضایت کاربران را میسنجد، صدرنشین شده است.
گوگل اعلام کرده است که اپلیکیشن Gemini هماکنون بیش از ۶۵۰ میلیون کاربر فعال ماهانه دارد و ۱۳ میلیون توسعهدهنده نرمافزار از مدل به عنوان بخشی از جریان کاری خود استفاده میکنند. همزمان با مدل پایه، گوگل رابط برنامهنویسی Google Antigravity را معرفی کرده است؛ یک محیط توسعه یکپارچه عاملمحور که امکان برنامهنویسی چندپنجرهای و تعامل هوشمند با ویرایشگر، ترمینال و مرورگر را فراهم میکند. کورای کاووکچواغلو، مدیر ارشد فناوری DeepMind، اعلام کرده است که این عامل هوش مصنوعی میتواند با ابزارهای توسعه شما کار کند و بهترین کمک را در ساخت برنامه ارائه دهد.
Gemini ۳ علاوه بر توانایی استدلال پیشرفته، در آزمونها و بنچمارکهای مختلف نیز عملکرد چشمگیری داشته است. این مدل در آزمون SimpleQA Verified موفق به کسب ۷۲.۱ درصد پاسخ صحیح شد و در بنچمارک Humanity’s Last Exam بدون استفاده از ابزار، ۳۷.۵ درصد به دست آورد. در زمینه ریاضی و برنامهنویسی نیز رکوردهای جدیدی از جمله MathArena Apex (۲۳.۴ درصد)، WebDev Arena (۱۵۰۴ ELO) و SWE-bench Verified (۷۶.۲درصد تولید کد صحیح) ثبت کرده است. گوگل اعلام کرده است که خروجیهای این مدل مختصرتر، عملیاتیتر و کمتر چاپلوس هستند و میتواند وظایفی مانند مدیریت ایمیلها، ساخت فهرست کارها، ارائه پاسخ پیشنهادی و ایجاد دکمههای عملیاتی را انجام دهد.
با Gemini ۳، ابزار Antigravity به توسعهدهندگان امکان میدهد کد خود را با رویکرد عاملمحور تولید و اصلاح کنند. هوش مصنوعی در این محیط میتواند بهطور خودکار پروژهها را ایجاد یا ویرایش کند و تمام اقدامات به شکل Artifacts به کاربر گزارش میشود تا قابل بررسی باشد. این پلتفرم علاوه بر Gemini، از مدلهایی مانند Claude Sonnet ۴.۵ و GPT-OSS نیز پشتیبانی میکند. توسعهدهندگان همچنان میتوانند از API Gemini برای برنامهنویسی استفاده کنند و ابزار bash سمت کاربر به مدل امکان میدهد دستورات شل تولید کند، به سیستم فایل دسترسی داشته باشد و عملیات خودکار انجام دهد.
در حال حاضر، تنها نسخه Pro از Gemini ۳ عرضه شده و در اپلیکیشن Gemini، AI Studio، Vertex AI و API در دسترس است. ابزار Antigravity نیز برای Windows، Mac و Linux در پیشنمایش قابل استفاده است. Gemini ۳ از روز اول در تجربه جستجوی گوگل فعال خواهد بود و کاربران میتوانند با فعال کردن AI Mode، اطلاعات دقیقتر دریافت کنند. گوگل هنوز زمانبندی رسمی برای انتشار عمومی سایر مدلهای Gemini ۳ یا عرضه نسخه Pro اعلام نکرده است، اما با توجه به آزمایشهای گسترده، انتظار میرود در آینده نزدیک در دسترس عموم قرار گیرد.