گوگل Gemini ۳ را رونمایی کرد؛ هوش مصنوعی پیشرفته با توانایی استدلال

به گزارش خبرنگار اقتصاد معاصر؛ گوگل روز سه‌شنبه از جدیدترین و پیشرفته‌ترین مدل پایه هوش مصنوعی خود، Gemini ۳ رونمایی کرد. این مدل که تنها هفت ماه پس از عرضه Gemini ۲.۵ منتشر شده، قدرتمندترین مدل زبان بزرگ گوگل تا به امروز است و به سرعت به یکی از جدی‌ترین رقبا در بازار هوش مصنوعی تبدیل شده است. عرضه Gemini ۳ هم‌زمان با انتشار GPT ۵.۱ توسط OpenAI و Sonnet ۴.۵ توسط Anthropic، نشان‌دهنده سرعت بالای توسعه مدل‌های پیشرفته است. نسخه تحقیقاتی‌تر این مدل با نام Gemini ۳ Deepthink در هفته‌های آینده پس از آنکه مراحل بیشتری از تست‌های ایمنی را پشت سر بگذارد، برای مشترکین Google AI Ultra عرضه خواهد شد.

تولسی دوشی، مدیر محصول مدل Gemini در گوگل درباره Gemini ۳ گفت که این مدل جهش عظیمی در توانایی استدلال ایجاد کرده و پاسخ‌های آن با عمق و ظرافتی ارائه می‌شود که پیش‌تر دیده نشده است. این توانایی استدلال در بنچمارک‌های مستقل نیز مشهود است؛ Gemini ۳ با کسب امتیاز ۳۷.۴ در بنچمارک Humanity’s Last Exam، بالاترین امتیاز ثبت‌شده را به دست آورده و GPT-۵ Pro را پشت سر گذاشته است. همچنین این مدل در بنچمارک LMArena که رضایت کاربران را می‌سنجد، صدرنشین شده است.

گوگل اعلام کرده است که اپلیکیشن Gemini هم‌اکنون بیش از ۶۵۰ میلیون کاربر فعال ماهانه دارد و ۱۳ میلیون توسعه‌دهنده نرم‌افزار از مدل به عنوان بخشی از جریان کاری خود استفاده می‌کنند. هم‌زمان با مدل پایه، گوگل رابط برنامه‌نویسی Google Antigravity را معرفی کرده است؛ یک محیط توسعه یکپارچه عامل‌محور که امکان برنامه‌نویسی چندپنجره‌ای و تعامل هوشمند با ویرایشگر، ترمینال و مرورگر را فراهم می‌کند. کورای کاووکچواغلو، مدیر ارشد فناوری DeepMind، اعلام کرده است که این عامل هوش مصنوعی می‌تواند با ابزار‌های توسعه شما کار کند و بهترین کمک را در ساخت برنامه ارائه دهد.

Gemini ۳ علاوه بر توانایی استدلال پیشرفته، در آزمون‌ها و بنچمارک‌های مختلف نیز عملکرد چشمگیری داشته است. این مدل در آزمون SimpleQA Verified موفق به کسب ۷۲.۱ درصد پاسخ صحیح شد و در بنچمارک Humanity’s Last Exam بدون استفاده از ابزار، ۳۷.۵ درصد به دست آورد. در زمینه ریاضی و برنامه‌نویسی نیز رکورد‌های جدیدی از جمله MathArena Apex (۲۳.۴ درصد)، WebDev Arena (۱۵۰۴ ELO) و SWE-bench Verified (۷۶.۲درصد تولید کد صحیح) ثبت کرده است. گوگل اعلام کرده است که خروجی‌های این مدل مختصرتر، عملیاتی‌تر و کمتر چاپلوس هستند و می‌تواند وظایفی مانند مدیریت ایمیل‌ها، ساخت فهرست کارها، ارائه پاسخ پیشنهادی و ایجاد دکمه‌های عملیاتی را انجام دهد.

با Gemini ۳، ابزار Antigravity به توسعه‌دهندگان امکان می‌دهد کد خود را با رویکرد عامل‌محور تولید و اصلاح کنند. هوش مصنوعی در این محیط می‌تواند به‌طور خودکار پروژه‌ها را ایجاد یا ویرایش کند و تمام اقدامات به شکل Artifacts به کاربر گزارش می‌شود تا قابل بررسی باشد. این پلتفرم علاوه بر Gemini، از مدل‌هایی مانند Claude Sonnet ۴.۵ و GPT-OSS نیز پشتیبانی می‌کند. توسعه‌دهندگان همچنان می‌توانند از API Gemini برای برنامه‌نویسی استفاده کنند و ابزار bash سمت کاربر به مدل امکان می‌دهد دستورات شل تولید کند، به سیستم فایل دسترسی داشته باشد و عملیات خودکار انجام دهد.

در حال حاضر، تنها نسخه Pro از Gemini ۳ عرضه شده و در اپلیکیشن Gemini، AI Studio، Vertex AI و API در دسترس است. ابزار Antigravity نیز برای Windows، Mac و Linux در پیش‌نمایش قابل استفاده است. Gemini ۳ از روز اول در تجربه جستجوی گوگل فعال خواهد بود و کاربران می‌توانند با فعال کردن AI Mode، اطلاعات دقیق‌تر دریافت کنند. گوگل هنوز زمان‌بندی رسمی برای انتشار عمومی سایر مدل‌های Gemini ۳ یا عرضه نسخه Pro اعلام نکرده است، اما با توجه به آزمایش‌های گسترده، انتظار می‌رود در آینده نزدیک در دسترس عموم قرار گیرد.