نسخه چاپی

گوگل مدل Gemini ۳ Flash را معرفی کرد

گوگل با معرفی مدل جدید Gemini ۳ Flash، آن را به‌عنوان مدل پیش‌فرض اپلیکیشن Gemini و هوش مصنوعی جست‌وجوی خود انتخاب کرد؛ مدلی سریع‌تر و کم‌هزینه‌تر که به گفته این شرکت، در برخی بنچمارک‌ها به عملکرد مدل‌های پیشرفته‌ای مانند GPT-۵.۲ نزدیک شده و رقابت در بازار هوش مصنوعی مولد را وارد مرحله تازه‌ای کرده است.

کد خبر : ۴۱۲۳۶

يکشنبه - 30 آذر 1404

به گزارش خبرنگار اقتصاد معاصر؛ گوگل به‌صورت رسمی از مدل جدید Gemini ۳ Flash رونمایی کرد؛ مدلی سریع و کم‌هزینه که بر پایه‌ی Gemini ۳ (منتشرشده در ماه گذشته) توسعه یافته و از این پس به‌عنوان مدل پیش‌فرض اپلیکیشن Gemini و حالت هوش مصنوعی در جست‌وجوی گوگل در سراسر جهان استفاده خواهد شد. این اقدام در راستای رقابت مستقیم با OpenAI و مدل‌های جدید این شرکت انجام می‌شود.

مدل Gemini ۳ Flash شش ماه پس از معرفی Gemini ۲.۵ Flash عرضه شده و بهبودهای چشمگیری در عملکرد، سرعت و بهره‌وری دارد. بر اساس بنچمارک‌های منتشرشده، این مدل در برخی معیارها به سطح مدل‌های پیشرفته‌ای مانند Gemini ۳ Pro و GPT-۵.۲ رسیده است.

عملکرد در بنچمارک‌ها

در بنچمارک Humanity’s Last Exam که برای سنجش دانش و تخصص در حوزه‌های مختلف طراحی شده، Gemini ۳ Flash بدون استفاده از ابزارها امتیاز ۳۳.۷ درصد را ثبت کرده است. این در حالی است که Gemini ۳ Pro امتیاز ۳۷.۵ درصد، Gemini ۲.۵ Flash امتیاز ۱۱ درصد و GPT-۵.۲ امتیاز ۳۴.۵ درصد را به دست آورده‌اند. همچنین در بنچمارک چندوجهی و استدلال MMMU-Pro، مدل جدید گوگل با کسب امتیاز ۸۱.۲ درصد بالاترین عملکرد را در میان رقبا ثبت کرده است.

گوگل اعلام کرده است که Gemini ۳ Flash به‌صورت پیش‌فرض جایگزین Gemini ۲.۵ Flash در اپلیکیشن Gemini می‌شود. با این حال، کاربران همچنان می‌توانند برای پرسش‌های تخصصی‌تر در حوزه‌هایی مانند ریاضی و برنامه‌نویسی، مدل Gemini ۳ Pro را انتخاب کنند.

به گفته‌ی گوگل، این مدل توانایی بالایی در درک محتوای چندوجهی دارد. کاربران می‌توانند ویدئو، تصویر، نقاشی یا فایل صوتی بارگذاری کنند و پاسخ‌هایی تحلیلی، آموزشی یا تعاملی دریافت کنند. همچنین این مدل در تشخیص نیت کاربران دقیق‌تر عمل کرده و پاسخ‌های بصری‌تری شامل تصاویر و جدول‌ها ارائه می‌دهد.

قابلیت‌های جدید Gemini ۳ Flash در جست‌وجو

گوگل همچنین اعلام کرد که مدل Gemini ۳ Pro اکنون برای همه‌ی کاربران آمریکایی در بخش جست‌وجو در دسترس است. علاوه بر این، دسترسی به مدل تصویری Nano Banana Pro نیز برای کاربران بیشتری در ایالات متحده فعال شده است.

به گفته‌ی گوگل، شرکت‌هایی مانند JetBrains، Figma، Cursor، Harvey و Latitude هم‌اکنون از Gemini ۳ Flash استفاده می‌کنند. این مدل از طریق Vertex AI و Gemini Enterprise در اختیار سازمان‌ها قرار گرفته است.

برای توسعه‌دهندگان نیز Gemini ۳ Flash به‌صورت پیش‌نمایش از طریق API و ابزار کدنویسی جدید گوگل با نام Antigravity در دسترس خواهد بود. گوگل اعلام کرده است که مدل Gemini ۳ Pro در بنچمارک معتبر SWE-bench Verified امتیاز ۷۸ درصد را کسب کرده و پس از GPT-۵.۲ در رتبه دوم قرار دارد. این مدل برای تحلیل ویدئو، استخراج داده و پرسش‌وپاسخ بصری طراحی شده و به دلیل سرعت بالا، گزینه‌ای مناسب برای پردازش‌های تکرارشونده و سریع محسوب می‌شود.

رقابت با OpenAI

گوگل اعلام کرده است که از زمان عرضه Gemini ۳، روزانه بیش از یک تریلیون توکن از طریق API این شرکت پردازش می‌شود. این موضوع در بحبوحه رقابت شدید با OpenAI رخ داده است. بر اساس گزارش‌ها، سم آلتمن، مدیرعامل OpenAI، اخیرا پس از کاهش ترافیک ChatGPT هم‌زمان با افزایش سهم بازار گوگل، یادداشت داخلی «Code Red» را برای تیم خود ارسال کرده است. در پی این اتفاق، OpenAI مدل GPT-۵.۲ و یک مدل جدید تولید تصویر را معرفی کرد و از رشد چشمگیر استفاده سازمانی ChatGPT خبر داد.

گوگل در واکنش به این رقابت اعلام کرده است که عرضه‌ی پی‌درپی مدل‌های جدید در صنعت هوش مصنوعی، باعث پیشرفت سریع‌تر و تعریف بنچمارک‌های تازه برای ارزیابی توانمندی مدل‌ها شده است. با معرفی Gemini ۳ Flash و تبدیل آن به مدل پیش‌فرض در محصولات مصرفی و سازمانی، گوگل نشان داده است که قصد دارد سهم بیشتری از بازار هوش مصنوعی مولد را به خود اختصاص دهد. تمرکز هم‌زمان این شرکت بر سرعت، کاهش هزینه و بهبود کیفیت پاسخ‌ها می‌تواند موقعیت Gemini را در رقابت مستقیم با OpenAI و سایر بازیگران بزرگ این حوزه تقویت کند. با توجه به شتاب بالای عرضه مدل‌های جدید و تشدید رقابت، به نظر می‌رسد ماه‌های آینده نقشی تعیین‌کننده در شکل‌دهی به آینده بازار هوش مصنوعی داشته باشد.