گوگل مدل Gemini ۳ Flash را معرفی کرد
به گزارش خبرنگار اقتصاد معاصر؛ گوگل بهصورت رسمی از مدل جدید Gemini ۳ Flash رونمایی کرد؛ مدلی سریع و کمهزینه که بر پایهی Gemini ۳ (منتشرشده در ماه گذشته) توسعه یافته و از این پس بهعنوان مدل پیشفرض اپلیکیشن Gemini و حالت هوش مصنوعی در جستوجوی گوگل در سراسر جهان استفاده خواهد شد. این اقدام در راستای رقابت مستقیم با OpenAI و مدلهای جدید این شرکت انجام میشود.
مدل Gemini ۳ Flash شش ماه پس از معرفی Gemini ۲.۵ Flash عرضه شده و بهبودهای چشمگیری در عملکرد، سرعت و بهرهوری دارد. بر اساس بنچمارکهای منتشرشده، این مدل در برخی معیارها به سطح مدلهای پیشرفتهای مانند Gemini ۳ Pro و GPT-۵.۲ رسیده است.
عملکرد در بنچمارکها
در بنچمارک Humanity’s Last Exam که برای سنجش دانش و تخصص در حوزههای مختلف طراحی شده، Gemini ۳ Flash بدون استفاده از ابزارها امتیاز ۳۳.۷ درصد را ثبت کرده است. این در حالی است که Gemini ۳ Pro امتیاز ۳۷.۵ درصد، Gemini ۲.۵ Flash امتیاز ۱۱ درصد و GPT-۵.۲ امتیاز ۳۴.۵ درصد را به دست آوردهاند. همچنین در بنچمارک چندوجهی و استدلال MMMU-Pro، مدل جدید گوگل با کسب امتیاز ۸۱.۲ درصد بالاترین عملکرد را در میان رقبا ثبت کرده است.
گوگل اعلام کرده است که Gemini ۳ Flash بهصورت پیشفرض جایگزین Gemini ۲.۵ Flash در اپلیکیشن Gemini میشود. با این حال، کاربران همچنان میتوانند برای پرسشهای تخصصیتر در حوزههایی مانند ریاضی و برنامهنویسی، مدل Gemini ۳ Pro را انتخاب کنند.
به گفتهی گوگل، این مدل توانایی بالایی در درک محتوای چندوجهی دارد. کاربران میتوانند ویدئو، تصویر، نقاشی یا فایل صوتی بارگذاری کنند و پاسخهایی تحلیلی، آموزشی یا تعاملی دریافت کنند. همچنین این مدل در تشخیص نیت کاربران دقیقتر عمل کرده و پاسخهای بصریتری شامل تصاویر و جدولها ارائه میدهد.
قابلیتهای جدید Gemini ۳ Flash در جستوجو
گوگل همچنین اعلام کرد که مدل Gemini ۳ Pro اکنون برای همهی کاربران آمریکایی در بخش جستوجو در دسترس است. علاوه بر این، دسترسی به مدل تصویری Nano Banana Pro نیز برای کاربران بیشتری در ایالات متحده فعال شده است.
به گفتهی گوگل، شرکتهایی مانند JetBrains، Figma، Cursor، Harvey و Latitude هماکنون از Gemini ۳ Flash استفاده میکنند. این مدل از طریق Vertex AI و Gemini Enterprise در اختیار سازمانها قرار گرفته است.
برای توسعهدهندگان نیز Gemini ۳ Flash بهصورت پیشنمایش از طریق API و ابزار کدنویسی جدید گوگل با نام Antigravity در دسترس خواهد بود. گوگل اعلام کرده است که مدل Gemini ۳ Pro در بنچمارک معتبر SWE-bench Verified امتیاز ۷۸ درصد را کسب کرده و پس از GPT-۵.۲ در رتبه دوم قرار دارد. این مدل برای تحلیل ویدئو، استخراج داده و پرسشوپاسخ بصری طراحی شده و به دلیل سرعت بالا، گزینهای مناسب برای پردازشهای تکرارشونده و سریع محسوب میشود.
رقابت با OpenAI
گوگل اعلام کرده است که از زمان عرضه Gemini ۳، روزانه بیش از یک تریلیون توکن از طریق API این شرکت پردازش میشود. این موضوع در بحبوحه رقابت شدید با OpenAI رخ داده است. بر اساس گزارشها، سم آلتمن، مدیرعامل OpenAI، اخیرا پس از کاهش ترافیک ChatGPT همزمان با افزایش سهم بازار گوگل، یادداشت داخلی «Code Red» را برای تیم خود ارسال کرده است. در پی این اتفاق، OpenAI مدل GPT-۵.۲ و یک مدل جدید تولید تصویر را معرفی کرد و از رشد چشمگیر استفاده سازمانی ChatGPT خبر داد.
گوگل در واکنش به این رقابت اعلام کرده است که عرضهی پیدرپی مدلهای جدید در صنعت هوش مصنوعی، باعث پیشرفت سریعتر و تعریف بنچمارکهای تازه برای ارزیابی توانمندی مدلها شده است. با معرفی Gemini ۳ Flash و تبدیل آن به مدل پیشفرض در محصولات مصرفی و سازمانی، گوگل نشان داده است که قصد دارد سهم بیشتری از بازار هوش مصنوعی مولد را به خود اختصاص دهد. تمرکز همزمان این شرکت بر سرعت، کاهش هزینه و بهبود کیفیت پاسخها میتواند موقعیت Gemini را در رقابت مستقیم با OpenAI و سایر بازیگران بزرگ این حوزه تقویت کند. با توجه به شتاب بالای عرضه مدلهای جدید و تشدید رقابت، به نظر میرسد ماههای آینده نقشی تعیینکننده در شکلدهی به آینده بازار هوش مصنوعی داشته باشد.

