به گزارش خبرنگار اقتصاد معاصر؛ رویداد Google I/O ۲۰۲۶ بیش از هر سال دیگری نشان داد که گوگل در حال بازتعریف جایگاه هوش مصنوعی در زندگی روزمره کاربران است. این شرکت در جریان این رویداد، مجموعهای از مدلها و ابزارهای جدید خود را معرفی کرد که هدف مشترک آنها عبور از نسل «چتباتهای پاسخدهنده» و ورود به عصر «عاملهای هوش مصنوعی انجامدهنده» است؛ سیستمهایی که فقط به پرسشها پاسخ نمیدهند، بلکه قادرند وظایف را اجرا نمایند، پروژهها را مدیریت کنند و حتی در برخی موارد تصمیمهای اجرایی بگیرند.
در قلب این تحول، مدل چند وجهی Gemini Omni، سیستم عاملمحور Gemini Spark و نسل تازه مدلهای Gemini ۳.۵ Flash و Gemini ۳.۵ Pro قرار دارند؛ محصولاتی که هر یک بخشی از چشمانداز جدید گوگل در حوزه هوش مصنوعی را شکل میدهند.
گوگل در بخش اصلی مراسم از Gemini Omni به عنوان پیشرفتهترین مدل چندوجهی خود رونمایی کرد؛ مدلی که تفاوت اصلی آن با ابزارهای تولید ویدیو مبتنی بر متن مانند Sora یا Veo در توانایی درک همزمان چند نوع ورودی است. این مدل میتواند متن، تصویر و ویدیو را به طور همزمان دریافت و تحلیل کند و در نهایت خروجی ویدیویی طبیعی و منطبق با قوانین فیزیکی تولید نماید. به گفته گوگل، Omni را باید فراتر از یک ابزار تولید محتوا دانست؛ این مدل در واقع توانایی استدلال پیشرفته دارد و میتواند رفتار اشیا، نور، حرکت و قوانین فیزیک را در ویدیوهای تولیدی شبیهسازی کند. این فناوری بر پایه معماری Gemini توسعه یافته و ادامه مسیر نسلهای پیشین محصولات گوگل محسوب میشود که اکنون با عمق بیشتری در حوزه چند وجهی یکپارچه شدهاند.
قابلیتهای Omni فقط به تولید ویدیو محدود نمیشود، این مدل یک ویرایشگر پیشرفته نیز به شمار میرود. کاربران میتوانند ویدیوی تولیدشده را دوباره به مدل ارائه دهند، با یک دستور ساده بخشهایی از آن را تغییر دهند، عناصر جدید به صحنه اضافه کنند یا حتی ویدیوهای شخصی خود را آپلود کرده و بخشهایی از آن را جایگزین کنند. این سطح از انعطاف در ویرایش، نگرانیهایی را نیز در خصوص امکان تغییر واقعیت و تولید محتوای جعلی به همراه داشته است. گوگل برای مقابله با این مساله اعلام کرده که همه خروجیها با برچسب SynthID مشخص میشوند تا قابل تشخیص باشد که محتوا توسط هوش مصنوعی تولید یا دستکاری شده است.
نسخهها و نحوه دسترسی Gemini Omni در دو نسخه معرفی شده است. Omni Flash؛ نسخه سبکتر که در حال حاضر فعال است و Omni Pro؛ نسخه قدرتمندتر که در آینده عرضه خواهد شد. این مدل از طریق اپلیکیشن جدید Gemini، پلتفرم Google Flow و همچنین YouTube Shorts در دسترس قرار گرفته و طبق اعلام گوگل، API آن نیز طی هفتههای آینده منتشر میشود.
در کنار هیجان گسترده ناشی از معرفی Omni، برخی تحلیلگران نگاه انتقادیتری به این فناوری داشتهاند. در یکی از گزارشهای منتشرشده همزمان با رویداد، این دیدگاه مطرح شده که بازار ابزارهای تولید محتوای مبتنی بر هوش مصنوعی پیش از این نیز اشباع بوده و Omni نوآوری مشخصی در پاسخ به نیاز واقعی کاربران ایجاد نمیکند. در بخشی از این انتقادها آمده است: «بازار از این ابزارها اشباع شده است. Omni فقط حجم بیشتری از محتوای بیارزش تولیدی هوش مصنوعی را وارد فضای دیجیتال میکند.»
این انتقادها با دادههای جدید نیز همراه شده است. بر اساس این دادهها، ۵۱ درصد از بزرگسالان آمریکا خواهان برچسبگذاری شفافتر برای محتوای تولیدشده با هوش مصنوعی هستند، ۲۱ درصد حتی خواهان ممنوعیت کامل چنین محتوایی در شبکههای اجتماعیاند و فقط ۱۱ درصد کاربران محتوای تولیدشده با AI را مفید یا سرگرمکننده ارزیابی کردهاند.
همچنین ۹۴ درصد افراد اعلام کردهاند که با محتوای تولیدشده توسط هوش مصنوعی مواجه شدهاند، با این حال فقط ۴۴ درصد مطمئن هستند که میتوانند محتوای واقعی را از محتوای جعلی تشخیص دهند. منتقدان در ادامه به یک تناقض اساسی در سیاستهای گوگل اشاره میکنند؛ شرکتی که از یک سو ابزارهای تولید محتوای مبتنی بر هوش مصنوعی را ارائه میدهد و از سوی دیگر، در حال توسعه ابزارهای تشخیص همین محتوا نیز هست.
در ادامه مراسم از دو مدل جدید Gemini ۳.۵ Flash و Gemini ۳.۵ Pro نیز رونمایی کرد. نسخه Flash که هماکنون در دسترس قرار گرفته، بهطور ویژه برای اجرای عاملهای هوش مصنوعی (Agentic AI) طراحی شده است؛ سیستمهایی که میتوانند وظایف پیچیده و بلندمدت مانند تحقیق، برنامهنویسی یا تحلیل داده را بهصورت خودکار انجام دهند.
ساندار پیچای، مدیرعامل گوگل، این مدل را «بسیار سریع» و در عین حال «با هزینهای نصف رقبا» توصیف کرد. نسخه Pro نیز در حال حاضر در مرحله آزمایش داخلی قرار دارد و انتظار میرود در آینده نزدیک در اختیار کاربران قرار بگیرد.
یکی از مهمترین معرفیهای این رویداد، Gemini Spark بود؛ یک عامل هوش مصنوعی شخصی که بهصورت مداوم در پسزمینه فعال است و میتواند به جای کاربر، وظایف واقعی را انجام دهد. Spark به سرویسهایی مانند Gmail، Google Docs، چتها و Workspace متصل است و قابلیت انجام مجموعهای از کارهای روزمره را دارد.
نمونه وظایفی که Spark انجام میدهد مدیریت ایمیلها و تهیه خلاصه هفتگی برنامهریزی رویدادها و پیگیری پاسخ دعوتها (RSVP) هماهنگی خریدها و سفارش غذا، بررسی قوانین محلی برای برگزاری رویدادها و مهمانیها، تبدیل ایدههای پراکنده به برنامههای ساختاریافته، مدیریت تقویم و یادآوری وظایف روزانه است. نکته مهم اینجاست که Spark بهصورت مداوم فعال است، دادههای جدید را پردازش میکند و بدون نیاز به دخالت مستقیم کاربر، پروژهها را پیش میبرد.
زمان و نحوه دسترسی ابتدا در دسترس گروه محدودی از کاربران قرار میگیرد، سپس برای مشترکان Google AI Ultra با هزینه ماهانه بین ۱۰۰ تا ۲۰۰ دلار عرضه خواهد شد. این قابلیت در اواخر تابستان از طریق Chrome ارائه میشود و در ادامه برای سیستم عامل Android Halo نیز در دسترس قرار خواهد گرفت.
گوگل اعلام کرده که در تابستان امسال، قابلیتهای صوتی Gemini و همچنین سیستم Spark به اپلیکیشن macOS اضافه خواهد شد. کاربران مک میتوانند با نگه داشتن کلید Function و استفاده از فرمان صوتی، مجموعهای از فایلها را تحلیل یا تبدیل کنند.
در یکی از نسخههای نمایشی ارائه شده، Gemini توانست به طور همزمان یک ایمیل دوستانه تولید کند و دادههای چند فایل مختلف را به یک جدول منظم تبدیل نماید. این قابلیتها نشان میدهد گوگل در حال حرکت به سمتی است که هوش مصنوعی نه یک ابزار جداگانه، بلکه بخشی یکپارچه از سیستم عاملها و محیط کاری کاربران باشد.
گوگل در جریان رویداد Google I/O ۲۰۲۶ از نسل جدید عینکهای هوشمند مبتنی بر هوش مصنوعی رونمایی کرد؛ محصولی که نشان میدهد این شرکت پس از سالها بار دیگر بهصورت جدی وارد بازار گجتهای پوشیدنی شده است. گوگل اعلام کرد این عینکها با همکاری برندهای Warby Parker و Gentle Monster توسعه یافتهاند و طراحی و هماهنگی فنی آنها نیز با مشارکت سامسونگ انجام شده است.
این عینکهای جدید که گوگل آنها را «Audio Glasses» یا عینکهای صوتی مینامد، به کاربران اجازه میدهند تنها از طریق فرمانهای صوتی، کارهای مختلفی را انجام دهند. این دستگاهها به سرویسهای گوگل و مدل هوش مصنوعی Gemini متصل هستند و میتوانند وظایفی مانند ثبت سفارش آنلاین، اجرای دستورات، پاسخگویی و تعامل با اپلیکیشنها را انجام دهند.
در یکی از پیشنمایشهای ارائه شده در مراسم، یکی از کارکنان گوگل فقط با صحبت کردن با عینک، سفارش قهوه را بهصورت آنلاین ثبت کرد و سیستم پس از پردازش فرمان، عملیات را اجرا کرد.
گوگل پیشتر نیز تجربه ورود به این بازار را با پروژه Google Glass داشت؛ محصولی که اگرچه در زمان خود توجه زیادی جلب کرد اما در نهایت با استقبال گسترده کاربران مواجه نشد. با این حال، بازار عینکهای هوشمند طی سالهای اخیر تغییرات زیادی کرده و شرکتهایی مانند Meta سرمایهگذاری سنگینی روی این حوزه انجام دادهاند. گوگل اعلام کرده نسل جدید عینکهای هوشمندش با دستگاههای Android و iOS سازگار خواهد بود و عرضه آن برای اواخر سال جاری برنامهریزی شده است.
در نهایت حرکت گوگل به سمت هوش مصنوعی عملگرا در رویداد Google I/O ۲۰۲۶ بهروشنی نشان داد که گوگل استراتژی خود را به سمت نسل جدیدی از هوش مصنوعی تغییر داده است؛ نسلی که در آن سیستمها فقط پاسخ دهنده نیستند، بلکه وظایف را انجام میدهند، پروژهها را مدیریت میکنند، تصمیمهای اجرایی اتخاذ میکنند و بهصورت دائمی در پسزمینه زندگی دیجیتال کاربران فعالاند.
با این حال، همزمان با این پیشرفتها، نگرانیهای جدی درباره اعتماد، امنیت دادهها و کیفیت محتوای تولید شده نیز مطرح است؛ موضوعاتی که به نظر میرسد در سالهای آینده به محور اصلی رقابت شرکتهای فناوری و بحثهای عمومی کاربران تبدیل خواهند شد.