اقتصاد کلان

اقتصاد کلان

بانک

صنعت

کشاورزی

راه و مسکن

اقتصاد بین الملل

انرژی

بازرگانی

بورس

فناوری

سیاست و اقتصاد

کارآفرینی و تعاون

بازار

چند رسانه ای

۳۰/ارديبهشت/۱۴۰۵ | ۱۸:۳۳
۱۸:۱۹ ۱۴۰۵/۰۲/۳۰

گوگل هوش مصنوعی را به قلب زندگی روزمره آورد؛ Gemini Spark و Omni معرفی شدند

گوگل در رویداد Google I/O ۲۰۲۶ از نسل تازه‌ای از فناوری‌های هوش مصنوعی رونمایی کرد؛ محصولاتی که به گفته این شرکت، قرار است نقش AI را از یک ابزار پاسخ‌دهنده به یک «عامل انجام‌دهنده» تغییر دهند.
کد خبر:۵۰۸۳۰

به گزارش خبرنگار اقتصاد معاصر؛ رویداد Google I/O ۲۰۲۶ بیش از هر سال دیگری نشان داد که گوگل در حال بازتعریف جایگاه هوش مصنوعی در زندگی روزمره کاربران است. این شرکت در جریان این رویداد، مجموعه‌ای از مدل‌ها و ابزارهای جدید خود را معرفی کرد که هدف مشترک آن‌ها عبور از نسل «چت‌بات‌های پاسخ‌دهنده» و ورود به عصر «عامل‌های هوش مصنوعی انجام‌دهنده» است؛ سیستم‌هایی که فقط به پرسش‌ها پاسخ نمی‌دهند، بلکه قادرند وظایف را اجرا نمایند، پروژه‌ها را مدیریت کنند و حتی در برخی موارد تصمیم‌های اجرایی بگیرند. 

در قلب این تحول، مدل چند وجهی Gemini Omni، سیستم عامل‌محور Gemini Spark  و نسل تازه مدل‌های Gemini ۳.۵ Flash  و Gemini ۳.۵ Pro   قرار دارند؛ محصولاتی که هر یک بخشی از چشم‌انداز جدید گوگل در حوزه هوش مصنوعی را شکل می‌دهند.

Gemini Omni؛ مدلی چندوجهی برای درک و شبیه‌سازی جهان واقعی

گوگل در بخش اصلی مراسم از Gemini Omni به‌ عنوان پیشرفته‌ترین مدل چندوجهی خود رونمایی کرد؛ مدلی که تفاوت اصلی آن با ابزارهای تولید ویدیو مبتنی بر متن مانند Sora یا Veo در توانایی درک هم‌زمان چند نوع ورودی است. این مدل می‌تواند متن، تصویر و ویدیو را به‌ طور هم‌زمان دریافت و تحلیل کند و در نهایت خروجی ویدیویی طبیعی و منطبق با قوانین فیزیکی تولید نماید. به گفته گوگل، Omni  را باید فراتر از یک ابزار تولید محتوا دانست؛ این مدل در واقع توانایی استدلال پیشرفته دارد و می‌تواند رفتار اشیا، نور، حرکت و قوانین فیزیک را در ویدیوهای تولیدی شبیه‌سازی کند. این فناوری بر پایه معماری Gemini توسعه یافته و ادامه مسیر نسل‌های پیشین محصولات گوگل محسوب می‌شود که اکنون با عمق بیشتری در حوزه چند وجهی یکپارچه شده‌اند.

ویرایش ویدیو در سطحی بی‌سابقه

قابلیت‌های Omni فقط به تولید ویدیو محدود نمی‌شود، این مدل یک ویرایشگر پیشرفته نیز به شمار می‌رود. کاربران می‌توانند ویدیوی تولیدشده را دوباره به مدل ارائه دهند، با یک دستور ساده بخش‌هایی از آن را تغییر دهند، عناصر جدید به صحنه اضافه کنند یا حتی ویدیوهای شخصی خود را آپلود کرده و بخش‌هایی از آن را جایگزین کنند. این سطح از انعطاف در ویرایش، نگرانی‌هایی را نیز در خصوص امکان تغییر واقعیت و تولید محتوای جعلی به همراه داشته است. گوگل برای مقابله با این مساله اعلام کرده که همه خروجی‌ها با برچسب SynthID مشخص می‌شوند تا قابل تشخیص باشد که محتوا توسط هوش مصنوعی تولید یا دستکاری شده است.

نسخه‌ها و نحوه دسترسی Gemini Omni  در دو نسخه معرفی شده است. Omni Flash؛ نسخه سبک‌تر که در حال حاضر فعال است و Omni Pro؛ نسخه قدرتمندتر که در آینده عرضه خواهد شد. این مدل از طریق اپلیکیشن جدید  Gemini، پلتفرم Google Flow و همچنین YouTube Shorts در دسترس قرار گرفته و طبق اعلام گوگل، API  آن نیز طی هفته‌های آینده منتشر می‌شود.

آیا Omni فقط حجم محتوای بی‌کیفیت را افزایش می‌دهد؟

در کنار هیجان گسترده ناشی از معرفی Omni، برخی تحلیلگران نگاه انتقادی‌تری به این فناوری داشته‌اند. در یکی از گزارش‌های منتشرشده هم‌زمان با رویداد، این دیدگاه مطرح شده که بازار ابزارهای تولید محتوای مبتنی بر هوش مصنوعی پیش از این نیز اشباع بوده و Omni  نوآوری مشخصی در پاسخ به نیاز واقعی کاربران ایجاد نمی‌کند. در بخشی از این انتقادها آمده است: «بازار از این ابزارها اشباع شده است. Omni فقط حجم بیشتری از محتوای بی‌ارزش تولیدی هوش مصنوعی را وارد فضای دیجیتال می‌کند.»

این انتقادها با داده‌های جدید نیز همراه شده است. بر اساس این داده‌ها، ۵۱ درصد از بزرگسالان آمریکا خواهان برچسب‌گذاری شفاف‌تر برای محتوای تولیدشده با هوش مصنوعی هستند، ۲۱ درصد حتی خواهان ممنوعیت کامل چنین محتوایی در شبکه‌های اجتماعی‌اند و فقط ۱۱ درصد کاربران محتوای تولیدشده با AI را مفید یا سرگرم‌کننده ارزیابی کرده‌اند.

همچنین ۹۴ درصد افراد اعلام کرده‌اند که با محتوای تولیدشده توسط هوش مصنوعی مواجه شده‌اند، با این حال فقط ۴۴ درصد مطمئن هستند که می‌توانند محتوای واقعی را از محتوای جعلی تشخیص دهند. منتقدان در ادامه به یک تناقض اساسی در سیاست‌های گوگل اشاره می‌کنند؛ شرکتی که از یک سو ابزارهای تولید محتوای مبتنی بر هوش مصنوعی را ارائه می‌دهد و از سوی دیگر، در حال توسعه ابزارهای تشخیص همین محتوا نیز هست.

Gemini ۳.۵ Flash  و  Pro؛ نسل جدید مدل‌های عامل‌محور گوگل

در ادامه مراسم از دو مدل جدید Gemini ۳.۵ Flash  و Gemini ۳.۵ Pro  نیز رونمایی کرد. نسخه Flash  که هم‌اکنون در دسترس قرار گرفته، به‌طور ویژه برای اجرای عامل‌های هوش مصنوعی (Agentic AI)  طراحی شده است؛ سیستم‌هایی که می‌توانند وظایف پیچیده و بلندمدت مانند تحقیق، برنامه‌نویسی یا تحلیل داده را به‌صورت خودکار انجام دهند.

ساندار پیچای، مدیرعامل گوگل، این مدل را «بسیار سریع» و در عین حال «با هزینه‌ای نصف رقبا» توصیف کرد. نسخه Pro نیز در حال حاضر در مرحله آزمایش داخلی قرار دارد و انتظار می‌رود در آینده نزدیک در اختیار کاربران قرار بگیرد.

Gemini Spark؛ دستیار همیشه فعال برای انجام کارهای روزمره

 یکی از مهم‌ترین معرفی‌های این رویداد، Gemini Spark  بود؛ یک عامل هوش مصنوعی شخصی که به‌صورت مداوم در پس‌زمینه فعال است و می‌تواند به جای کاربر، وظایف واقعی را انجام دهد. Spark  به سرویس‌هایی مانند  Gmail، Google Docs، چت‌ها و Workspace متصل است و قابلیت انجام مجموعه‌ای از کارهای روزمره را دارد.

نمونه وظایفی که Spark انجام می‌دهد مدیریت ایمیل‌ها و تهیه خلاصه هفتگی برنامه‌ریزی رویدادها و پیگیری پاسخ دعوت‌ها (RSVP) هماهنگی خریدها و سفارش غذا، بررسی قوانین محلی برای برگزاری رویدادها و مهمانی‌ها، تبدیل ایده‌های پراکنده به برنامه‌های ساختاریافته، مدیریت تقویم و یادآوری وظایف روزانه است. نکته مهم اینجاست که Spark به‌صورت مداوم فعال است، داده‌های جدید را پردازش می‌کند و بدون نیاز به دخالت مستقیم کاربر، پروژه‌ها را پیش می‌برد.

زمان و نحوه دسترسی ابتدا در دسترس گروه محدودی از کاربران قرار می‌گیرد، سپس برای مشترکان Google AI Ultra با هزینه ماهانه بین ۱۰۰ تا ۲۰۰ دلار عرضه خواهد شد. این قابلیت در اواخر تابستان از طریق Chrome ارائه می‌شود و در ادامه برای سیستم ‌عامل Android Halo نیز در دسترس قرار خواهد گرفت.

قابلیت‌های صوتی Gemini و Spark در مسیر macOS

گوگل اعلام کرده که در تابستان امسال، قابلیت‌های صوتی Gemini و همچنین سیستم Spark به اپلیکیشن macOS اضافه خواهد شد. کاربران مک می‌توانند با نگه داشتن کلید Function و استفاده از فرمان صوتی، مجموعه‌ای از فایل‌ها را تحلیل یا تبدیل کنند.

در یکی از نسخه‌های نمایشی ارائه ‌شده، Gemini  توانست به‌ طور هم‌زمان یک ایمیل دوستانه تولید کند و داده‌های چند فایل مختلف را به یک جدول منظم تبدیل نماید. این قابلیت‌ها نشان می‌دهد گوگل در حال حرکت به سمتی است که هوش مصنوعی نه یک ابزار جداگانه، بلکه بخشی یکپارچه از سیستم‌ عامل‌ها و محیط کاری کاربران باشد.

گوگل با عینک‌های هوشمند مجهز به Gemini دوباره وارد رقابت گجت‌های پوشیدنی شد

گوگل در جریان رویداد Google I/O ۲۰۲۶ از نسل جدید عینک‌های هوشمند مبتنی بر هوش مصنوعی رونمایی کرد؛ محصولی که نشان می‌دهد این شرکت پس از سال‌ها بار دیگر به‌صورت جدی وارد بازار گجت‌های پوشیدنی شده است. گوگل اعلام کرد این عینک‌ها با همکاری برندهای Warby Parker و Gentle Monster توسعه یافته‌اند و طراحی و هماهنگی فنی آن‌ها نیز با مشارکت سامسونگ انجام شده است.

این عینک‌های جدید که گوگل آن‌ها را «Audio Glasses» یا عینک‌های صوتی می‌نامد، به کاربران اجازه می‌دهند تنها از طریق فرمان‌های صوتی، کارهای مختلفی را انجام دهند. این دستگاه‌ها به سرویس‌های گوگل و مدل هوش مصنوعی Gemini متصل هستند و می‌توانند وظایفی مانند ثبت سفارش آنلاین، اجرای دستورات، پاسخ‌گویی و تعامل با اپلیکیشن‌ها را انجام دهند.

در یکی از پیش‌نمایش‌های ارائه‌ شده در مراسم، یکی از کارکنان گوگل فقط با صحبت کردن با عینک، سفارش قهوه را به‌صورت آنلاین ثبت کرد و سیستم پس از پردازش فرمان، عملیات را اجرا کرد.

گوگل پیش‌تر نیز تجربه ورود به این بازار را با پروژه Google Glass داشت؛ محصولی که اگرچه در زمان خود توجه زیادی جلب کرد اما در نهایت با استقبال گسترده کاربران مواجه نشد. با این حال، بازار عینک‌های هوشمند طی سال‌های اخیر تغییرات زیادی کرده و شرکت‌هایی مانند Meta سرمایه‌گذاری سنگینی روی این حوزه انجام داده‌اند. گوگل اعلام کرده نسل جدید عینک‌های هوشمندش با دستگاه‌های Android و iOS سازگار خواهد بود و عرضه آن برای اواخر سال جاری برنامه‌ریزی شده است.

در نهایت حرکت گوگل به سمت هوش مصنوعی عملگرا در رویداد Google I/O ۲۰۲۶ به‌روشنی نشان داد که گوگل استراتژی خود را به سمت نسل جدیدی از هوش مصنوعی تغییر داده است؛ نسلی که در آن سیستم‌ها فقط پاسخ ‌دهنده نیستند، بلکه وظایف را انجام می‌دهند، پروژه‌ها را مدیریت می‌کنند، تصمیم‌های اجرایی اتخاذ می‌کنند و به‌صورت دائمی در پس‌زمینه زندگی دیجیتال کاربران فعال‌اند.

با این حال، هم‌زمان با این پیشرفت‌ها، نگرانی‌های جدی درباره اعتماد، امنیت داده‌ها و کیفیت محتوای تولید شده نیز مطرح است؛ موضوعاتی که به نظر می‌رسد در سال‌های آینده به محور اصلی رقابت شرکت‌های فناوری و بحث‌های عمومی کاربران تبدیل خواهند شد.

ارسال نظرات
captcha