تقلای واشینگتن برای امنیت؛ فشار آمریکا بر دو مدل پیشرفته هوش مصنوعی
به گزارش خبرنگار اقتصاد معاصر؛ دولت ایالات متحده روز جمعه به شرکت Anthropic دستور داد فورا دسترسی به دو مورد از قدرتمندترین مدلهای هوش مصنوعی خود یعنی Claude Fable ۵ و Claude Mythos ۵ را متوقف کند و دلیل آن را نگرانیهای امنیت ملی اعلام کرد. Anthropic در شبکه اجتماعی X اعلام کرد که این دستور را اجرا کرده اما تاکید کرد که معتقد است دولت در این تصمیم اشتباه کرده است.
به گفته Anthropic، این دستور شرکت را مجبور میکند دسترسی به هر دو مدل را در سراسر جهان غیرفعال کند، نه فقط برای کاربران خارجی که هدف اصلی محدودیتهای صادراتی دولت بودهاند. سایر مدلهای Anthropic تحت تاثیر این تصمیم قرار نگرفتهاند.
اما چرا این موضوع اهمیت دارد؟ مدل Mythos پیشرفتهترین مدل هوش مصنوعی Anthropic است مدلی که این شرکت در اوایل آوریل بهصورت محدود معرفی کرد و به دلیل توانایی بسیار بالای آن در شناسایی آسیبپذیریهای امنیتی نرمافزار، انتشار عمومی آن را بهشدت محدود نگه داشت. به گفته Anthropic، این مدل در تمام سیستمعاملها و مرورگرهای اصلی که آزمایش شده بود، توانسته نقصهای امنیتی را شناسایی کند. به همین دلیل، بهجای عرضه عمومی، برنامهای کنترلشده به نام Project Glasswing ایجاد شد و این مدل فقط در اختیار حدود ۵۰ سازمان منتخب از جمله Amazon، Apple، Google، Microsoft و CrowdStrike برای کارهای امنیتی دفاعی قرار گرفت.
مدل Fable ۵ که سه روز پیش منتشر شده بود، پاسخ Anthropic به فشارهای تجاری بازار بود؛ نسخهای از Mythos که با لایههای محافظتی (guardrails) طراحی شده تا پاسخدهی در حوزههای پرریسک مانند امنیت سایبری و زیستشناسی را محدود کند و به گفته شرکت، برای استفاده عمومی ایمنتر باشد. بر اساس تستهای بنچمارک شرکت Vals AI، این مدل در زمان عرضه پیشرفتهترین مدل عمومی موجود محسوب میشد.
دستور دولت بهعنوان یک اقدام کنترل صادرات معرفی شده که هدف آن محدود کردن دسترسی افراد خارجی به این مدلها است اما در یک پست وبلاگی مفصل، Anthropic توضیح داده که برداشت آن این است که نگرانی اصلی دولت، یک «جیلبریک احتمالی محدود» (Jailbreak در دنیای هوش مصنوعی یعنی دور زدن محدودیتها و قوانین ایمنی یک مدل) در مدل Fable ۵ بوده است. طبق گفته شرکت، تاکنون دولت فقط شواهد شفاهی از یک دور زدن محدود و غیرعمومی ارائه کرده است؛ روشی که در آن از مدل خواسته میشود یک کدبیس خاص را بخواند و آسیبپذیریهای نرمافزاری را شناسایی کند. Anthropic همچنین میگوید این سطح از قابلیت همین حالا هم در بسیاری از مدلهای عمومی دیگر، از جمله GPT-۵.۵ شرکت OpenAI، وجود دارد و بهطور معمول توسط متخصصان امنیت سایبری برای اهداف دفاعی استفاده میشود.
این شرکت همچنین استدلال میکند که قویترین سازوکارهای ایمنی آن بر پایه سیستمهای مستقل تشخیص (classifier) کار میکنند که جدا از خود مدل عمل میکنند؛ بنابراین حتی اگر کسی بتواند مدل Fable را فریب دهد تا محدودیتها را دور بزند، لایههای اصلی محافظتی همچنان از تولید خروجیهای خطرناک جلوگیری میکنند.
با این حال، این توضیحات برای جلوگیری از اقدام دولت کافی نبوده و Anthropic از این موضوع ناراضی است. این شرکت نوشته است: «ما با این نتیجهگیری که یک جیلبریک محدود بالقوه باید باعث جمعآوری یک مدل تجاری که در اختیار صدها میلیون نفر قرار گرفته شود، موافق نیستیم.» و افزود: «اگر این استاندارد در کل صنعت اعمال شود، عملا توسعه و عرضه تمام مدلهای پیشرفته را متوقف خواهد کرد.»
Anthropic که انتظار میرود امسال عرضه اولیه سهام (IPO) داشته باشد، بخش مهمی از هویت عمومی خود را بر پایه ایمنمحور بودن نسبت به رقبا بنا کرده است اما اکنون این تناقض دیده میشود که همان احتیاط شدید این شرکت در محدود کردن مدل Mythos—مدلی که خود آن را بسیار خطرناک توصیف کرده بود—باعث جلب توجه و دخالت دولت شده است؛ دخالتی که میتواند بیشترین آسیب را به کسبوکارش وارد کند.
سم آلتمن از OpenAI احتمالا از این وضعیت بینصیب نمانده است. وی در ماه آوریل گفته بود که رویکرد Anthropic در قبال Mythos نوعی «بازاریابی مبتنی بر ترس» است. وی در ادامه گفت: «این کار شبیه این است که بگویید ما یک بمب ساختهایم، آماده بودیم آن را روی سرتان بیندازیم، حالا به شما پناهگاه ضد بمب ۱۰۰ میلیون دلاری میفروشیم.» آلتمن پیشبینی نکرده بود که دولت وارد عمل شود اما به نکتهای اشاره کرده بود که اکنون گریبان Anthropic را گرفته است، هرچه بیشتر درباره خطرناک بودن هوش مصنوعی خود صحبت کنید، احتمال اینکه دولتها نیز آن را جدی بگیرند بیشتر میشود.
در نهایت، این اتفاق نشان میدهد که صنعت هوش مصنوعی در نقطهای حساس قرار گرفته است؛ جایی که سرعت پیشرفت فناوری از چارچوبهای قانونی و نظارتی جلوتر حرکت میکند. حالا شرکتها، دولتها و متخصصان امنیت سایبری با این سوال جدی روبهرو هستند که چگونه میتوان بین نوآوری، دسترسی عمومی و امنیت جهانی تعادل برقرار کرد. تصمیم آمریکا درباره Anthropic شاید فقط یک مورد خاص نباشد، بلکه میتواند آغاز دورهای جدید از نظارت سختگیرانهتر بر مدلهای پیشرفته هوش مصنوعی باشد؛ دورهای که مسیر توسعه AI را در سالهای آینده شکل خواهد داد.