هوش مصنوعی چینی کاخ سفید را ترساند
چهارشنبه 10 بهمن 1403 - 20:55:32
|
|
ایرانیان جهان - به گزارش ، کاخ سفید تصمیم دارد درباره هوش مصنوعی چینی دیپ سیک تحقیق کند اما شواهد حاکی از آن است که این فناوری بسیار ساده تر و کم هزینه تر از مدل های آمریکایی است. به گفته کارولین لیویت، سخنگوی کاخ سفید، مقامات آمریکایی مشغول بررسی پیامدهای امنیت ملی هوش مصنوعی چینی «دیپ سیک» هستند. این درحالی است که تزار رمزارز دونالد ترامپ اعلام کرد در این زمینه احتمالا سرقت مالکیت معنوی رخ داده است! لیویت در این باره افزود: این یک زنگ هوشیار برای صنعت هوش مصنوعی آمریکا است. بیشتر بخوانید: اخبار روز خبربان سخنان او انعکاسی از اظهارات ترامپ است. وی همچنین اظهار کرد کاخ سفید تلاش می کند تا تسلط هوش مصنوعی آمریکا بر بازار را تضمین کند. رویترز با انتشار این مطلب آورده است: سرمایه گذاران بازار سهام در سراسر جهان روز دوشنبه سهام شرکت های فناوری را به دلیل نگرانی ها درباره ظهور یک مدل هوش مصنوعی چین ارزان که تهدیدی برای سلطه رهبران آمریکایی بازار هوش مصنوعی (مانند اوپن ای آی و گوگل) به شمار می روند، فروختند. «دیوید ساکس» تزار هوش مصنوعی و رمزارز کاخ سفید در پاسخ به سوال شبکه خبری فاکس نیوز درباره آنکه سرقت مالکیت معنوی در اوج گیری دیپ سیک نقشی داشته یا خیر، گفت: خب این امر ممکن است. در هوش مصنوعی تکنیکی به نام عصاره گیری وجود دارد که درباره آن مطالب زیادی خواهید شنید و این زمانی اتفاق می افتد که یک مدل از مدل دیگر می آموزد. وی در ادامه افزود: تصور می کنم یکی از مواردی که در چند ماه آینده مشاهده می کنید آن است که شرکت های برتر هوش مصنوعی ما با اتخاذ گام هایی سعی در جلوگیری از فرایند عصاره گیری می کنند. این امر به طور حتم برخی از مدل های کپی شده را کندتر می کند. اما در این میان نمی توان صحبت های تزار هوش مصنوعی کاخ سفید را کاملا صحیح دانست. بیشک، رونمایی از مدل DeepSeek R1 داغترین اتفاق چند روز گذشته هوش مصنوعی بود. زلزلهای که لرزههایش به هوش مصنوعی محدود نماند و پسلرزههایش باعث ریزش 20 درصدی قیمت سهام انویدیا در 5 روز گذشته شده و این افت قیمت سهام هم مثل دومینو باعث ریزش قیمت بیت کوین و سایر رمزارزها شد اما اهمیت DeepSeek R1 چیست. نخست آنکه این اولین جهش DeepSeek نیست. حدود 20 روز پیش این شرکت چینی، مدل DeepSeek V3 خود را را به صورت منبع باز منتشر کرد. مدلی که در عملکرد بالاتر از Llama و در رقابت نزدیک با GPT-4o قرار میگیرد و البته طبق ادعاهایش تنها با 5.5 میلیون دلار آموزش دیده است. اهمیت DeepSeek V3 در این بود که آموزش مدل در چنین ابعادی، مخصوصا با در نظر گرفتن تحریم GPUهای H100 که آمریکا بر چین تحمیل کرده، کار راحتی نیست. در واقع برای آموزش LLMهایی در این ابعاد باید تعداد بسیار زیادی H100 به هم متصل شوند و با هم آموزش ببینند. حال آنکه آمریکا هم فروش H100 به چین را ممنوع کرده است. در همین راستا انویدیا یک نسخه دستکاریشده از H100 به نام H800 را که نرخ انتقال داده کمتری دارد برای شرکت های چینی می سازد و به آنها می فروشد. به همین دلیل حدس زده شد که چینیها GPUهای H800 را به هم متصل کردند و سپس در سطحی پایینتر از Cuda آنها را برنامه ریزی کردند تا بتوانند به چنین عملکردی دست یابند. اما این روند به DeepSeek V3 ختم نشد و چین پس از پنجه در پنجه انداختن با GPT-4o این بار سراغ زورآزمایی با GPT-o1 رفت و از مدل DeepSeek R1 رونمایی کرد. نکته این مدل آن است که قدرت استدلال در سطح o1 دارد، با صرفا 6 میلیون دلار هزینه درست شده است. همچنین قیمت اینفرنس آن هم نسبت به o1 پایین تر است. در درجه سوم نکته فنی که نمی توان از آن عبور کرد، نوآوری R1 در نحوه آموزش هست. مغز نوآوری که چینیها برای این مدل به خرج دادند آن است که به جای استفاده از SFT مستقیما از RL استفاده کردند. یعنی مدل را صرفا در یک ستینگ RL آن هم با دو ریوارد مدل سادهای که یکی از آنها قرار است جواب نهایی را چک می کند و دیگری مدل را ملزم به خروجی داده در یک فرمت خاص کند، آموزش دادند. نکته جالب اینه که این ریوارد مدلها بسیار ساده هستند و صرفا می توان آنها را Rule-Based دید. براساس گزارش روزنامه شریف، در درجه چهارم، چرا سیلیکون ولی و انویدیا دچار شوک شدند؟ حرف و حدیث در این زمینه زیاد است. بعضیها تحلیل کرده اند که شاید این که روش R1 توانسته بدون تکیه بر تکنیکهای Inference Time Compute که مستلزم استفاده بیشتر از قدرت محاسباتی هستند، به AGI نزدیک شود از اهمیت GPUها کاسته است. همچنین بخوانید هوش مصنوعی کنترل میکروسکوپها را بهعهده میگیرد آنچه قابل توجه است این است که این یک شوک موقتی است و از 3 امر ناشی می شود. نخست آنکه بالاخره چینیها توانستند در زمینه مدلهای زبانی به رقابت نزدیک به آمریکا برسند و در حالی که همیشه آزمایشگاههای هوش مصنوعی چینی عقبتر از آمریکاییها بودند، R3 را می توان به مثابه یک شوک و نقطه عطف برای مونوپلی آمریکا در هوش مصنوعی به حساب آورد. دوما این که قیمت پایین آموزش و اینفرنس R1 ممکن است باعث یک تکانه به وابستگی به nvidia باشد که البته صرفا در حد یک شوک موقت خواهد بود. در درجه سوم از این زاویه می توان این موضوع را نگاه کرد که DeepSeek توانسته تحریمهای آمریکا در زمینه GPU را کماثرتر کند و شاید این روند در آینده ادامه دار باشد. پنجم، آیا DeepSeek برنده شده است؟ هنوز نه. چرا که o3 هنوز عملکرد بسیار بهتری نسبت به R1 دارد، با این وجود R1 کاراتر است و می تواند روی دیوایسها اجرا شود و هم هزینه اینفرنس پایینتری دارد. از سوی دیگر با منبع باز کردن آن فشار برای کاهش قیمت به مدلهایی مثل o1 و o1-mini وارد میکند. باید دید رقابت بین آمریکاییها و چینیها در ادامه چه خواهد شد.
http://www.ilandnews.ir/fa/News/1344958/هوش-مصنوعی-چینی-کاخ-سفید-را-ترساند
|