چراغ سبز توسعه هوش مصنوعی در ایران با دیپ سیک!؟ / هشام فیلی، استاد هوش مصنوعی دانشگاه تهران : چین ثابت کرد که علم از ثروت بهتر است / تامین زیرساختهای دیپ سیک دست یافتنی است
آسیا و اقیانوسیه
بزرگنمايي:
ایرانیان جهان - با رونمایی از پلتفرم چینی «دیپ سیک» در روز 27 ژانویه، سهام شرکت های فناوری آمریکایی تا یک تریلیون دلار ریزش کرد. این چت بات هوش مصنوعی، به دلیل هزینه کمتر و کارایی مشابه در رقابت با «چت جی پی تی» جلو افتاده است. در واکنش به این تحول، دونالد ترامپ توسعه دیپ سیک را زنگ هشداری برای شرکت های فناوری خواند و تاکید کرد که آنها باید فعال تر عمل کنند.
در هر حال توسعه این مدل زبانی تمام معادلات آمریکا برای توسعه چنین ساختاری با بودجه کلان و تراشه های پیشرفته را به هم ریخت.
این پلتفرم ، چه ویژگی هایی دارد و چگونه ایران می تواند با الگوگیری از این راهبرد چینی، گام رو به جلویی بردارد. اینها پرسشهایی است که در گفت و گو با دکتر هشام فیلی، استاد تمام گروه هوش مصنوعی دانشگاه تهران و رئیس موسسه «هوش مصنوعی و علوم شناختی بانک ملت و دانشگاه تهران» مطرح کردیم. دکتر فیلی، در گفت و گو با جماران، با بیان اینکه مدل هوش مصنوعی دیپ سیک، برتری علم بر ثروت را نشان داد، خاطرنشان کرد: گاهی پرسیده می شود علم بهتر است یا ثروت، اکنون چین ثابت کرد که علم از ثروت بهتر است. در واقع، نام مدلهای هوش مصنوعی، مدلهای بزرگ زبانی (large language model) است و با اینکه پیشرفتهای چند سال اخیر را داشتیم، این مدلها اصلا جدید نمی شدند. به این دلیل که محققین، در چند سال اخیر متوجه شدند که اگر این مدلها را با حجمهای بسیار بزرگ و به شکل شبکه های عصبی پیشرفته طراحی کنند، جوابهایی دریافت می کنند که قبلا آن جوابها را نمی گرفتند و کیفیت به طور فوق العاده ای بالا می رود، همانطور که در چت جی پی تی (ChatGPT) معروف در سال 2022 شاهد بودیم.
چت جی پی تی فناوری یک دهه قبل بود و اصلا بُعد تازه ای نداشت وی ادامه داد: در واقع چت جی پی تی (ChatGPT) فناوری یک دهه قبل بود و اصلا بعد تازه ای نداشت، اما پارامترهایش بزرگ بود. گویی شبیه فردی که قبلا ساختمانی یک طبقه ساخته و اکنون با همان روش ساختمان را صد طبقه کرده است. یک باره دیدند وقتی این شبکه هوش مصنوعی در حجم بزرگ کار کند و ابعادش بزرک شود، کیفیتش خوب می شود، یعنی ما در اینجا نیاز به مدلهای بزرگ و الگوریتمهایی داریم که با مدلهای خیلی بزرگ کار کند و نیاز به داده های آموزشی بسیار بزرگ و زیرساختهای پردازشی بسیار حجیم داریم. به این دلیل که مدلها و شبکه ها بزرگ هستند و در یک سرور معمولی گنجانده نمی شوند. این شرایط سبب شد یک باره مسابقه ای میان شرکتهای بزرگ در دنیا در راستای بزرگ کردن مدلها ایجاد شد. هر میزان مدلها بزرگ می شدند، تقریبا کیفیتها بهتر بود.
مسابقه بزرگ کردن مدلها، نمایشی از ثروت بود و نه علم افزایی فیلی با یادآوری اینکه برای بزرگ کردن مدلها هم باید آن شرکتها از زیرساختهای پردازشی بزرگتر استفاده می کردند، اظهارداشت: اتفاقی که افتاد این بود که شرکتها در یک مسابقه ای، در راستای بزرگ کردن مدلها حرکت کردند. من نمی توانم اسم آن را علم بگذارم، بلکه اینجا در واقع اسم آن ثروت است؛ چرا که مهم ترین کاری که برای بزرگ کردن این مدلها لازم است، این است که زیرساختهای پردازشی گران قیمت بخریم. اینجا بود که ما شاهد افزایش شدید ارزش سهام شرکت «انویدیا» به عنوان تقریبا تنها تامین کننده زیرساخت بودیم. به این دلیل که انحصار تامین زیرساخت دنیا، در اختیار این شرکت آمریکایی است. مدیران عامل همه شرکتهای بزرگ، از جمله خود «انویدیا» در مصاحبه های خود می گفتند ما قدرت برتر هستیم و مجبوریم بزرگ باشیم و تنها راه حل مشکلات را بزرگ کردن مدلها اعلام می کردند.
دیپ سیک با اندازه ای بسیار کوچکتر و با زیرساختی بسیار کمتر، بر مدلهای بزرگ غلبه کرد این استاد تمام گروه هوش مصنوعی دانشگاه تهران، با بیان اینکه محقیقینی هم در کشورهایی مانند چین و خصوصا در کشورهایی که ثروت ندارند، تحقیقاتی کرده بودند که بتوانند بدون زیرساختهای بزرگ این کار را انجام دهند و تلاش آنها مبتنی بر نوآوری علمی در آن شبکه بود، اما هیچ کس نتوانسته بود در این راستا موفق شود، گفت: «دیپ سیک»، مدل اوپن سورسی بود که با اندازه ای بسیار کوچکتر و با زیرساختی بسیار کمتر بر مدلهای بزرگ غلبه کند. در واقع دیپ سیک، یک پیام داد و آن این بود که پیشرفت در نوآوری و توجه به تحقیقات بنیادی، حتی از زیرساخت هم مهم تر است.
ما هم می توانیم از راهبرد دیپ سیک استفاده کنیم فیلی ضمن تاکید بر اینکه ما هم می توانیم از این راهبرد دیپ سیک استفاده کنیم، توضیح داد: در چند سال اخیر، هر کسی که از محققان و کارشناسان حوزه هوش مصنوعی می خواست پروژه هایی را اجرا کند، اولین نکته ای که مطرح می شد این بود که زیرساختهایی باید فراهم شود. زیرساخت در سطح چند 10 هزار سی.پی.یو بود و اصلا از عهده دولتها و حتی دولت آمریکا هم خارج بود؛ چرا که شرکتهای چند ملیتی هستند که می توانند چنین کاری بکنند. به تبع این شرایط، راه های توسعه مدلهای هوش مصنوعی را بسته بودند. دیپ سیک یک پیام داشت و اعلام کرد که این گونه هم نیست، بازی تنها از زیرساختهای بزرگ هم نیست و بازی می تواند از طریق توسعه نیروی انسانی و پیشرفتهای علمی هم حاصل شود و معتقدم پیام اصلی اش این است که علم از ثروت بهتر است. ما هم می توانیم از این مسیر استفاده کنیم.
تامین زیرساختهای دیپ سیک دست یافتنی است این استاد تمام دانشگاه تهران، با بیان اینکه البته به این معنا نیست که اساسا وجود زیرساخت اهمیت ندارد، خاطرنشان کرد: آنها هم حداقل زیرساختهایی را دارند و ما هنوز هم حتی به اندازه زیرساختهایی که دیپ سیک استفاده کرده، زیرساخت نداریم. اما این اندازه قابل تامین است. اگر قبلا تامین زیرساختهایی مانند اوپن ای آی(Open AI) و مایکروسافت برای ما محال بود، تامین زیرساختهای دیپ سیک دست یافتنی است و می توان به سراغ آن رفت.
باید ارتباطاتمان را با دنیا بهبود ببخشیم به گفته فیلی، آمریکا فشار سنگینی با ممنوعیت فروش زیرساخت به چین وارد می کرد، اما چین توانست به موفقیت بزرگی برسد. در این راستا ایران باید دو راهبرد را مدنظر خود قرار دهد ابتدا اینکه باید حداقل ارتباطات بین المللی ایجاد شود. خود چین با وجود اینکه تحت فشار بود، شبکه های خوبی در دنیا دارد و حتی با محققان آمریکایی هم این شبکه ها را ایجاد کرده است. ما باید این راهبرد را به هر شکل که شده دنبال کنیم و ارتباطاتمان را با دنیا بهبود ببخشیم. متاسفانه این یکی از مهم ترین مشکلات ما است. نکته دیگر توجه ویژه به نیروهای فنی و محققین است. چین با توجه به نیروهای انسانی خود نتیجه بسیار حیرت انگیزی گرفت. چین اعلام کرد که با نیروی انسانی می توانیم کاری کنیم که قبلا با زیرساختهای بزرگ می توانستیم آن را انجام دهیم. و این جایگزینی، بسیار مهم است.
لینک کوتاه:
https://www.iranianejahan.ir/Fa/News/1349069/