باشگاه خبرنگاران پویا؛ با شگل گیری دیپ سیک عملا تحریمهای ایالت متحده آمریکا زیر سوال رفت و از همین جهت است که بازار سهام ایالات متحده در روزهای گذشته سقوط بزرگی را تجربه کرد؛ چینیها با وجود تحریمهای ایالات متحده در حوزه هوش مصنوعی فناوری را معرفی کردند که شرکتهای بزرگ آمریکایی را به چالش کشیده است.
در 20 ژانویه، دیپسیک، یک شرکت تحقیقاتی نسبتاً ناشناخته هوش مصنوعی از چین، یک مدل متنباز را منتشر کرد که به سرعت به نقل محافل در سیلیکون ولی تبدیل شد.
طبق مقالهای که توسط این شرکت نوشته شده، DeepSeek-R1 مدلهای پیشرو صنعت مانند OpenAI o1 را در چندین معیار ریاضی و استدلال شکست میدهد. این هوش مصنوعی، در بسیاری از معیارهایی مانند قابلیتهای پاسخگویی، هزینه پروژه و متن باز بودن دیپسیک غولهای هوش مصنوعی غربی را به چالش میکشد.
موفقیت دیپسیک یک نتیجه ناخواسته از جنگ سرد فناوری بین ایالات متحده و چین است. تحریمهای ایالات متحده، توانایی شرکتهای فناوری چینی را برای رقابت در زمینه هوش مصنوعی به روش غربی - یعنی افزایش بینهایت مقیاس با خرید تراشههای بیشتر و آموزش برای مدت طولانیتر - به شدت محدود کرده است.
در نتیجه، اکثر شرکتهای چینی به جای ساخت مدلهای خود، بر برنامههای کاربردی پاییندستی تمرکز کردهاند. اما دیپسیک با آخرین انتشار خود ثابت کرد که با تغییر ساختار بنیادی مدلهای هوش مصنوعی و استفاده کارآمدتر از منابع محدود، میتواند محدودیت های تکنولوژیکی که توسط ایالات متحده ایجاد شده است را بی اثر کند.
تمایز دیپ سیک نسبت به رقبای چینی خود
مارینا ژانگ، استاد دانشگاه فناوری سیدنی که نوآوریهای چین را مطالعه میکند، توضیح میدهد: «برخلاف بسیاری از شرکتهای هوش مصنوعی چینی که به شدت به سختافزار پیشرفته متکی هستند، دیپسیک برای به حداکثر رساندن بهینهسازی منابع نرمافزاری متمرکز شده است. این هوش مصنوعی روشهای متنباز را پذیرفته و تخصص جمعی را گردآوری و نوآوری مشارکتی را پرورش داده است. این رویکرد نه تنها محدودیتهای منابع را کاهش میدهد، بلکه توسعه فناوریهای پیشرفته را نیز تسریع میکند و دیپسیک را از رقبای منزوی چینی خود که وابسته به تراشههای پیشرفته هستند متمایز میکند.»
منابع مالی دیپ سیک
در صنعت هوش مصنوعی چین، دیپسیک بازیگری غیرمتعارف است. این شرکت ابتدا به عنوان Fire-Flyer، شاخه تحقیقاتی یادگیری عمیق High-Flyer، یکی از بهترین صندوقهای سرمایهگذاری، آغاز به کار کرد. این صندوق پوشش ریسک که در سال 2015 تأسیس شد، به سرعت در چین به شهرت رسید و به اولین صندوق سرمایه گذاری تبدیل شد که بیش از 100 میلیارد یوان (حدود 15 میلیارد دلار) جذب کرد. (از سال 2021، این رقم به حدود 8 میلیارد دلار کاهش یافته است، اگرچه High-Flyer همچنان یکی از مهمترین صندوقهای سرمایه گذاری در این کشور است.)
سالها، High-Flyer در حال ذخیرهسازی پردازندهها و ساخت ابرکامپیوترهای Fire-Flyer برای تجزیه و تحلیل دادههای مالی بود. سپس، در سال 2023، لیانگ که دارای مدرک کارشناسی ارشد در علوم کامپیوتر بود، تصمیم گرفت منابع مالی صندوق را به شرکت جدیدی به نام دیپسیک واریز کند که مدلهای پیشرفته خود را بسازد و هوش مصنوعی عمومی را توسعه دهد.
ژانگ استاد دانشگاه سیدنی معتقد است: «دیپسیک نشان دهنده نسل جدیدی از شرکتهای فناوری چینی است که پیشرفت فناوری بلندمدت را بر تجاریسازی سریع ترجیح میدهند.»
لیانگ توسعه دهنده دیپ سیک به نشریه فناوری چینی 36Kr گفت: این تصمیم بیشتر از تمایل به کسب سود، ناشی از کنجکاوی علمی بوده است، «حتی اگر از من بخواهید، نمیتوانم دلیل تجاری [برای تأسیس دیپسیک] پیدا کنم. زیرا از نظر تجاری ارزشی ندارد. تحقیقات پایه علمی نسبت بازده سرمایهگذاری بسیار پایینی دارد. وقتی سرمایهگذاران اولیه OpenAI در آن سرمایه گذاری کردند مطمئناً به این فکر نمیکردند که چقدر بازده خواهند داشت. بلکه آنها به دلایل علمی و البته کنجکاوی میخواستند این کار را انجام دهند.»
دیپسیک یکی از معدود شرکتهای پیشرو در زمینه هوش مصنوعی در چین است که به بودجه غولهای فناوری مانند بایدو، علیبابا یا بایتدنس وابسته نیست.
نیروی انسانی، نقطه قوت دیپ سیک
لیانگ، وقتی تیم تحقیقاتی دیپسیک را گرد هم آورد، به دنبال مهندسان با تجربه نبود. در عوض، او بر دانشجویان دکترا از برترین دانشگاههای چین، از جمله دانشگاه پکن و دانشگاه تسینگ هوا که مشتاق به اثبات خود بودند، تمرکز کرد. به گفته نشریه فناوری چینی QBitAI، بسیاری از آنها در مجلات برتر، مقالات خود را منتشر کرده بودند و در کنفرانسهای علمی بینالمللی جوایزی کسب کرده بودند، اما فاقد تجربه صنعتی بودند.
لیانگ در سال 2023 در مصاحبه ای به شبکه چینی 36Kr گفت: «پستهای فنی اصلی ما بیشتر توسط افرادی پر شده است که در یکی دو سال گذشته فارغالتحصیل شدهاند.» این استراتژی استخدام به ایجاد یک فرهنگ مشارکتی کمک کرد که در آن افراد آزاد بودند از منابع محاسباتی فراوان برای پیگیری پروژههای تحقیقاتی غیرمتعارف استفاده کنند.
این روش عملکردی کاملاً متفاوت از شرکتهای فناوری مستقر در چین بود؛ چرا که در چین تیمها اغلب برای منابع با یکدیگر رقابت میکنند.
لیانگ موسس دیپ سیک معتقد است: که دانشجویان میتوانند گزینه بهتری برای تحقیقات پرهزینه و کمسود باشند. به عبارت دیگر،اکثر مردم، وقتی جوان هستند، میتوانند بدون ملاحظات سودگرایانه، خود را کاملاً وقف یک ماموریت کنند.در نتیجه استفاده از نیروی جوان و با انگیزه نقش مهمی در موفقیت دیپ سیک داشت.
نکته جالب توجه در دیپ سیک آن است که این محققان جوان تقریباً به طور کامل در دانشگاههای چین تحصیل کردهاند. ژانگ معتقد است: «این نسل جوان نیز حس وطنپرستی را تجسم میکند، بهویژه که محدودیتهای ایالات متحده را در فناوریهای سختافزاری و نرمافزاری حیاتی زیر پا میگذارد. عزم آنها برای غلبه بر این موانع نه تنها نشان دهنده جاهطلبی شخصی، بلکه تعهدی گستردهتر برای پیشبرد جایگاه چین به عنوان یک رهبر نوآوری جهانی است.»
نوآوری میتواند تحریمها را شکست دهد
در اکتبر 2022، دولت ایالات متحده شروع به وضع تحریم هایی کرد که به شدت شرکتهای هوش مصنوعی چینی را از دسترسی به تراشههای پیشرفتهای مانند H100 انویدیا محدود میکرد. این تحریمها برای نه تنها دیپسیک بلکه برای کل شرکتهای چینی فعال در حوزه هوش مصنوعی اختلال ایجاد میکرد اما دیپ سیک با ذخیرهای از 10 هزار تراشه انویدیا A100 شروع کرده بود اما برای رقابت با شرکتهایی مانند OpenAI و متا به تعداد بیشتری نیاز داشت. لیانگ در مصاحبه خود در سال 2024 به 36Kr گفت: «مشکلی که ما با آن روبرو هستیم هرگز تأمین مالی نبوده، بلکه کنترل صادرات تراشههای پیشرفته است.»
دیپسیک روشهای کارآمدتری برای آموزش مدلهای خود ابداع کرد؛ وندی چانگ، مهندس نرمافزاری معتقد است: «دیپ سیک مدل معماری خود را با استفاده از مجموعهای از ترفندهای مهندسی بهینه کرد؛ طرحهای ارتباطی سفارشی بین تراشهها، کاهش اندازه فیلدها برای صرفهجویی در حافظه و استفاده نوآورانه از رویکرد ترکیب مدلها، نمونهای از این بسیاری از این رویکردها ایدههای جدیدی نیستند، اما ترکیب موفقیتآمیز آنها برای تولید یک مدل پیشرفته، شاهکار قابل توجهی است.
تمایل دیپسیک به اشتراک گذاشتن این نوآوریها با عموم، اعتبار قابل توجهی را در جامعه تحقیقاتی هوش مصنوعی جهانی برای آن به ارمغان آورده است. برای بسیاری از شرکتهای هوش مصنوعی چینی، توسعه مدلهای متنباز تنها راه برای رسیدن به همتایان غربی خود است، زیرا کاربران و مشارکتکنندگان بیشتری را جذب میکند که به نوبه خود به رشد مدلها کمک میکنند.
ژانگ میگوید: آنها اکنون نشان دادهاند که مدلهای پیشرفته را میتوان با استفاده از هزینه کمتر، ایجاد کرد؛ هر چند هنوز زود است در مورد هزینه این مدل ها گمانه زنی کرد.
با شگل گیری دیپ سیک عملا تحریم های ایلات متحده زیر سوال رفت و از همین جهت است که بازار سهام ایالات متحده در روز های گذشته سقوط بزرگی را تجربه کرد؛ چینیها با وجود تحریمهای ایالات متحده در حوزه هوش مصنوعی فناوری را معرفی کردند که شرکتهای بزرگ آمریکایی را به چالش می کشد.
ژانگ استاد دانشگاه سیدنی معتقد است: «برآوردهای موجود از میزان قدرت محاسباتی هوش مصنوعی چین و آنچه آنها میتوانند با آن به دست آورند، میتواند حتی فراتر از دیپ سیک باشد.
پایان پیام/