عرضه یک مدل جدید هوش مصنوعی از سوی یک استارتآپ چینی به نام «دیپسیک» توانسته دنیای هوش مصنوعی را تکان دهد. یک استارتآپ مرموز و مبتکر چینی، ورود باشکوهی به صحنه هوش مصنوعی داشته است، به طوری که غولهای «سیلیکون ولی» را ناامید کرده، بازارهای سهام جهانی را متلاطم کرده و مفروضات درباره آنچه که هوش مصنوعی میتواند به دست آورد را به چالش کشیده است.
هوش مصنوعی «دیپسیک»(DeepSeek)، هزینه اندک برای توسعه هوش مصنوعی و جاه طلبی منبعباز را در ماموریتی برای پیشی گرفتن از هوش انسانی در هم میآمیزد و موفق شده است از نامهای شناخته شدهای مانند اوپنایآی(OpenAI) پیشی بگیرد.
اکنون که شاهد چنین رشد سریعی هستیم، پرسشهایی به ذهن میآید. مثلا اینکه آیا ما شاهد یک انقلاب واقعی در هوش مصنوعی هستیم یا این جریان رسانهای طی یکی دو روز اخیر، تبلیغات بیش از حد است؟
در ادامه، پرده از راز تأسیس و فلسفه «دیپسیک» برمیداریم، مدل هوش مصنوعی آن را با دیگر مدلهای هوش مصنوعی مانند ChatGPT مقایسه میکنیم، تحولات خیرهکنندهای را که در بازار ایجاد میکند، تشریح میکنیم و نگرانیهای مربوط به حریم خصوصی را که مشابه با موضوع تیکتاک(TikTok) است، بررسی میکنیم.
«دیپسیک» چیست و چه کسی آن را اجرا میکند؟
شرکت «دیپسیک» در ژوئیه 2023 توسط لیانگ ونفنگ(Liang Wenfeng)، فارغالتحصیل برجسته دانشگاه ژیجیانگ(Zhejiang) تأسیس شد. این شرکت مستقر در هانگژو با پشتوانه مالی قابل توجه و ورود استراتژیک یک صندوق تامینی به نامهایفلایر(High-Flyer) که توسط لیانگ همبنیانگذاری شده، پشتیبانی میشود.
«دیپسیک» با استفاده از قدرت مالی «هایفلایر» که دارایی حدود 8 میلیارد دلاری دارد، با خرید تراشههای قابل توجه A100 شرکت انویدیا با وجود ممنوعیت صادرات آنها به چین، ورود جسورانهای به بخش هوش مصنوعی داشته است. این تراشهها برای پایه فناوری و ظرفیت نوآوری این شرکت بسیار مهم هستند.
شهرت «دیپسیک» از توسعه مدل DeepSeek-V3 آمده است که تنها به 6 میلیون دلار هزینه برای منابع محاسباتی نیاز داشت که کسری از آن چیزی است که معمولاً توسط غولهای فناوری ایالات متحده سرمایهگذاری و هزینه میشود.
کارآیی خیره کننده مدل هوش مصنوعی «دیپسیک»، این دستیار هوش مصنوعی را به صدر جدول بارگیری برنامههای رایگان در فروشگاه برنامههای ایالات متحده رسانده که حتی ChatGPT را نیز پشت سر گذاشته است. این دستاورد، پتانسیل «دیپسیک» را برای ارائه عملکرد بالا با هزینه کمتر، به چالش کشیدن هنجارهای فعلی و آغاز ارزیابی مجدد در صنعت جهانی هوش مصنوعی برجسته میکند.
نوآوریهای فناورانه در «دیپسیک» توسط یک گروه تحقیقاتی اختصاصی در «هایفلایر» هدایت میشود که قصد خود را برای تمرکز بر هوش عمومی مصنوعی(AGI) در اوایل سال 2023 اعلام کرد. این گروه که دارای کنترل عملیاتی بر روی خوشهای از 10 هزار تراشه A100 انویدیا است، قصد دارد هوش مصنوعی را فراتر از برنامههای کاربردی سنتی ارتقاء دهد تا به قابلیتهایی دست یابد که از عملکرد انسان در کارهای با ارزش اقتصادی پیشی بگیرد.
این ادغام عمیق منابع، تعهد جدی «دیپسیک» را برای پیشروی در حوزه هوش مصنوعی نشان میدهد که نشاندهنده یک همسویی استراتژیک است که میتواند به طور قابلتوجهی بر پیشرفتهای آینده در هوش مصنوعی تأثیر بگذارد.
«دیپسیک» چگونه به وجود آمد؟
پیدایش «دیپسیک» به جاهطلبی گستردهتری برمیگردد که با انتشار هوش مصنوعی ChatGPT توسط شرکت اوپنایآی(OpenAI) در اواخر سال 2022 شعلهور شد که تنور توسعه این فناوری را در میان شرکتهای فناوری چینی برای توسعه چتباتهای رقابتی هوش مصنوعی برانگیخت.
با وجود تلاشهای اولیه غولهای چینی مانند بایدو(Baidu)، شکاف قابلتوجه در قابلیتهای هوش مصنوعی بین فناوریهای ایالات متحده و چین مشهود بود که منجر به ناامیدی گسترده در جامعه فناوری چین شد.
این شکاف موجب ظهور «دیپسیک» در سال 2023 با یک ماموریت جسورانه برای پر کردن این شکاف و برتری در هوش عمومی مصنوعی(AGI) و توسعه یک هوش مصنوعی که میتواند از هوش انسانی پیشی بگیرد، شد.
روح پایهگذاری «دیپسیک»، شبیه به روزهای اولیه اوپنایآی، ریشه در یک ایدهآلیسم غیرتجاری دارد. آنها خود را به عنوان گروهی از ایدهآلگرایان معرفی کردهاند که نه به خاطر سود، بلکه برای دستیابی به پیشرفتهای پیشگامانه در هوش عمومی مصنوعی(AGI) تلاش میکنند.
این چشمانداز آرمانگرایانه با سرمایهگذاریهای فناورانه قابل توجه، بهویژه در توسعه مدلهای DeepSeek-V3 و DeepSeek-R1 پشتیبانی میشود. این مدلها خیلی زود به دلیل عملکردشان مورد تحسین قرار گرفتهاند که با وجود دسترسی محدود این شرکت به جدیدترین تراشههای انویدیا، از برخی جنبهها از مدلهای پیشرو شرکتهای اوپنایآی و متا پیشی میگیرند.
مدل DeepSeek-V3 به شکل ویژه به دلیل سرعت استنتاج برتر و هزینه کم برای توسعه شناخته میشود و گامهای مهمی در زمینههایی که نیاز به تواناییهای محاسباتی فشرده مانند کدنویسی و حل مسئله ریاضی دارند، برداشته است.
توانمندی این مدل در یک مقاله تحقیقاتی منتشر شده در Arxiv برجسته شد، جایی که به دلیل عملکرد بهتر از سایر مدلهای منبعباز و مطابقت با قابلیتهای مدلهای منبعبسته سطح بالا مانند GPT-4 و Claude-3.5-Sonnet مورد توجه قرار گرفت.
مقایسه DeepSeek با چتباتهای دیگر مانند ChatGPT
«دیپسیک» خود را از سایر برنامههای کاربردی هوش مصنوعی مانند ChatGPT از طریق رویکردهای معماری و عملیاتی منحصر به فرد خود متمایز میکند که به منظور افزایش کارایی و کاهش هزینههای عملیاتی طراحی شده است.
«دیپسیک» با استفاده از معماری «مخلوطی از متخصصان»(MoE)، تنها بخشهای مرتبط از شبکه خود را برای هر پرس و جوی خاص فعال میکند و به طور قابل توجهی در توان محاسباتی و هزینهها صرفهجویی میکند. این به شدت در تضاد با معماری مبتنی بر ترانسفورماتور ChatGPT است که وظایف را در کل شبکه خود پردازش میکند و منجر به مصرف بیشتر منابع میشود.
فناوری مبتکرانه و بهبود عملکرد
طراحی «مخلوطی از متخصصان» دیپسیک، امکان پردازش ویژه هر کار را فراهم میکند که عملکرد آن را در زمینههای تخصصی مانند کدنویسی و حل مشکلات فنی افزایش میدهد و زمان پاسخ را سرعت میبخشد.
برعکس، ChatGPT عملکرد ثابتتری را در طیف وسیعی از وظایف ارائه میدهد، اما ممکن است به دلیل روش پردازش جامع آن، از نظر سرعت عقب بماند.
با وجود این، ChatGPT اغلب پاسخهای ظریفتر و غنیتر ارائه میدهد و عمقی را ارائه میدهد که ممکن است DeepSeek در زمینههای وسیعتر فاقد آن باشد.
هزینه و دسترسی
با توجه به میزان دسترسی، ماهیت منبعباز DeepSeek، آن را کاملا رایگان میکند و به راحتی برای اصلاح و استفاده در دسترس قرار میدهد که میتواند برای جامعه توسعه دهندگان جذاب باشد.
از آن سو، ChatGPT در حالی که یک نسخه رایگان ارائه میدهد، شامل سطوح پولی نیز است و دسترسی به ویژگیهای پیشرفتهتر و قابلیتهای API بیشتر آن با پرداخت اشتراک فراهم میشود.
آیا باید نگران حریم خصوصی باشیم؟
«دیپسیک» با وجود پیشرفتهای فناورانه خود، از نظر مسائل بالقوه حفظ حریم خصوصی که یادآور نگرانیهایی است که قبلاً با سایر پلتفرمهای چینی مانند TikTok مرتبط بود، تحت نظارت است. این نگرانی عمدتاً از جمعآوری دادههای شخصی گسترده «دیپسیک» از جمله درخواست ثبت تاریخ تولد، ورودیهای متنی و صوتی، فایلهای آپلود شده و تاریخچه چت که در سرورهای چین ذخیره میشوند، ناشی میشود.
این عمل با توجه به قوانین سختگیرانه اطلاعات ملی در چین که همه نهادها را مجبور به همکاری با تلاشهای اطلاعاتی ملی میکند، نگرانیهای قابل توجهی را در مورد امنیت و حریم خصوصی دادههای کاربران ایجاد میکند.
علاوه بر این، مدلهای هوش مصنوعی برجسته مانند ChatGPT و جمینای گوگل نسبت به دیپسیک توصیه به احتیاط کردهاند.
این نگرانیها شامل پتانسیل بدافزارهای مخفی یا مکانیسمهای نظارتی است که در این نرمافزار قابل تعبیه است و میتواند امنیت کاربران را به خطر بیندازد.
اقدامات امنیتی دیپسیک پس از یک نقص امنیتی گزارش شده در ماه دسامبر که آسیبپذیریهایی را برای امکان سرقت احتمالی حسابها فراهم میکرد، مورد تردید قرار گرفت، اگرچه این مشکل متعاقباً اصلاح شد.
این وضعیت زمانی تشدید شد که شرکت «دیپسیک» در میان افزایش دانلودها فاش کرد که دستیار هوش مصنوعی آن هدف یک «حمله مخرب در مقیاس بزرگ» قرار گرفته است که نشاندهنده چالشهای امنیتی برای آن است. این حادثه بر خطرات مرتبط با استفاده از دیپسیک، بهویژه در مورد حفاظت از دادههای شخصی پردازش شده توسط هوش مصنوعی تاکید میکند.
کاربران و ذینفعان در فناوری هوش مصنوعی باید این خطرات حریم خصوصی و امنیتی را هنگام ادغام یا استفاده از ابزارهای هوش مصنوعی مانند DeepSeek در نظر بگیرند. نگرانیها فقط در مورد حریم خصوصی دادهها نیست، بلکه پیامدهای گستردهتری در مورد استفاده از دادههای جمعآوریشده برای اهدافی فراتر از کنترل یا آگاهی کاربر، از جمله آموزش مدلهای هوش مصنوعی یا سایر فعالیتهای فاش نشده است.
همانطور که فناوری هوش مصنوعی در حال تکامل است، اطمینان از شفافیت و اقدامات امنیتی قوی در حفظ اعتماد کاربران و محافظت از اطلاعات شخصی در برابر سوء استفاده بسیار مهم خواهد بود.
مطمئناً دیپسیک پویایی بازار را تغییر داده و بحثهای اخلاقی مختلفی را مطرح کرده است، اما برخی از سؤالات بزرگ هنوز باقی میمانند. مثلا آیا دیپسیک کتاب تاریخ هوش مصنوعی را بازنویسی میکند؟ چه موانع غیرمنتظرهای میتواند از شتاب توسعه آن بکاهد و محبوبیت آن را کاهش دهد یا شاید حتی منجر به نابودی آن شود؟
به هر حال، مسیر پیش رو برای این هوش مصنوعی انقلابی و بلندپرواز، پر از احتمالات و مشکلات است و تنها زمان نشان خواهد داد که این فناوری جسورانه چگونه عمل خواهد کرد.