«دیپ‌سیک» چگونه دنیا را تکان داد؟

1 سال قبل

زمان مطالعه 6 دقیقه

عرضه یک مدل جدید هوش مصنوعی از سوی یک استارت‌آپ چینی به نام «دیپ‌سیک» توانسته دنیای هوش مصنوعی را تکان دهد. یک استارت‌آپ مرموز و مبتکر چینی، ورود باشکوهی به صحنه هوش مصنوعی داشته است، به طوری که غول‌های «سیلیکون ولی» را ناامید کرده، بازارهای سهام جهانی را متلاطم کرده و مفروضات درباره آنچه که هوش مصنوعی می‌تواند به دست آورد را به چالش کشیده است.

هوش مصنوعی «دیپ‌سیک»(DeepSeek)، هزینه اندک برای توسعه هوش مصنوعی و جاه طلبی منبع‌باز را در ماموریتی برای پیشی گرفتن از هوش انسانی در هم می‌آمیزد و موفق شده است از نام‌های شناخته شده‌ای مانند اوپن‌ای‌آی(OpenAI) پیشی بگیرد.

اکنون که شاهد چنین رشد سریعی هستیم، پرسش‌هایی به ذهن می‌آید. مثلا اینکه آیا ما شاهد یک انقلاب واقعی در هوش مصنوعی هستیم یا این جریان رسانه‌ای طی یکی دو روز اخیر، تبلیغات بیش از حد است؟

در ادامه، پرده از راز تأسیس و فلسفه «دیپ‌سیک» برمی‌داریم، مدل هوش مصنوعی آن را با دیگر مدل‌های هوش مصنوعی مانند ChatGPT مقایسه می‌کنیم، تحولات خیره‌کننده‌ای را که در بازار ایجاد می‌کند، تشریح می‌کنیم و نگرانی‌های مربوط به حریم خصوصی را که مشابه با موضوع تیک‌تاک(TikTok) است، بررسی می‌کنیم.

«دیپ‌سیک» چیست و چه کسی آن را اجرا می‌کند؟

شرکت «دیپ‌سیک» در ژوئیه 2023 توسط لیانگ ونفنگ(Liang Wenfeng)، فارغ‌التحصیل برجسته دانشگاه ژیجیانگ(Zhejiang) تأسیس شد. این شرکت مستقر در هانگژو با پشتوانه مالی قابل توجه و ورود استراتژیک یک صندوق تامینی به نام‌های‌فلایر(High-Flyer) که توسط لیانگ هم‌بنیان‌گذاری شده، پشتیبانی می‌شود.

«دیپ‌سیک» با استفاده از قدرت مالی «های‌فلایر» که دارایی حدود 8 میلیارد دلاری دارد، با خرید تراشه‌های قابل توجه A100 شرکت انویدیا با وجود ممنوعیت صادرات آنها به چین، ورود جسورانه‌ای به بخش هوش مصنوعی داشته است. این تراشه‌ها برای پایه فناوری و ظرفیت نوآوری این شرکت بسیار مهم هستند.

شهرت «دیپ‌سیک» از توسعه مدل DeepSeek-V3 آمده است که تنها به 6 میلیون دلار هزینه برای منابع محاسباتی نیاز داشت که کسری از آن چیزی است که معمولاً توسط غول‌های فناوری ایالات متحده سرمایه‌گذاری و هزینه می‌شود.

کارآیی خیره کننده مدل هوش مصنوعی «دیپ‌سیک»، این دستیار هوش مصنوعی را به صدر جدول بارگیری برنامه‌های رایگان در فروشگاه برنامه‌های ایالات متحده رسانده که حتی ChatGPT را نیز پشت سر گذاشته است. این دستاورد، پتانسیل «دیپ‌سیک» را برای ارائه عملکرد بالا با هزینه کمتر، به چالش کشیدن هنجارهای فعلی و آغاز ارزیابی مجدد در صنعت جهانی هوش مصنوعی برجسته می‌کند.

نوآوری‌های فناورانه در «دیپ‌سیک» توسط یک گروه تحقیقاتی اختصاصی در «های‌فلایر» هدایت می‌شود که قصد خود را برای تمرکز بر هوش عمومی مصنوعی(AGI) در اوایل سال 2023 اعلام کرد. این گروه که دارای کنترل عملیاتی بر روی خوشه‌ای از 10 هزار تراشه A100 انویدیا است، قصد دارد هوش مصنوعی را فراتر از برنامه‌های کاربردی سنتی ارتقاء دهد تا به قابلیت‌هایی دست یابد که از عملکرد انسان در کارهای با ارزش اقتصادی پیشی بگیرد.

این ادغام عمیق منابع، تعهد جدی «دیپ‌سیک» را برای پیشروی در حوزه هوش مصنوعی نشان می‌دهد که نشان‌دهنده یک همسویی استراتژیک است که می‌تواند به طور قابل‌توجهی بر پیشرفت‌های آینده در هوش مصنوعی تأثیر بگذارد.

«دیپ‌سیک» چگونه به وجود آمد؟

پیدایش «دیپ‌سیک» به جاه‌طلبی گسترده‌تری برمی‌گردد که با انتشار هوش مصنوعی ChatGPT توسط شرکت اوپن‌ای‌آی(OpenAI) در اواخر سال 2022 شعله‌ور شد که تنور توسعه این فناوری را در میان شرکت‌های فناوری چینی برای توسعه چت‌بات‌های رقابتی هوش مصنوعی برانگیخت.

با وجود تلاش‌های اولیه غول‌های چینی مانند بایدو(Baidu)، شکاف قابل‌توجه در قابلیت‌های هوش مصنوعی بین فناوری‌های ایالات متحده و چین مشهود بود که منجر به ناامیدی گسترده در جامعه فناوری چین شد.

این شکاف موجب ظهور «دیپ‌سیک» در سال 2023 با یک ماموریت جسورانه برای پر کردن این شکاف و برتری در هوش عمومی مصنوعی(AGI) و توسعه یک هوش مصنوعی که می‌تواند از هوش انسانی پیشی بگیرد، شد.

روح پایه‌گذاری «دیپ‌سیک»، شبیه به روزهای اولیه اوپن‌ای‌آی، ریشه در یک ایده‌آلیسم غیرتجاری دارد. آنها خود را به عنوان گروهی از ایده‌آل‌گرایان معرفی کرده‌اند که نه به خاطر سود، بلکه برای دستیابی به پیشرفت‌های پیشگامانه در هوش عمومی مصنوعی(AGI) تلاش می‌کنند.

این چشم‌انداز آرمان‌گرایانه با سرمایه‌گذاری‌های فناورانه قابل توجه، به‌ویژه در توسعه مدل‌های DeepSeek-V3 و DeepSeek-R1 پشتیبانی می‌شود. این مدل‌ها خیلی زود به دلیل عملکردشان مورد تحسین قرار گرفته‌اند که با وجود دسترسی محدود این شرکت به جدیدترین تراشه‌های انویدیا، از برخی جنبه‌ها از مدل‌های پیشرو شرکت‌های اوپن‌ای‌آی و متا پیشی می‌گیرند.

مدل DeepSeek-V3 به شکل ویژه به دلیل سرعت استنتاج برتر و هزینه کم برای توسعه شناخته می‌شود و گام‌های مهمی در زمینه‌هایی که نیاز به توانایی‌های محاسباتی فشرده مانند کدنویسی و حل مسئله ریاضی دارند، برداشته است.

توانمندی این مدل در یک مقاله تحقیقاتی منتشر شده در Arxiv برجسته شد، جایی که به دلیل عملکرد بهتر از سایر مدل‌های منبع‌باز و مطابقت با قابلیت‌های مدل‌های منبع‌بسته سطح بالا مانند GPT-4 و Claude-3.5-Sonnet مورد توجه قرار گرفت.

مقایسه DeepSeek با چت‌بات‌های دیگر مانند ChatGPT

«دیپ‌سیک» خود را از سایر برنامه‌های کاربردی هوش مصنوعی مانند ChatGPT از طریق رویکردهای معماری و عملیاتی منحصر به فرد خود متمایز می‌کند که به منظور افزایش کارایی و کاهش هزینه‌های عملیاتی طراحی شده است.

«دیپ‌سیک» با استفاده از معماری «مخلوطی از متخصصان»(MoE)، تنها بخش‌های مرتبط از شبکه خود را برای هر پرس و جوی خاص فعال می‌کند و به طور قابل توجهی در توان محاسباتی و هزینه‌ها صرفه‌جویی می‌کند. این به شدت در تضاد با معماری مبتنی بر ترانسفورماتور ChatGPT است که وظایف را در کل شبکه خود پردازش می‌کند و منجر به مصرف بیشتر منابع می‌شود.

فناوری مبتکرانه و بهبود عملکرد

طراحی «مخلوطی از متخصصان» دیپ‌سیک، امکان پردازش ویژه هر کار را فراهم می‌کند که عملکرد آن را در زمینه‌های تخصصی مانند کدنویسی و حل مشکلات فنی افزایش می‌دهد و زمان پاسخ را سرعت می‌بخشد.

برعکس، ChatGPT عملکرد ثابت‌تری را در طیف وسیعی از وظایف ارائه می‌دهد، اما ممکن است به دلیل روش پردازش جامع آن، از نظر سرعت عقب بماند.

با وجود این، ChatGPT اغلب پاسخ‌های ظریف‌تر و غنی‌تر ارائه می‌دهد و عمقی را ارائه می‌دهد که ممکن است DeepSeek در زمینه‌های وسیع‌تر فاقد آن باشد.

هزینه و دسترسی

با توجه به میزان دسترسی، ماهیت منبع‌باز DeepSeek، آن را کاملا رایگان می‌کند و به راحتی برای اصلاح و استفاده در دسترس قرار می‌دهد که می‌تواند برای جامعه توسعه دهندگان جذاب باشد.

از آن سو، ChatGPT در حالی که یک نسخه رایگان ارائه می‌دهد، شامل سطوح پولی نیز است و دسترسی به ویژگی‌های پیشرفته‌تر و قابلیت‌های API بیشتر آن با پرداخت اشتراک فراهم می‌شود.

آیا باید نگران حریم خصوصی باشیم؟

«دیپ‌سیک» با وجود پیشرفت‌های فناورانه خود، از نظر مسائل بالقوه حفظ حریم خصوصی که یادآور نگرانی‌هایی است که قبلاً با سایر پلتفرم‌های چینی مانند TikTok مرتبط بود، تحت نظارت است. این نگرانی عمدتاً از جمع‌آوری داده‌های شخصی گسترده «دیپ‌سیک» از جمله درخواست ثبت تاریخ تولد، ورودی‌های متنی و صوتی، فایل‌های آپلود شده و تاریخچه چت که در سرورهای چین ذخیره می‌شوند، ناشی می‌شود.

این عمل با توجه به قوانین سختگیرانه اطلاعات ملی در چین که همه نهادها را مجبور به همکاری با تلاش‌های اطلاعاتی ملی می‌کند، نگرانی‌های قابل توجهی را در مورد امنیت و حریم خصوصی داده‌های کاربران ایجاد می‌کند.

علاوه بر این، مدل‌های هوش مصنوعی برجسته مانند ChatGPT و جمینای گوگل نسبت به دیپ‌سیک توصیه به احتیاط کرده‌اند.

این نگرانی‌ها شامل پتانسیل بدافزارهای مخفی یا مکانیسم‌های نظارتی است که در این نرم‌افزار قابل تعبیه است و می‌تواند امنیت کاربران را به خطر بیندازد.

اقدامات امنیتی دیپ‌سیک پس از یک نقص امنیتی گزارش شده در ماه دسامبر که آسیب‌پذیری‌هایی را برای امکان سرقت احتمالی حساب‌ها فراهم می‌کرد، مورد تردید قرار گرفت، اگرچه این مشکل متعاقباً اصلاح شد.

این وضعیت زمانی تشدید شد که شرکت «دیپ‌سیک» در میان افزایش دانلودها فاش کرد که دستیار هوش مصنوعی آن هدف یک «حمله مخرب در مقیاس بزرگ» قرار گرفته است که نشان‌دهنده چالش‌های امنیتی برای آن است. این حادثه بر خطرات مرتبط با استفاده از دیپ‌سیک، به‌ویژه در مورد حفاظت از داده‌های شخصی پردازش شده توسط هوش مصنوعی تاکید می‌کند.

کاربران و ذینفعان در فناوری هوش مصنوعی باید این خطرات حریم خصوصی و امنیتی را هنگام ادغام یا استفاده از ابزارهای هوش مصنوعی مانند DeepSeek در نظر بگیرند. نگرانی‌ها فقط در مورد حریم خصوصی داده‌ها نیست، بلکه پیامدهای گسترده‌تری در مورد استفاده از داده‌های جمع‌آوری‌شده برای اهدافی فراتر از کنترل یا آگاهی کاربر، از جمله آموزش مدل‌های هوش مصنوعی یا سایر فعالیت‌های فاش نشده است.

همانطور که فناوری هوش مصنوعی در حال تکامل است، اطمینان از شفافیت و اقدامات امنیتی قوی در حفظ اعتماد کاربران و محافظت از اطلاعات شخصی در برابر سوء استفاده بسیار مهم خواهد بود.

مطمئناً دیپ‌سیک پویایی بازار را تغییر داده و بحث‌های اخلاقی مختلفی را مطرح کرده است، اما برخی از سؤالات بزرگ هنوز باقی می‌مانند. مثلا آیا دیپ‌سیک کتاب تاریخ هوش مصنوعی را بازنویسی می‌کند؟ چه موانع غیرمنتظره‌ای می‌تواند از شتاب توسعه آن بکاهد و محبوبیت آن را کاهش دهد یا شاید حتی منجر به نابودی آن شود؟

به هر حال، مسیر پیش رو برای این هوش مصنوعی انقلابی و بلندپرواز، پر از احتمالات و مشکلات است و تنها زمان نشان خواهد داد که این فناوری جسورانه چگونه عمل خواهد کرد.

برچسب ها :