
هفته گذشته بحث مدل زبانی بزرگ DeepSeek خیلی داغ شد. این چند وقت کلی خبر در مورد مدلهای زبانی بوده و من هیچ وقت سراغ «وای این مدل اومده» نرفتم چون به نظرم مسیری ادامه دار است ولی دیپ سیک واقعا قدمی رو به جلو بود. بخصوص مهم برای ما. چون:
۱. آزاد است و می تونیم به خوبی ازش استفاده کنیم و بفهمیم چه میکنه
۲. ساخت مدلش بسیار کم هزینهتر از مدلهای قبلی بوده
۳. استفاده ازش بسیار کم هزینهتر از مدلهای دیگه بوده
این شد که فکر کردم آخر روز کاریام کمی در موردش گپ بزنم. ویدئوی چیزی بین بحث فنی / بحث عمومی است و نسبتا فی البداهه ولی به نظرم درک خوبی از ماجرا میده.
https://youtu.be/ej1uoCib7WM
گپی در مورد اهمیت دیپ سیک به عنوان قدم بعدی در مدلهای زبانی بزرگ
در دو سال گذشته کلی خبر داشتیم که «وای این مدل جدید هوش مصنوعی رو دیدین؟» ولی خبر «وای دیپ سیک رو دیدین؟» کمی فرق داره! این مدل جدید چند قدم جلوتر از راهی است که تا الان اومدیم چون:
۱. آزاده
۲. با منابع بسیار کمتری درست شده
۳. با منابع بسیار کمتری قابل استفاده…
View Source