هفته گذشته بحث مدل زبانی بزرگ DeepSeek خیلی داغ شد. این چند وقت کلی خبر در مورد …


هفته گذشته بحث مدل زبانی بزرگ DeepSeek خیلی داغ شد. این چند وقت کلی خبر در مورد مدل‌های زبانی بوده و من هیچ وقت سراغ «وای این مدل اومده» نرفتم چون به نظرم مسیری ادامه دار است ولی دیپ سیک واقعا قدمی رو به جلو بود. بخصوص مهم برای ما. چون:
۱. آزاد است و می تونیم به خوبی ازش استفاده کنیم و بفهمیم چه می‌کنه
۲. ساخت مدلش بسیار کم هزینه‌تر از مدل‌های قبلی بوده
۳. استفاده ازش بسیار کم هزینه‌تر از مدل‌های دیگه بوده
این شد که فکر کردم آخر روز کاری‌ام کمی در موردش گپ بزنم. ویدئوی چیزی بین بحث فنی / بحث عمومی است و نسبتا فی البداهه ولی به نظرم درک خوبی از ماجرا می‌ده.
https://youtu.be/ej1uoCib7WM

گپی در مورد اهمیت دیپ سیک به عنوان قدم بعدی در مدل‌های زبانی بزرگ

در دو سال گذشته کلی خبر داشتیم که «وای این مدل جدید هوش مصنوعی رو دیدین؟» ولی خبر «وای دیپ سیک رو دیدین؟» کمی فرق داره! این مدل جدید چند قدم جلوتر از راهی است که تا الان اومدیم چون:
۱. آزاده
۲. با منابع بسیار کمتری درست شده
۳. با منابع بسیار کمتری قابل استفاده…


View Source

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا