
جایزه تورینگ امسال به اندرو بارو و ریچارد ساتون رسید. شاگرد و استادی که از دهه ۱۹۸۰روی یادگیری تقویتی کار کردن و حالا ثمره کارشون همه جا هست. توی این ویدئو سعی میکنم بگم یادگیری تقویتی چطوری کار میکنه؛ منابعی رو معرفی کنم و یه برنامه کوچیک رو هم باهاش نشون بدم که با کتابخونههای اوپن ای آی مرتبطش آشنا بشیم.
https://youtu.be/7t3VkcdUnww#برنامه_نویسی #هوش_مصنوعی #پایتون #خبر
یادگیری تقویتی رو با دست به کد شدن درک کنین | به بهانه اهدای جایزه تورینگ امسال
امروز اندرو بارتو و ریچارد ساتون به عنوان برندگان جایزه تورینگ معرفی شدن؛ جایزهای که به عنوان نوبل کامپیوتر شناخته میشه. هر دوی اونها دههها است که روی یادگیری تقویتی کار کردن؛ حوزهای که بسیاری از هوش مصنوعیهایی که اطرافمون میبینیم ازش بهره میبرن. از…
View Source