top of page

时序差分学习演示

为 K-12 学生演示时序差分 (TD) 学习的网络演示程序。  

职位

设计师、程序员

时间

2022年

地点

卡内基梅隆大学

Github

  • Github

JavaScript

HTML

机器学习

该项目基于 Andrej Kartpathy 的 REINFORCE.js,旨在为学习人工智能的中小学生展示时序差分(TD) learning。

我实现了例如随机行为、个性化迷宫和学习数值等新的功能。

bottom of page