前特斯拉AI总监盛赞DeepSeek RL技术突破人类限制

2025-02-07　来源：pengjian

前特斯拉AI总监盛赞DeepSeek。如果只是模仿人类玩家，AI无法超越人类，但纯强化学习算法却能突破这种限制。

近日，斯坦福大学李飞飞等人推出了S1模型。随后，李飞飞的学生、OpenAI早期成员与前特斯拉AI总监录制了一期长达3小时的视频，详细介绍了从神经网络的起源到GPT-2、ChatGPT再到最近的DeepSeek-R1等大模型的发展历程。视频讲解通俗易懂，即使没有技术背景的人也能轻松理解。

前特斯拉AI总监盛赞DeepSeek RL技术突破人类限制

在视频中，Andrej Karpathy对最近爆火的DeepSeek-R1论文进行了深入介绍，指出其性能与OpenAI的模型不相上下，并推动了强化学习技术的发展。他还高度评价了纯强化学习的学习能力，但也提到这种方法非常擅长“欺骗”模型，阻碍了其成为专业技术的步伐。Karpathy提出了一个名为“瑞士奶酪”的大模型能力框架，提醒人们不要完全依赖这些模型。

前特斯拉AI总监盛赞DeepSeek RL技术突破人类限制

Karpathy表示，在不久的将来，人们可能会看到能够执行长期任务的“智能体”，而人类将成为数字领域中智能体任务的监督者。

军事

前特斯拉AI总监盛赞DeepSeek RL技术突破人类限制

相关推荐：