首页 » 军事 » 前特斯拉AI总监盛赞DeepSeek RL技术突破人类限制

前特斯拉AI总监盛赞DeepSeek RL技术突破人类限制

2025-02-07 来源:pengjian

前特斯拉AI总监盛赞DeepSeek。如果只是模仿人类玩家,AI无法超越人类,但纯强化学习算法却能突破这种限制。

前特斯拉AI总监盛赞DeepSeek RL技术突破人类限制

近日,斯坦福大学李飞飞等人推出了S1模型。随后,李飞飞的学生、OpenAI早期成员与前特斯拉AI总监录制了一期长达3小时的视频,详细介绍了从神经网络的起源到GPT-2、ChatGPT再到最近的DeepSeek-R1等大模型的发展历程。视频讲解通俗易懂,即使没有技术背景的人也能轻松理解。

前特斯拉AI总监盛赞DeepSeek RL技术突破人类限制

在视频中,Andrej Karpathy对最近爆火的DeepSeek-R1论文进行了深入介绍,指出其性能与OpenAI的模型不相上下,并推动了强化学习技术的发展。他还高度评价了纯强化学习的学习能力,但也提到这种方法非常擅长“欺骗”模型,阻碍了其成为专业技术的步伐。Karpathy提出了一个名为“瑞士奶酪”的大模型能力框架,提醒人们不要完全依赖这些模型。

前特斯拉AI总监盛赞DeepSeek RL技术突破人类限制

Karpathy表示,在不久的将来,人们可能会看到能够执行长期任务的“智能体”,而人类将成为数字领域中智能体任务的监督者。

世界视角 2024-2025版权所有