INFO:
深度解析ChatGPT与DeepSeek R1:强化学习如何让大模型学会“思考”? by Andrej Karpathy