发布于 : Apr 26, 2023
不在本期内容中
这一条目不在当前版本的技术雷达中。如果它出现在最近几期中,那么它很有可能仍然具有相关参考价值。如果这一条目出现在更早的雷达中,那么它很有可能已经不再具有相关性,我们的评估将不再适用于当下。很遗憾我们没有足够的带宽来持续评估以往的雷达内容。
了解更多
Apr 2023
评估
nanoGPT 是一个用于对中等规模的生成式预训练 Transformer(GPT)进行训练和调优的框架。其作者 Andrej Karpathy 基于注意力机制和 OpenAI 的 GPT-3 两篇论文的理论,使用 PyTorch 从零开始构建一个 GPT。在生成式人工智能火热的趋势下,我们想要强调 nanoGPT 的简洁性,并且注重对 GPT 架构的构建模块进行清晰呈现。