发布于 : Apr 26, 2023
Apr 2023
评估
在了解它将对你的企业产生什么影响的前提下值得探索
nanoGPT 是一个用于对中等规模的生成式预训练 Transformer(GPT)进行训练和调优的框架。其作者 Andrej Karpathy 基于注意力机制和 OpenAI 的 GPT-3 两篇论文的理论,使用 PyTorch 从零开始构建一个 GPT。在生成式人工智能火热的趋势下,我们想要强调 nanoGPT 的简洁性,并且注重对 GPT 架构的构建模块进行清晰呈现。