Publicado : Apr 26, 2023
Apr 2023
Avalie
Vale a pena explorar com o objetivo de compreender como isso afetará sua empresa.
nanoGPT é um framework para treinar e afinar transformadores generativos pré-treinados (GPT) de tamanho médio. O autor, Andrej Karpathy, se baseia nos artigos Attention is All You Need e OpenAI's GPT-3 para criar um GPT do zero usando o PyTorch. Com todo o barulho em torno da IA generativa, queríamos destacar o nanoGPT por sua simplicidade e sua preocupação em articular sem ambiguidade os blocos constitutivos da arquitetura GPT.
