O torchtitan é uma plataforma nativa do PyTorch para o pré-treinamento em larga escala de modelos de IA generativa, fornecendo uma implementação de referência limpa e modular para treinamento distribuído de alto desempenho. Ele reúne primitivas distribuídas avançadas em um sistema coeso, suportando paralelismo 4D: paralelismo de dados, de tensor, de pipeline e de contexto. Como o treinamento de modelos na escala do Llama 3.1 405B exige escala e eficiência significativas, o torchtitan oferece uma base prática para construir e operar grandes cargas de trabalho de treinamento. Seu design modular torna mais fácil para os times experimentarem e evoluírem estratégias de paralelismo, mantendo a prontidão para produção. Vemos o torchtitan como um passo útil em direção à padronização do treinamento de modelos em larga escala no ecossistema PyTorch, particularmente para times que constroem sua própria infraestrutura de pré-treinamento.