Publicado : Apr 26, 2023
NÃO ENTROU NA EDIÇÃO ATUAL
Este blip não está na edição atual do Radar. Se esteve em uma das últimas edições, é provável que ainda seja relevante. Se o blip for mais antigo, pode não ser mais relevante e nossa avaliação pode ser diferente hoje. Infelizmente, não conseguimos revisar continuamente todos os blips de edições anteriores do Radar.
Saiba mais
Apr 2023
Avalie
nanoGPT é um framework para treinar e afinar transformadores generativos pré-treinados (GPT) de tamanho médio. O autor, Andrej Karpathy, se baseia nos artigos Attention is All You Need e OpenAI's GPT-3 para criar um GPT do zero usando o PyTorch. Com todo o barulho em torno da IA generativa, queríamos destacar o nanoGPT por sua simplicidade e sua preocupação em articular sem ambiguidade os blocos constitutivos da arquitetura GPT.