Biblioteca de Artigos
LLM
Artigo #11
Alinhamento de Valores em LLMs via Aprendizado por Reforço com Feedback Humano
# Reinforcement Learning from Human Feedback e Alinhamento de Valores Humanos: Uma Análise Abrangente dos Mecanismos de...
LLM
Artigo #8
Teoria dos Jogos Cooperativa para Alinhamento Multi-Stakeholder em Modelos de Li...
# Teoria dos Jogos Cooperativa para Alinhamento Multi-Stakeholder em Large Language Models: Uma Abordagem Formal para Ha...
LLM
Artigo #3
Análise de Neural Tangent Kernels no Regime Lazy Training de Transformers de Gra...
# Neural Tangent Kernels e Regime Lazy Training em Transformers de Grande Escala: Uma Análise Teórica da Dinâmica de Tre...
LLM
Artigo #2
Análise de Neural Tangent Kernels em Arquiteturas Transformer para Modelos de Li...
# Neural Tangent Kernels Applied to Transformers: A Theoretical Framework for Understanding Large Language Model Dynamic...