Glossário

LLM (Large Language Model)

Modelo de inteligência artificial treinado em grandes volumes de texto que gera linguagem natural e executa tarefas cognitivas via predição de próximos tokens.

Definição completa

LLM (Large Language Model) é um modelo de inteligência artificial baseado em arquitetura Transformer (Vaswani et al., 2017), treinado em volumes massivos de texto (centenas de bilhões a trilhões de tokens), que gera linguagem natural via predição autoregressiva do próximo token dado um contexto.

LLMs modernos (GPT-4o, Claude 4.x, Gemini 2.x, Llama 3) operam em escala de 70 bilhões a 1 trilhão+ de parâmetros, executam tarefas cognitivas como tradução, sumarização, raciocínio matemático, programação e diálogo, e atingem performance comparável ou superior a humanos em benchmarks específicos.

Limitações estruturais: hallucination (geram texto plausível mas factualmente incorreto quando saem da distribuição de treino), janela de contexto finita (de 8k a 2M tokens), conhecimento congelado na data de treino, custo de inferência proporcional a tokens, latência crescente com tamanho da resposta.

Em produção, LLMs exigem engenharia adicional: guardrails para limitar output, eval contínuo para detectar degradação, observability (tracing, custo, latência), routing entre modelos por complexidade da query, e cache para reduzir custo.

Referências externas

Termos relacionados