\n\n\n\n text-embedding-3-small : O modelo de integração de referência da OpenAI explicado - AgntDev \n

text-embedding-3-small : O modelo de integração de referência da OpenAI explicado

📖 5 min read859 wordsUpdated Apr 5, 2026

O modelo text-embedding-3-small da OpenAI é um dos modelos de embedding mais utilizados para aplicações de IA. É a escolha preferida dos desenvolvedores que constroem sistemas de busca, de RAG (geração aumentada por recuperação) e de classificação. Aqui está tudo que você precisa saber.

O que é

text-embedding-3-small é um modelo de embedding da OpenAI que converte texto em vetores numéricos (embeddings). Esses vetores capturam o significado semântico do texto, permitindo a busca de similaridades, o agrupamento e a classificação.

Quando você envia um texto para o modelo, ele retorna um vetor de 1.536 dimensões (por padrão). Textos com significados semelhantes produzem vetores próximos entre si nesse espaço de alta dimensão.

Especificações chave

Dimensões: 1.536 (por padrão), pode ser reduzido até 256 usando o aprendizado de representação Matryoshka. A redução de dimensões permite economizar espaço de armazenamento e acelerar a busca com uma perda mínima de qualidade.

Entrada máx: 8.191 tokens (~6.000 palavras). Longo o suficiente para a maioria dos documentos e extratos.

Desempenho: Bom desempenho em benchmarks padrões (MTEB). Não é o melhor de todos, mas excelente para seu tamanho e custo.

Custo: 0,02 $ por milhão de tokens. Extremamente econômico: o embedding de um milhão de palavras custa cerca de 3 centavos.

text-embedding-3-small vs. text-embedding-3-large

A OpenAI oferece dois modelos de embedding na família v3:

text-embedding-3-small: 1.536 dimensões, 0,02 $/M token. Bom desempenho, muito econômico.

text-embedding-3-large: 3.072 dimensões, 0,13 $/M token. Melhor desempenho, 6,5 vezes mais caro.

Para a maioria das aplicações, text-embedding-3-small é a melhor escolha. A diferença de qualidade é mínima e as economias de custo são significativas. Use text-embedding-3-large somente quando precisar da máxima precisão de recuperação e o custo não for um problema.

Casos de uso comuns

Busca semântica. Converta documentos e consultas em embeddings e, em seguida, encontre os documentos mais similares para cada consulta. Isso alimenta as funcionalidades de busca em aplicações de IA, bases de conhecimento e sites de documentação.

RAG (Geração aumentada por recuperação). O caso de uso mais comum. Integre seus documentos, armazene-os em um banco de dados vetorial e recupere o contexto relevante quando os usuários fizerem perguntas. O contexto recuperado é então passado para um LLM para gerar respostas precisas.

Classificação. Use os embeddings como características para a classificação de texto. Os embeddings capturam o significado semântico, tornando a classificação mais precisa em comparação com abordagens baseadas em palavras-chave.

Agrupamento. Agrupe documentos semelhantes com base em seus embeddings. Útil para organizar grandes coleções de documentos, identificar tópicos e detectar duplicatas.

Recomendação. Encontre artigos semelhantes (produtos, itens, conteúdos) com base na similaridade dos embeddings. Mais sutil do que o matching por palavras-chave, pois compreende as relações semânticas.

Como usar

Uso da API OpenAI:

Chame o endpoint de embeddings com seu texto e o nome do modelo “text-embedding-3-small”. A API retorna um vetor que você pode armazenar em um banco de dados vetorial (Pinecone, Weaviate, ChromaDB, pgvector) ou usar diretamente para cálculos de similaridade.

Para a redução de dimensões, passe o parâmetro “dimensões” com o tamanho desejado (por exemplo, 256, 512, 1024). O modelo usa o aprendizado de representação Matryoshka para produzir vetores mais curtos que mantêm a maior parte das informações semânticas.

Dicas para obter melhores resultados

Divida seus documentos. Não insira documentos inteiros como vetores únicos. Divida-os em pedaços de 200 a 500 tokens para uma melhor precisão de recuperação.

Use pedaços significativos. Divida nos limites de parágrafo ou seção, em vez de em contagens de tokens arbitrárias. A coerência semântica dentro dos pedaços melhora a qualidade da recuperação.

Considere a redução das dimensões. Para aplicações em larga escala, reduzir as dimensões de 1.536 para 512 ou 256 pode reduzir significativamente os custos de armazenamento e acelerar a busca com uma perda mínima de qualidade.

Normaliza os vetores. Para a pesquisa de similaridade cosseno, normalize seus vetores. A maioria dos bancos de dados vetoriais faz isso automaticamente.

Alternativas

Cohere Embed v3: Qualidade competitiva, suporta bem várias línguas.
Voyage AI: Ótimo desempenho, especialmente para código e conteúdos técnicos.
BGE (BAAI): Open-source, pode ser executado localmente. Boa qualidade para uma opção gratuita.
Nomic Embed: Open-source com desempenho competitivo.

Minha opinião

text-embedding-3-small é a escolha padrão para a maioria das aplicações de IA. É econômico, rápido, fácil de usar e suficientemente bom para a grande maioria dos casos de uso. Comece aqui e considere outras opções apenas se você tiver requisitos específicos (melhor suporte multilíngue, implantação local ou máxima precisão) que justifiquem a mudança.

🕒 Published:

✍️
Written by Jake Chen

AI technology writer and researcher.

Learn more →
Browse Topics: Agent Frameworks | Architecture | Dev Tools | Performance | Tutorials
Scroll to Top