O modelo text-embedding-3-small da OpenAI é um dos modelos de embedding mais utilizados para aplicações de IA. É a escolha preferida dos desenvolvedores que constroem sistemas de busca, de RAG (geração aumentada por recuperação) e de classificação. Aqui está tudo que você precisa saber.
O que é
text-embedding-3-small é um modelo de embedding da OpenAI que converte texto em vetores numéricos (embeddings). Esses vetores capturam o significado semântico do texto, permitindo a busca de similaridades, o agrupamento e a classificação.
Quando você envia um texto para o modelo, ele retorna um vetor de 1.536 dimensões (por padrão). Textos com significados semelhantes produzem vetores próximos entre si nesse espaço de alta dimensão.
Especificações chave
Dimensões: 1.536 (por padrão), pode ser reduzido até 256 usando o aprendizado de representação Matryoshka. A redução de dimensões permite economizar espaço de armazenamento e acelerar a busca com uma perda mínima de qualidade.
Entrada máx: 8.191 tokens (~6.000 palavras). Longo o suficiente para a maioria dos documentos e extratos.
Desempenho: Bom desempenho em benchmarks padrões (MTEB). Não é o melhor de todos, mas excelente para seu tamanho e custo.
Custo: 0,02 $ por milhão de tokens. Extremamente econômico: o embedding de um milhão de palavras custa cerca de 3 centavos.
text-embedding-3-small vs. text-embedding-3-large
A OpenAI oferece dois modelos de embedding na família v3:
text-embedding-3-small: 1.536 dimensões, 0,02 $/M token. Bom desempenho, muito econômico.
text-embedding-3-large: 3.072 dimensões, 0,13 $/M token. Melhor desempenho, 6,5 vezes mais caro.
Para a maioria das aplicações, text-embedding-3-small é a melhor escolha. A diferença de qualidade é mínima e as economias de custo são significativas. Use text-embedding-3-large somente quando precisar da máxima precisão de recuperação e o custo não for um problema.
Casos de uso comuns
Busca semântica. Converta documentos e consultas em embeddings e, em seguida, encontre os documentos mais similares para cada consulta. Isso alimenta as funcionalidades de busca em aplicações de IA, bases de conhecimento e sites de documentação.
RAG (Geração aumentada por recuperação). O caso de uso mais comum. Integre seus documentos, armazene-os em um banco de dados vetorial e recupere o contexto relevante quando os usuários fizerem perguntas. O contexto recuperado é então passado para um LLM para gerar respostas precisas.
Classificação. Use os embeddings como características para a classificação de texto. Os embeddings capturam o significado semântico, tornando a classificação mais precisa em comparação com abordagens baseadas em palavras-chave.
Agrupamento. Agrupe documentos semelhantes com base em seus embeddings. Útil para organizar grandes coleções de documentos, identificar tópicos e detectar duplicatas.
Recomendação. Encontre artigos semelhantes (produtos, itens, conteúdos) com base na similaridade dos embeddings. Mais sutil do que o matching por palavras-chave, pois compreende as relações semânticas.
Como usar
Uso da API OpenAI:
Chame o endpoint de embeddings com seu texto e o nome do modelo “text-embedding-3-small”. A API retorna um vetor que você pode armazenar em um banco de dados vetorial (Pinecone, Weaviate, ChromaDB, pgvector) ou usar diretamente para cálculos de similaridade.
Para a redução de dimensões, passe o parâmetro “dimensões” com o tamanho desejado (por exemplo, 256, 512, 1024). O modelo usa o aprendizado de representação Matryoshka para produzir vetores mais curtos que mantêm a maior parte das informações semânticas.
Dicas para obter melhores resultados
Divida seus documentos. Não insira documentos inteiros como vetores únicos. Divida-os em pedaços de 200 a 500 tokens para uma melhor precisão de recuperação.
Use pedaços significativos. Divida nos limites de parágrafo ou seção, em vez de em contagens de tokens arbitrárias. A coerência semântica dentro dos pedaços melhora a qualidade da recuperação.
Considere a redução das dimensões. Para aplicações em larga escala, reduzir as dimensões de 1.536 para 512 ou 256 pode reduzir significativamente os custos de armazenamento e acelerar a busca com uma perda mínima de qualidade.
Normaliza os vetores. Para a pesquisa de similaridade cosseno, normalize seus vetores. A maioria dos bancos de dados vetoriais faz isso automaticamente.
Alternativas
Cohere Embed v3: Qualidade competitiva, suporta bem várias línguas.
Voyage AI: Ótimo desempenho, especialmente para código e conteúdos técnicos.
BGE (BAAI): Open-source, pode ser executado localmente. Boa qualidade para uma opção gratuita.
Nomic Embed: Open-source com desempenho competitivo.
Minha opinião
text-embedding-3-small é a escolha padrão para a maioria das aplicações de IA. É econômico, rápido, fácil de usar e suficientemente bom para a grande maioria dos casos de uso. Comece aqui e considere outras opções apenas se você tiver requisitos específicos (melhor suporte multilíngue, implantação local ou máxima precisão) que justifiquem a mudança.
🕒 Published: