AI-Powered
Legenda de Imagem
Gere legendas descritivas para fotos usando IA.
Your files stay on your device - processed locally via WebAssembly, never uploaded
Caption Style
Output Format
Tone
Model
Solte seus arquivos aqui
JPEG, PNG, WebP, HEIC - drop multiple for batch, or paste (Ctrl+V)
Embed this tool on your website
Copy this code to add the Legenda de Imagem to your site for free. It runs entirely in your visitors' browsers - no API key, no usage limits.
<iframe src="https://optipix.art/embed/image-captioner" width="100%" height="600" style="border:1px solid #e4e4e7;border-radius:8px;" title="Legenda de Imagem by OptiPix" loading="lazy"></iframe> <p style="font-size:12px">Free tool by <a href="https://optipix.art/image-captioner">OptiPix Legenda de Imagem</a></p>
❤️ Love this tool? Support our team.
No ads, no tracking, no limits. Tips keep 104 tools free for everyone.
Secure payment via Stripe · No account needed
About Legenda de Imagem
Last updated: May 2026
O OptiPix Image Captioner usa um modelo ViT-GPT2 de linguagem visual para gerar automaticamente legendas de texto descritivas para suas fotografias. O modelo combina um codificador Vision Transformer (que entende o conteúdo da imagem) com um decodificador de linguagem GPT-2 (que gera linguagem natural) para produzir descrições legíveis por humanos do que aparece em suas imagens. Isso é inestimável para criar texto alternativo para acessibilidade na web, gerar descrições de fotos para postagens em mídias sociais, catalogar bibliotecas de imagens com descrições de texto e auxiliar usuários com deficiência visual a entender o conteúdo da imagem. O modelo é executado inteiramente no seu navegador usando Hugging Face Transformers.js - suas fotos nunca saem do seu dispositivo. As legendas são geradas em inglês e podem ser editadas antes de copiar ou baixar. O modelo é baixado uma vez (aproximadamente 100 MB) e funciona offline depois. O processamento geralmente leva de 2 a 5 segundos, dependendo do seu dispositivo.
How It Works
A ferramenta usa um modelo ViT-GPT2 do Hugging Face Transformers.js. O codificador Vision Transformer processa a imagem em uma representação de recursos, que é então decodificada pelo modelo de linguagem GPT-2 para gerar uma legenda em linguagem natural descrevendo o conteúdo da imagem.
Use Cases
- •Gerar texto alternativo para imagens de sites para melhorar a acessibilidade
- •Criar descrições de fotos para postagens em mídias sociais
- •Catalogar bibliotecas de imagens com descrições de texto
- •Auxiliar usuários com deficiência visual a entender fotos
- •Descrever automaticamente imagens para fins de documentação
You Might Also Like
If you find Legenda de Imagem useful, check out these related tools: OCR Text Extractor, Depth Estimation, and Object Detection. All tools run entirely in your browser with no uploads or signups required.
Explore more: Browse all tools · Step-by-step guides · Tips & tutorials · Compare tools
Frequently Asked Questions
Quão boas são as legendas geradas?
Posso editar a legenda gerada?
Isso é útil para acessibilidade na web?
Em que idioma estão as legendas?
Qual o tamanho do download do modelo?
Related Tools
Extrator de Texto OCR
Extraia texto de qualquer imagem em vários idiomas.
Estimativa de Profundidade
Gere mapas de profundidade a partir de imagens 2D usando IA.
Detecção de Objetos
Detecte e rotule objetos em imagens com caixas delimitadoras.
Classificador de Imagem
Classifique o conteúdo da imagem com pontuações de confiança de IA.