Luiz Eduardo de Oliveira Fonseca

Fundador e Mentor

Programador há mais de 20 anos, especialista em Mautic e Automação de Marketing. Fundador da Powertic e da Promovaweb. Embaixador global do n8n (Community Awards 2024/2025), Bas...

Mais Recentes

Como medir produtividade no Vibe Coding sem vaidade

Por luizeof | 8 de janeiro de 2026

Um Pull Request enorme gerado por IA pode parecer avanço antes de qualquer validação real, pois a tela do GitHub fica cheia de arquivos alterados e transmite a sensação de trabalho concluído. Medir produtividade no Vibe Coding exige olhar além desse volume inicial e entender o que ficou mais fácil de usar, vender, revisar ou explicar no produto digital.

Direto ao ponto

Medir produtividade no Vibe Coding exige avaliar hipótese validada, custo de manutenção e impacto no produto digital, pois linhas de código, commits e arquivos alterados mostram atividade técnica sem provar avanço real. A entrega só merece ser chamada de produtiva quando melhora uso, revisão, suporte ou clareza de decisão de maneira observável.

Um Pull Request grande pode representar avanço quando responde uma hipótese clara e simplifica alguma parte relevante da experiência, mas também pode concentrar decisões que ninguém revisou com calma. No Vibe Coding, a IA muda o ritmo da entrega, enquanto a responsabilidade de decidir o que merece entrar no produto digital continua humana.

Por isso, eu não uso linhas de código como métrica principal, porque elas revelam atividade técnica sem mostrar qualidade da decisão. Produtividade aparece quando a entrega melhora uma parte observável do produto digital e continua compreensível depois que a empolgação inicial passa.

Como medir produtividade no Vibe Coding sem contar linhas

O jeito mais direto de medir produtividade no Vibe Coding é separar atividade de aprendizado, visto que a IA facilita a geração de telas, endpoints, componentes, testes e ajustes. Aprendizado surge quando aquela entrega responde uma dúvida real do produto digital e orienta a próxima decisão com mais segurança.

Essa diferença fica mais importante com IA porque ficou barato gerar variações, experimentar caminhos e empilhar alternativas técnicas em pouco tempo. Um projeto pode criar três versões de uma funcionalidade e ainda terminar sem clareza sobre qual comportamento do usuário deveria mudar.

Quando eu reviso esse tipo de entrega, começo pela hipótese que aquela mudança deveria testar e pelo sinal que justificaria manter o que foi criado. Se ninguém consegue explicar esse vínculo com precisão, o problema começou na decisão anterior ao código.

Uma hipótese útil pode ser simples, desde que indique o comportamento que precisa mudar e o sinal que será observado depois da entrega. Ela pode envolver redução de dúvida no onboarding, menos retrabalho no suporte, proposta mais clara, cadastro mais curto ou validação de entendimento sobre uma nova tela.

Sem essa hipótese, o gestor responsável pelo produto digital corre o risco de medir produção por esforço visível e confundir volume com progresso. O repositório cresce, enquanto a experiência do cliente pode seguir carregando a mesma dúvida, a mesma etapa confusa ou a mesma dependência de explicação manual.

Volume de código é um sinal fraco

Código gerado por IA ainda precisa ser lido por alguém capaz de revisar regra, testar fluxo, entender decisão e alterar aquilo depois. Essa leitura posterior entra na conta de produtividade, pois toda entrega aceita sem compreensão transfere custo para a próxima manutenção.

Essa parte costuma ser esquecida porque a geração é rápida e visualmente satisfatória, principalmente quando a interface aparece pronta em poucos minutos. A IA entrega algo pronto para olhar, mas o custo de permanência começa quando a mudança entra no ciclo real de suporte, revisão e evolução.

Um componente novo pode parecer simples hoje e virar dificuldade depois quando traz estados desnecessários, dependências excessivas ou lógica presa ao prompt original. Uma API pode funcionar no teste inicial e ainda complicar integrações futuras, especialmente quando as regras de negócio ficam espalhadas em lugares difíceis de revisar.

Por isso, volume deve acender atenção editorial e técnica, em vez de virar medalha automática para a entrega gerada por IA. Se a IA produziu muita coisa, eu quero saber se o projeto ganhou clareza proporcional para revisar, explicar e sustentar aquela mudança.

A primeira métrica é hipótese validada

Produtividade começa quando uma entrega responde uma dúvida concreta do produto digital e aproxima o projeto de uma decisão melhor. Essa dúvida pode vir do suporte, da área comercial, do onboarding, do uso recorrente ou da revisão técnica feita por quem mantém o sistema.

Existe avanço quando uma nova tela reduz dúvida sobre o próximo passo, diminui contatos repetidos no suporte ou deixa uma entrega mais fácil de demonstrar na conversa comercial. O ponto comum nesses exemplos é a relação entre mudança e efeito observado, sem depender da quantidade de arquivos alterados.

Nenhum desses exemplos depende de contar linhas, porque a métrica principal está na resposta que a entrega produz dentro do uso real. O que importa é conseguir explicar qual hipótese foi testada, qual sinal mudou e por que aquela mudança deve permanecer no produto digital.

Esse critério evita uma armadilha comum em projetos com IA, que é transformar qualquer ideia em implementação pela simples facilidade de gerar código. A produtividade cresce quando o projeto escolhe melhor o que construir, não quando aceita toda variação tecnicamente possível.

A segunda métrica é custo de manutenção

Uma entrega produtiva precisa continuar legível depois da primeira demonstração, pois alguém terá de corrigir erro, adaptar regra e explicar a decisão no futuro. Se quem lidera o projeto precisa perguntar à IA como o código funciona duas semanas depois, a produtividade foi menor do que parecia no momento da geração.

Eu olho para manutenção com sinais práticos, como revisão sem depender da conversa original com a IA, teste cobrindo o comportamento principal e regra em lugar previsível. Também observo se a próxima alteração terá baixo custo de leitura, porque código produtivo precisa continuar editável por humanos.

Esses critérios preservam o valor da IA, porque separam capacidade de geração de qualidade de sustentação do produto digital. Eles protegem o projeto de confundir ritmo inicial com boa engenharia e ajudam a manter a entrega compreensível depois da primeira aprovação.

O Vibe Coding funciona melhor quando a IA reduz esforço de execução e o humano preserva critério sobre escopo, arquitetura e manutenção. Sem esse equilíbrio, o projeto ganha código rapidamente, mas perde capacidade de mudar com segurança nas próximas decisões.

A terceira métrica é impacto no produto

Impacto no produto digital aparece quando a entrega muda uso, suporte, ativação, retenção, conversa comercial ou aprendizado sobre o cliente. Em muitos casos, uma mudança pequena vale mais do que uma camada técnica nova, desde que resolva uma dúvida real da jornada.

Uma mensagem melhor em um estado vazio pode reduzir dúvida do usuário, enquanto uma validação mais clara pode evitar chamados repetidos no suporte. Um fluxo menor pode antecipar o resultado esperado, e uma remoção bem escolhida pode deixar a interface mais compreensível para quem usa.

Esse tipo de impacto costuma ser mais difícil de exibir em print, mas ajuda muito mais na decisão de prioridade. O projeto precisa ficar mais fácil de usar, explicar e manter, em vez de apenas parecer maior na demonstração.

Uma tabela curta para revisar produtividade

Revisão	Sinal saudável	Sinal de alerta
Hipótese testada	A entrega responde uma dúvida concreta	A funcionalidade nasceu porque era fácil gerar
Custo de manutenção	O fluxo é legível, testável e delimitado	A mudança exige referência demais para revisão
Impacto no produto	Houve efeito em uso, suporte, ativação ou venda	O produto ganhou volume sem aprendizado claro

Essa tabela não substitui julgamento, porque cada entrega precisa ser lida dentro do escopo, da base técnica e da necessidade do cliente. Ela organiza a conversa para que o gestor responsável pelo produto digital pare de chamar qualquer entrega grande de produtividade.

O que muda na rotina de quem usa IA

Quando a métrica muda, o comportamento muda junto, pois pessoas orientadas por volume tendem a produzir volume. Se Pull Request grande vira celebração automática, a rotina começa a associar produtividade a tamanho, mesmo quando a mudança aumenta custo de revisão.

Quando você mede hipótese, manutenção e impacto, a conversa fica mais útil para decidir escopo, revisar entrega e priorizar próximos passos. Quem lidera o produto digital passa a formular melhor a hipótese, revisar antes de aceitar e escolher a solução menor quando ela resolve o mesmo problema com leitura melhor.

Esse comportamento mostra maturidade no uso de IA, porque a ferramenta continua importante sem ocupar o lugar do critério técnico. A decisão fica com quem responde pela arquitetura, pela experiência do cliente e pela manutenção depois da entrega.

Na prática, eu prefiro um projeto que entrega uma melhoria pequena, revisável e ligada ao uso real do que uma sequência de entregas grandes que ninguém consegue sustentar depois. Essa preferência orienta a forma como avalio produtividade com IA, pois o ganho relevante precisa sobreviver à revisão, ao suporte e à próxima mudança.

Onde a Formação IA Makers entra

Na Formação IA Makers, esse tema aparece porque construir com IA exige direção humana, revisão técnica e leitura de produto digital. O aluno precisa aprender a especificar melhor, revisar melhor e decidir o que entra no sistema com base em hipótese, manutenção e impacto.

Aqui na Promovaweb, eu conecto Vibe Coding com arquitetura, experiência de produto e responsabilidade de manutenção. A IA ajuda na execução, mas a entrega continua precisando de hipótese, limite e revisão humana antes de virar parte do sistema.

Também vale comparar esse tema com a página de formações da Promovaweb, porque produtividade com IA toca desenvolvimento, automação, experiência de produto e gestão. A trilha certa depende do tipo de decisão que você precisa melhorar e do nível de responsabilidade técnica que já existe no projeto.

Para aprofundar o assunto, leia também IA em requisitos com GitHub Spec Kit e código gerado por IA e custo de manutenção. Os dois textos mostram por que produtividade começa na clareza da decisão, muito antes de qualquer prompt gerar código.

Também recomendo o artigo sobre construir menos software e vender clareza, porque muita produtividade nasce da escolha de reduzir complexidade desnecessária. Essa leitura combina bem com projetos de IA, pois ajuda a separar avanço real de acúmulo técnico sem efeito claro para o cliente.

Dúvidas frequentes sobre produtividade no Vibe Coding

Linhas de código ainda servem como métrica?

Linhas de código servem como sinal auxiliar quando ajudam a dimensionar revisão, risco e escopo da mudança criada com IA. Elas podem indicar uma entrega relevante, mas também podem revelar excesso de solução para um problema pequeno.

O critério principal deve cruzar hipótese, manutenção e impacto, porque produtividade precisa aparecer em efeito observado, acima do volume de implementação. Se a entrega aumentou o repositório e não mudou uso, revisão ou aprendizado, ela deveria voltar para análise antes de virar referência de avanço.

IA aumenta produtividade automaticamente?

A IA aumenta capacidade de geração quando reduz esforço de implementação, prototipação e variação técnica durante o desenvolvimento. Produtividade depende de direção humana, revisão e clareza de objetivo, pois a ferramenta não decide sozinha o que merece permanecer.

Quando o responsável técnico aceita saída sem entender a lógica, a IA pode aumentar retrabalho e criar dependência de explicações posteriores. Quando existe hipótese clara e revisão técnica, ela reduz esforço em partes importantes da execução sem enfraquecer a manutenção.

Quais sinais observar depois de uma entrega com IA?

Eu mediria tempo para validar hipótese, custo de revisão, retrabalho gerado, dúvidas no suporte, adoção da funcionalidade e facilidade para alterar o fluxo depois. Esses sinais mostram se a entrega melhorou o produto digital ou apenas criou atividade técnica com aparência de progresso.

Também observaria o que ficou mais fácil de explicar para cliente, vendedor, suporte ou pessoa responsável pela próxima alteração. Quando a entrega melhora essas conversas, a IA ajudou o projeto a avançar em algo mais concreto do que volume.

Como aplicar esse critério na próxima revisão?

Pegue a última entrega feita com IA e registre três respostas objetivas: qual hipótese ela testou, quanto custa manter e o que mudou no produto digital. Se alguma resposta ficar genérica, a métrica ainda precisa de revisão antes de entrar como prova de produtividade.

Depois disso, revise o backlog com o mesmo filtro e separe as ideias que têm hipótese observável das que só parecem fáceis de gerar. Algumas continuarão importantes, enquanto outras provavelmente estavam ali porque a IA reduziu o esforço de implementação sem resolver uma necessidade clara.

Conclusão

Produtividade no Vibe Coding aparece quando a IA ajuda a validar melhor, manter o produto digital legível e entregar mudança conectada ao uso real. O tamanho do Pull Request pode orientar a revisão, mas não deve ocupar o lugar da hipótese, da manutenção e do impacto.

Se a entrega reduziu dúvida, facilitou revisão e melhorou uma parte observável da experiência, a IA ajudou de forma concreta. Se a entrega apenas aumentou o repositório, a métrica estava olhando para o sinal errado e precisa voltar para a decisão que originou o código.

Esse é o critério que eu levaria para qualquer revisão de Vibe Coding, especialmente quando a geração parece boa demais para ser questionada. A produtividade que importa permanece humana na decisão, mesmo quando a execução ficou muito mais rápida com IA.