← Voltar ao blog

Walk-forward backtest: como não enganar a si mesmo

Toda estratégia quantitativa funciona no passado. Esse é o ponto mais importante deste post inteiro: se você torturar dados históricos o suficiente, sempre encontra uma regra que teria entregue retorno excepcional. Isso é overfitting, e quase todos os "produtos quant" vendidos a varejo no Brasil sofrem dele.

O antídoto se chama walk-forward backtest sem look-ahead bias. É um protocolo, não uma técnica única, e separa backtest sério de fantasia. Este post explica por dentro como funciona, por que é tão importante, e como o VORTEX QSP implementa o protocolo.

O problema: por que backtest ingênuo mente

Imagine que você quer testar a regra "comprar as 10 ações com maior dividend yield da B3, rebalance anual". Você baixa os dados de 2010 a 2024, calcula, descobre que rendeu +14% a.a. contra +8% do IBOV. Conclusão: a estratégia funciona, certo?

Errado, por pelo menos três razões.

1. Look-ahead bias

Você usou o "universo de ações da B3" que sabia existir em 2024. Mas em 2010, várias dessas ações nem eram listadas ou tinham liquidez insuficiente. Pior: você sabia quais ações sobreviveram. Isso é survivorship bias — você excluiu retroativamente os fracassos. O resultado real, sem esse viés, seria significativamente pior.

2. Sobreajuste de parâmetros

Por que você escolheu "as 10 com maior yield"? Por que não 15, ou 20, ou só as 5? Por que rebalance anual e não semestral? Se você testou várias combinações e ficou com a melhor, você fez data dredging. A regra que vence em-amostra quase sempre é a que mais se ajustou ao ruído daquele período específico — e quase nunca sobrevive fora dele.

3. Look-ahead nos dados fundamentais

O lucro do 4º trimestre de 2020 só foi publicado em março/2021. Se seu backtest "rebalanceia em janeiro/2021 com base no lucro do 4T20", você está usando informação que ninguém tinha. Esse tipo de erro é absurdamente comum em backtests mal feitos.

A solução: walk-forward

Walk-forward backtest reproduz exatamente o que você teria conseguido fazer em tempo real. A regra é simples:

Em cada rebalance, você só usa informação que estava publicamente disponível antes daquela data — e a regra de seleção é fixada com antecedência, não escolhida com base no resultado.

Em prática isso significa:

  • Universo dinâmico. Em cada rebalance, o universo é "as ações que tinham liquidez X meses atrás naquele momento", não "as ações que sabemos hoje que eram líquidas em retrospecto".
  • Dados as-of-date. Lucros só entram após a data de publicação real. Cotações são as do fechamento do dia anterior ao rebalance — não do dia seguinte.
  • Parâmetros congelados. Você fixa todos os parâmetros (lookback de momentum, número de ações, peso de cada fator, restrições) antes de rodar. Não muda depois.
  • Custos realistas. Cada rebalance debita corretagem + spread bid-ask + impacto de mercado. No VORTEX QSP usamos 12 bps por lado, valor conservador pra investidor via corretora premium na B3.

O VORTEX QSP em walk-forward

O backtest publicado em Performance cobre 7,3 anos — janeiro/2019 a maio/2026 — rebalance mensal, totalizando 89 reblances. Em cada um:

  1. Determina o universo: ações do IBrX-100 com liquidez mínima nos 6 meses anteriores ao rebalance (não posteriores!).
  2. Calcula os 5 fatores (momentum, baixa volatilidade, qualidade, valor, baixo beta) usando exclusivamente dados disponíveis até a data do rebalance. Lucros e fundamentos entram só após data oficial de publicação.
  3. Normaliza cross-section (z-score por fator) e calcula score composto com pesos fixos definidos em janeiro de 2019.
  4. Aplica banda de histerese (top-15 entra, sai só ao cair pra fora do top-25) pra controlar turnover.
  5. Aplica pesagem inverse-variance e restrição setorial.
  6. Executa rebalance, debita custos de transação (12 bps/lado).
  7. Acumula retorno até o próximo mês. Repete.
CRUCIAL

Os pesos dos 5 fatores e a banda de histerese (15/25) foram calibrados em dados sintéticos antes do backtest começar — não otimizados em retrospecto pra maximizar resultado. Calibrar parâmetros olhando o resultado invalida o walk-forward.

O que walk-forward não resolve

Honestidade exige reconhecer os limites do método.

Período único

7,3 anos parecem muito, mas em termos de regimes de mercado é uma amostra pequena. 2019-2026 inclui pandemia, choque de juros, eleições polarizadas — mas não inclui hiperinflação, crise cambial severa, ou regime de juros 0% prolongado. O próximo ciclo pode trazer regimes que o backtest não viu.

Mudança estrutural do mercado

A B3 de 2019 é diferente da B3 de 2026 — mais investidores pessoa física, mais robôs de high-frequency, mais opções listadas. Backtest assume que a dinâmica de descoberta de preço é estacionária. Pode não ser.

Risco de cauda não observado

O Max Drawdown de -33,2% do VORTEX QSP no backtest aconteceu em 2020-2022 — pandemia + Selic 13%. Um cenário mais agudo pode produzir DDs maiores que isso. Nenhum backtest, por mais rigoroso que seja, garante a magnitude do pior cenário futuro.

Como ler um backtest que outros publicam

Toda vez que você ver um número tipo "+30% a.a.", faça as seguintes perguntas antes de acreditar:

  • Universo: ações de quais critérios de liquidez/listagem, e o universo é definido dinamicamente?
  • Período: qual a janela completa? Inclui períodos onde a estratégia provavelmente sofreria (2008, 2020)?
  • Custos: custos de transação foram debitados? Quanto?
  • Parâmetros: quem escolheu os parâmetros, e quando foram congelados? Se o backtest mostra otimização paramétrica retrospectiva, ignore o resultado.
  • Sobrevivência: universo inclui ações que faliram ou foram deslistadas? Se não, ele exagera o retorno.
  • Disclosure de drawdown: qual o pior período consecutivo? Se a apresentação só mostra retorno acumulado sem decompor o caminho, suspeite.

O backtest do VORTEX QSP responde explicitamente todas essas perguntas em Performance, incluindo a tabela mês a mês sem cherry-picking — meses bons e meses ruins aparecem do mesmo jeito.

Para fechar

Backtest sem walk-forward é exercício de ficção, e a indústria quant brasileira está cheia dele. Quando um produto te promete "+40% a.a." sem mostrar metodologia, sem listar todos os parâmetros congelados antes da data de teste, sem decompor mês a mês — assuma que o número é otimizado retrospectivamente, não replicável.

Walk-forward não garante performance futura. Garante apenas que o resultado histórico é honesto. E honestidade no backtest é pré-condição pra qualquer conversa séria sobre risco e retorno num produto sistematizado.