Overfitting

Da Thinkfn

O overfitting no desenho de uma estratégia de trading ocorre quando esta estratégia descreve bem o comportamento passado do mercado, mas não possui capacidade de previsão para o futuro. Geralmente o overfitting resulta de um processo de optimização da estratégia em que a presença de muitos indicadores e parâmetros permitem ao sistema adaptar-se bem ao passado sem que estejam realmente a descrever o seu comportamento. No fundo o sistema comporta-se como se estivesse a decorar o passado.

Entre vários métodos para evitar o overfitting, o mais comum é treinar/optimizar o modelo num conjunto alargado de dados, mas deixando um outro conjunto alargado sem servir para a optimização, servindo esse segundo conjunto de dados para testar o sistema após optimizado.

Causas e indícios

Algumas causas e indícios comuns de overfitting são:

  • Sistemas demasiado complexos, com muitos indicadores e muitos parâmetros. A existência de muitos graus de liberdade permite a um sistema complexo adaptar-se melhor ao comportamento passado do mercado, quando optimizado, sem que tal signifique que possui poder predictivo;
  • Falta de dados para efectuar testes ao sistema. Idealmente será necessário um conjunto alargado de dados tanto para a optimização, como para os testes "out of sample" (fora do período de optimização);
  • Comportamento não contínuo dos resultados. Idealmente os resultados do sistema para a variação de um dado parâmetro deverão melhorar em direcção ao valor óptimo, e piorar quando se afasta deste. Os casos em que o valor óptimo apresenta bons resultados e num valor muito próximo os resultados desaparecem totalmente têm maior probabilidade de serem resultado de overfitting;
  • Quando os resultados, dentro de um conjunto alargado de trades, resultam apenas de poucos trades.

Ver também

Links relevantes