Machine Learning

Machine Learning é um termo que se refere à um conjunto de técnicas computacionais e estatísticas para fazer uma máquina “aprender” utilizando dados. Um exemplo é o chamado “aprendizado supervisionado”, no qual temos uma variável resposta conhecida, um conjunto de variáveis explanatórias, e queremos construir um modelo para explicar esta variável resposta ou fazer previsões sobre o seu valor para novas observações.

Uma aplicação no mercado financeiro é a previsão de retornos de ações. A variável resposta neste caso é o retorno de um grupo de ações em algum intervalo de tempo, e as variáveis explanatórias (ou features no jargão de machine learning) podem incluir:

  • variáveis observadas no mercado, como retornos passados, volumes etc
  • variáveis dos demonstrativos contábeis: composição do balanço, medidas de alavancagem, crescimento de lucro etc
  • variáveis macroeconômicas

Com este conjunto de dados, podemos construir um modelo de previsão. O modelo mais simples e fácil de estimar é o modelo de regressão. Modelos mais sofisticados podem incluir árvores de regressão, técnicas de re-amostragem (bagging, boosting), redes neuronais e muitos outros.

Não pretendo fazer aqui uma exposição do assunto no momento; o objetivo deste post é compartilhar alguns recursos de alta qualidade – e gratuitos – sobre o assunto, para quem tem interesse.

Os links abaixo contém três livros excelentes sobre o tema.

  1. Introduction to Statistical Learning (Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani)
  2. The Elements of Statistical Learning (Trevor Hastie, Robert Tibshirani, Jerome Friedman)
  3. Computer Age Statistical Inference (Bradley Efron, Trevor Hastie)

A primeira referência é talvez a mais útil para quem não conhece muito sobre o tema. É uma exposição acessível, não muito técnica, e com diversos exemplos utilizando o software R. O segundo livro é a versão “pós-graduação”, com muito mais rigor técnico.

Este artigo é um ótimo exemplo de aplicação de machine learning na previsão de retornos, e mostra como técnicas não-lineares (em particular, métodos de re-amostragem e redes neuronais) trazem benefícios em comparação aos métodos lineares tradicionais.

Anúncios

2 comentários sobre “Machine Learning

  1. Dr. Nickel, boa noite. No seu último artigo sobre cointegração, você realizou um backtest, no qual primeiro havia uma janela de treinamento, para separar os melhores pares e em seguida rodar estes mesmos pares com dados novos e obter um resultado.
    Poderia dizer que este é um processo de Machine Learning?

    • Usar uma janela de treinamento e outra de teste é um recurso comum para evitar o chamado “overfitting”, ou seja, estimar modelos que performam bem nos dados em que foram treinados, mas que não generalizam bem fora desta amostra. É uma prática comum, mas que não tem necessariamente a ver com machine learning.

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s