APLICANDO O MACHINE LEARNING NA PRÁTICA PARA REALIZAÇÃO DE PROJEÇÕES
Lucas Jochem
O aprendizado da máquina ou Machine Learning pode ser definido como uma tecnologia onde os computadores têm a capacidade de aprender por meio da associação de diferentes dados e respostas esperadas. O grande atrativo destes algoritmos para as empresas são sua capacidade de previsão de resultados.
Conforme pode ser observado no diagrama abaixo o Machine Learning é parte integrante da Inteligência Artificial.
O tipo de modelo de Machine Learning pode variar muito conforme as características dos dados, podendo ser de alta complexidade como uma Rede Neural, ou de complexidade mais baixa como uma regressão Linear.
Os inputs dos modelos, também conhecidos como features, são os aspectos mais importes, pois a acurácia depende da capacidade das variáveis de prever o alvo desejado. Sendo assim, boas variáveis são mais importantes do que a complexidade do modelo escolhido.
Para exemplificar vamos construir um modelo utilizando a variação do PIB anual do Brasil (fonte IBGE) para prever a variação da Receita Bruta anual de duas empresas fictícias.
No gráfico a seguir apresentamos o comportamento da variação no PIB e a Receita Bruta das empresas fictícias:
Podemos perceber que a variação da Receita Bruta 2 é mais próxima da variação do PIB, e que a variação da Receita Bruta 1 é menos parecida com a variação no PIB.
A maneira de medir a associação entre duas variáveis estatisticamente é a correlação, que consiste em uma medida da dependência que existe ou não entre as variáveis, a seguir calculamos a correlação:
Com base na correlação é possível concluirmos que a Receita Bruta 1 possui pouca dependência da variação do PIB, ou seja, mesmo que tenhamos as projeções do PIB para os próximos anos, levando apenas essa variável em consideração, não é possível prever a variação da Receita Bruta 1 com um grau razoável de confiança.
Já a Receita Bruta 2 possui alta correlação com a variação do PIB, muito próxima de 1, logo tendo como base as projeções do PIB para os próximos anos é possível realizar projeções da variação da Receita Bruta 2 com maior grau de confiabilidade. Para realizar tais projeções vamos utilizar uma regressão linear, que consiste em uma equação do 1º grau, conforme a formula a seguir:
Para criação do modelo faremos a divisão do histórico de dados em base de treinamento e teste, a ideia é que o modelo aprenda a realizar a previsão da variação da Receita Bruta 2 com base no PIB levando em conta os dados da base de treinamento. Na base de teste podemos observar a capacidade de precisão do modelo treinado. O gráfico abaixo demonstra o treinamento do modelo:
Sendo a linha pontilhada o modelo construído, e acima da linha a equação que o modelo vai utilizar para fazer as previsões. O R2 é uma medida estatística de quão próximo estão as observações reais da linha da regressão linear. Quanto mais próximo de 1 maior a precisão da regressão.
O próximo passo é a aplicação do modelo na base de teste, para que possamos ver a capacidade preditiva do modelo.
Conforme o gráfico a seguir os resultados encontrados na base de teste foram:
Como podemos ver no gráfico as previsões com base na regressão linear encontram-se muito próximas aos resultados reais, logo podemos concluir que o modelo possui capacidade preditiva relevante. O próximo passo para realizar projeções consiste em reunir informações a cerca da variação do PIB para os anos que estão por vir e com base nisso podemos realizar a previsão da variação da Receita Bruta.
Este é um exemplo da aplicação de Machine Learning para realizar projeções, o que aconteceu na prática é que o modelo, tendo como base as observações da base de teste, constatou que existe relação entre a variação do PIB e a variação da Receita Bruta 2, e a partir das observações aprendeu uma forma de realizar as previsões, tendo como base a variável do PIB.
Estas técnicas são aplicadas pela Fair Value nas projeções para fins de determinar o valor de uma empresa ou um negócio. Técnicas estas que tornam o resultado final mais confiável e real.