Por Paulo Watanave, head de dados e análise na NAVA Technology for Business.
A expansão e a evolução contínua da Inteligência Artificial fornecem um terreno fértil para a proliferação de grandes modelos de linguagem, motivando uma mudança no cenário de processamento de linguagem natural em vários domínios.
Um deles é o mercado financeiro, em que destacamos o FinGPT, um modelo de linguagem de grande porte de código aberto (LLM, sigla em inglês), treinado em um conjunto de dados massivos, que pode ser utilizado para realizar uma variedade de tarefas, incluindo análise de sentimentos, previsão de preços de ativos, gestão de portfólio e avaliação de risco.
Desenvolvido em 2022 por pesquisadores da Universidade de Columbia e da Universidade de Nova York, o FinGPT já está na segunda versão, o FinGPT-RAG, que chegou em janeiro de 2024.
No âmbito proprietário, a Bloomberg lançou um modelo de código fechado em 2023, com acessibilidade restrita aos dados especializados que foram utilizados no seu treinamento.
Isso motivou os pesquisadores da AI4Finance a criar o FinGPT, mostrando uma tendência na democratização da tecnologia.
Ao contrário de modelos proprietários, o FinGPT tem uma abordagem centrada em dados, fornecendo aos pesquisadores recursos acessíveis e transparentes para o desenvolvimento dos seus LLMs. A comunidade do AI4Finance visa estimular a inovação, democratizar as FinLLMs e desbloquear novas oportunidades em finanças abertas.
Cabe ressaltar que a aquisição, a organização e a curadoria de dados com qualidade, relevantes e atualizados, são fatores críticos de sucesso para a aplicação desses modelos.
A partir dessa premissa, encontramos obstáculos intrincados para a obtenção dos dados, lidando com diversos formatos e tipos, problemas de qualidade na extração e desatualização. São requisitos comuns para qualquer sistema de IA que necessita de uma ação mais precisa na recomendação ou tomada de decisão.
Os desafios mencionados são endereçados pelo uso do FinGPT, uma estrutura de código aberto de ponta a ponta para grandes linguagens financeiras modelos (FinLLMs). Para isso, é importante adotar uma abordagem centrada em dados, destacando o papel crucial da aquisição, da limpeza e do pré-processamento desses dados no desenvolvimento de FinLLMs de código aberto.
A comunidade AI4Finance, por meio do uso do FinGPT, defende a acessibilidade dos dados, aspira melhorar a pesquisa, a colaboração e a inovação em finanças, o que abre caminho para práticas financeiras abertas. Dessa forma, sua contribuição resume-se a:
Democratização
O FinGPT, como uma estrutura de código aberto, visa democratizar os dados financeiros e FinLLMs, descobrindo potenciais inexplorados em finanças abertas.
Abordagem centrada em dados
O modelo adota uma abordagem centrada em dados e implementa métodos rigorosos de limpeza e pré-processamento para lidar com formatos e tipos variados, o que garante alta qualidade.
Estrutura ponta a ponta
O FinGPT adota processos estruturados para FinLLMs com quatro camadas:
- Camada de fonte de dados: garante informações abrangentes de cobertura de mercado, abordando a sensibilidade temporal de dados financeiros por meio da captura de informações em tempo real.
- Camada de engenharia de dados: preparada para PNL em tempo real e processamento de dados, enfrenta os desafios inerentes à alta sensibilidade temporal e à baixa relação sinal-ruído em dados financeiros.
- Camada LLMs: focando uma variedade de ajustes finos e metodologias, mitiga a natureza altamente dinâmica dos dados financeiros, garantindo a integridade do modelo, relevância e precisão.
- Camada de aplicação: apresentando aplicações práticas e demonstrações, destaca a capacidade potencial do FinGPT no setor financeiro.
De acordo com os seus criadores e a comunidade AI4Finance, o FinGPT pode encontrar amplas aplicações em serviços financeiros, auxiliando profissionais e indivíduos na tomada de decisões financeiras informadas.
As aplicações potenciais incluem: robô-assessor, negociação quantitativa, otimização de portfólio, análise de sentimento financeiro, gestão de riscos, detecção de fraude financeira, pontuação de crédito, previsão de insolvência, previsão de fusões e aquisições (M&A), pontuação ESG e educação financeira.
Ao vincular esses componentes distintos, mas interconectados, o FinGPT fornece uma solução holística e acessível para alavancar a IA em finanças, o que facilita a pesquisa, a inovação e as aplicações práticas no setor financeiro.
A integração de LLMs no setor financeiro, por meio de soluções como o FinGPT, abre portas para uma modelagem de linguagem mais eficiente, precisa e acessível.
Essa tecnologia tem o potencial de revolucionar o mercado financeiro, oferecendo novas ferramentas para análise de dados, a tomada de decisões e o desenvolvimento de produtos e serviços inovadores.