Pesquisador responsável: Carlos Eduardo Torres Freire
Instituições-sede: Fundação Sistema Estadual de Análise de Dados (Seade) e Secretaria da Fazenda e Planejamento
Processo FAPESP: 2023/18026-8
O Centro utilizará dados de alta frequência para produzir indicadores de políticas públicas. O projeto está organizado em linhas de pesquisa com as seguintes características: produção de conhecimento novo para uma área de política pública específica; utilização de dados de alta frequência, em grande volume e estruturados ou não estruturados; parcerias com órgãos públicos, entidades não governamentais, empresas públicas e privadas para obtenção e análise de dados e disseminação de resultados.
O Centro contemplará inicialmente cinco linhas de pesquisa:
1. Monitor de Atividade Econômica: utilização de dados de alta frequência e registros administrativos digitais de órgãos públicos, concessionárias de serviços públicos e outras fontes para desenvolver indicadores, modelos preditivos e análises sobre a economia paulista de forma tempestiva e com desagregação geográfica.
2. Monitor Trabalho: combinação de bases de dados tradicionais com diferentes métodos de coleta (por telefone assistido, URA - "robô" e internet) para produzir indicadores sobre ocupação e desocupação, formação e inserção no mercado de trabalho.
3. Monitor Mobilidade: desenvolvimento de indicadores a partir de grandes conjuntos de dados de coleta automática (localização de usuários e bilhetagem) articulados a dados tradicionalmente usados em planejamento e gestão de transportes (pesquisas de origem e destino) e de infraestrutura e equipamentos georreferenciados.
4. Monitor Segurança Pública: elaboração de novos indicadores e aperfeiçoamento de metodologias de construção de indicadores de eventos criminais, empregando novas fontes de dados e tecnologias de automatização de leitura, classificação e codificação de texto como modelos de aprendizado de máquina.
5. Tecnologias em Engenharia de Dados e de Software: desenvolvimento de tecnologias para análise de dados e geração de aplicativos apoiados em ciência de dados e em tecnologias facilitadoras atuais: estudo e desenvolvimento de aspectos teóricos; geração de algoritmos e tecnologias; construção, produção, suporte e hospedagem de aplicativos e suas ferramentas associadas. As atividades estarão voltadas para gerar soluções práticas de apoio às demais linhas de pesquisa do Centro.
O plano de gestão de dados contempla a necessidade de uma infraestrutura computacional de armazenamento, processamento e disseminação de dados com flexibilidade e capacidade para processos de ETL (extração, transformação e carregamento) e construção de modelos de machine learning, além de recursos computacionais de alta capacidade e softwares (livres e proprietários).
Os resultados serão compartilhados entre os parceiros e disseminados em dashboards, repositórios, APIs; boletins analíticos; artigos científicos; conteúdos audiovisuais; e eventos.
Instituições parceiras:
• Secretaria da Fazenda e Planejamento de SP
• Fundação Sistema Estadual de Análise de Dados (Seade)