Centro de Ciência de Dados para Estatísticas Públicas (CCDEP)

Pesquisador responsável: Carlos Eduardo Torres Freire
Instituições-sede: Fundação Sistema Estadual de Análise de Dados (Seade) e Secretaria da Fazenda e Planejamento
Processo FAPESP: 2023/18026-8

O Centro utilizará dados de alta frequência para produzir indicadores de políticas públicas. O projeto está organizado em linhas de pesquisa com as seguintes características: produção de conhecimento novo para uma área de política pública específica; utilização de dados de alta frequência, em grande volume e estruturados ou não estruturados; parcerias com órgãos públicos, entidades não governamentais, empresas públicas e privadas para obtenção e análise de dados e disseminação de resultados.

O Centro contemplará inicialmente cinco linhas de pesquisa:

1. Monitor de Atividade Econômica: utilização de dados de alta frequência e registros administrativos digitais de órgãos públicos, concessionárias de serviços públicos e outras fontes para desenvolver indicadores, modelos preditivos e análises sobre a economia paulista de forma tempestiva e com desagregação geográfica.

2. Monitor Trabalho: combinação de bases de dados tradicionais com diferentes métodos de coleta (por telefone assistido, URA - "robô" e internet) para produzir indicadores sobre ocupação e desocupação, formação e inserção no mercado de trabalho.

3. Monitor Mobilidade: desenvolvimento de indicadores a partir de grandes conjuntos de dados de coleta automática (localização de usuários e bilhetagem) articulados a dados tradicionalmente usados em planejamento e gestão de transportes (pesquisas de origem e destino) e de infraestrutura e equipamentos georreferenciados.

4. Monitor Segurança Pública: elaboração de novos indicadores e aperfeiçoamento de metodologias de construção de indicadores de eventos criminais, empregando novas fontes de dados e tecnologias de automatização de leitura, classificação e codificação de texto como modelos de aprendizado de máquina.

5. Tecnologias em Engenharia de Dados e de Software: desenvolvimento de tecnologias para análise de dados e geração de aplicativos apoiados em ciência de dados e em tecnologias facilitadoras atuais:  estudo e desenvolvimento de aspectos teóricos; geração de algoritmos e tecnologias; construção, produção, suporte e hospedagem de aplicativos e suas ferramentas associadas. As atividades estarão voltadas para gerar soluções práticas de apoio às demais linhas de pesquisa do Centro.

O plano de gestão de dados contempla a necessidade de uma infraestrutura computacional de armazenamento, processamento e disseminação de dados com flexibilidade e capacidade para processos de ETL (extração, transformação e carregamento) e construção de modelos de machine learning, além de recursos computacionais de alta capacidade e softwares (livres e proprietários).

Os resultados serão compartilhados entre os parceiros e disseminados em dashboards, repositórios, APIs; boletins analíticos; artigos científicos; conteúdos audiovisuais; e eventos.

Instituições parceiras:

• Secretaria da Fazenda e Planejamento de SP
• Fundação Sistema Estadual de Análise de Dados (Seade)

 

RESULTADOS DE PESQUISAS CONDUZIDAS NO CENTRO: