Sobre Mim
Cientista de dados em formação, com dois anos de experiência em modelagem estatística aplicada e análise de dados. Estudante do 9º semestre de Estatística na UFSM.
Atualmente atuo como bolsista no projeto de pesquisa “Modelos dinâmicos para variáveis positivas ou duplamente limitadas”, vinculado ao Instituto Serrapilheira. Desenvolvi atividades voltadas à modelagem por regressão, estimação de parâmetros via máxima verossimilhança, além de simulação e avaliação do desempenho de modelos estatísticos, com foco em rigor metodológico e validação empírica.
Possuo experiência em projetos envolvendo o desenvolvimento e ajuste de modelos estatísticos para dados contínuos, positivos e limitados, bem como em análise exploratória, tratamento e validação de bases de dados reais. Também atuo em projetos com séries temporais, regressão, previsão e análises espaciais. Em termos de competências técnicas, trabalho com Python (NumPy, SciPy e scikit-learn), R, SQL, técnicas de Machine Learning, controle de versão com Git e GitHub, desenvolvimento de painéis interativos no Power BI e QGIS para análises espaciais.
Minha graduação em estatística inclui forte base em inferência estatística, probabilidade, modelagem estatística, séries temporais e métodos de previsão, estimação por máxima verossimilhança aplicada a diferentes classes de modelos.
Experiência Profissional
Estagiária em Iniciação Científica
Universidade Federal de Santa Maria | set 2022 - Atual
- Atuo na área de estatística com ênfase em teoria de distribuições, modelos dinâmicos e de regressão para séries temporais duplamente limitadas. Desenvolvo propostas metodológicas inovadoras, como uma nova distribuição unitária inflacionada (UBXII). Utilizo a linguagem R para a implementação computacional e análise dos modelos. Paralelamente, dedico-me à divulgação científica e projeto de extensão da estatística da Universidade Federal de Santa Maria, com a criação de conteúdos acessíveis sobre estatística.
- Possuo ampla participação em eventos acadêmicos e científicos, com destaque para o 25º SINAPE (Simpósio Brasileiro de Probabilidade e Estatística), SouthStat Meeting - Encontro Sul-Brasileiro de Estatística e Ciência de Dados, Jornadas de Jóvenes Investigadores da Asociación de Universidades Grupo Montevideo (AUGM), além de diversas Semanas Acadêmicas de Estatística. Apresentei trabalhos relacionados à educação estatística, desenvolvimento de ações extensionistas por meio de redes sociais e modelagem estatística aplicada, como no estudo da distribuição Burr XII unitária inflacionada. Em 2023, recebi a Distinción de Presentación Póster - Ganador de la Sala Temática na 30ª Jornada de Jóvenes Investigadores da AUGM, em reconhecimento à qualidade do trabalho apresentado. Também publiquei trabalhos completos e resumos em anais de congressos nacionais e internacionais, abordando temas como a democratização do ensino de estatística, análise de dados com Python e comunicação científica através de novas mídias. Ademais, participei ativamente na criação de materiais para redes sociais e vídeos de divulgação científica no âmbito do projeto StatUFSM.
-
Ao longo da graduação, atuei em diversos projetos de pesquisa, extensão e ensino com ênfase na aplicação e divulgação da Estatística em contextos acadêmicos e sociais.
- Pesquisa:
- Desde 2023, participo do projeto "Modelos dinâmicos para variáveis aleatórias duplamente limitadas: como prever indicadores de desenvolvimento sustentável?", que visa desenvolver novos modelos autoregressivos (GAS) baseados em distribuições alternativas à Beta, com aplicações em indicadores dos ODS, como mortalidade, energia limpa e mudanças climáticas.
- Extensão:
- StatUFSM: A Estatística ao alcance de todos (2022 - atual): produção de conteúdos visuais e audiovisuais sobre Estatística e Ciência de Dados, com foco em democratização do conhecimento via redes sociais, dashboards interativos e eventos presenciais.
- CodeQ (2023 - 2024): desenvolvimento de uma plataforma educacional voltada à introdução intuitiva à programação na Engenharia.
- Criação de material didático para oficinas e museu de matemática (2023 - atual): elaboração de materiais interativos e oficinas para estudantes e professores da Educação Básica, incentivando o ensino lúdico de matemática.
- Ensino:
- "Uso de redes sociais e conteúdos digitais como ferramenta de ensino em Estatística" (2022 - 2024): promove a criação de recursos educacionais online e estratégias de comunicação científica voltadas à formação de estudantes e interessados na área.
- Pesquisa:
Analista de Dados e Segurança da Informação | LGPD
eGestor | nov 2022 - set 2023
- Realizei a análise e interpretação de dados para impulsionar decisões estratégicas de negócios.
- Construí indicadores e dashboards com Python e Looker Studio.
- Atuei na resolução de problemas relacionados à Lei Geral de Proteção de Dados (LGPD), com análise de dados e geração de relatórios e dashboards interativos para o acompanhamento dos dados da empresa.
Habilidades
Técnicas
- R
- Python (NumPy, SciPy e scikit-learn)
- SQL
- Git, GitHub
- Power BI, Looker Studio
Soft Skills
- Trabalho em equipe
- Comunicação clara
- Resolução de problemas
- Gestão de tempo
- Aprendizado contínuo
Idiomas
- Português - Nativo
- Inglês - Intermediário
Estatística
- Modelos Probabilísticos (Normal, Poisson, Binomial)
- Regressão, Modelos Lineares Generalizados (MLG), Séries Temporais, Algoritmos de Regressão, Classificação e Clusterização
- Métricas de performance dos algoritmos (RMSE, MAE, MAPE, Confusion Matrix, Precisão, Recall, Curva ROC, Curva Lift, AUC, Silhouette Score, DB-Index).
- Estatística descritiva (localização, dispersão, assimetria, kurtosis, densidade)
- Inferência, Probabilidade, Estatística descritiva, Modelagem estatística e Previsão
- Construção de modelos de Séries Temporais
Banco de Dados e SQL
- Formação acadêmica sólida em Banco de Dados, totalizando 180 horas, distribuídas nas disciplinas de Banco de Dados, Banco de Dados Espaciais I e Banco de Dados Espaciais II.
- Os cursos abrangeram modelagem conceitual e relacional, normalização, consultas SQL avançadas, joins, subconsultas e funções espaciais.
- Nos módulos de bancos espaciais, foram explorados conceitos de dados geográficos, tipos geométricos, consultas espaciais, integração entre bancos de dados e sistemas de informação geográfica.
- As atividades práticas, materiais de aula e exercícios desenvolvidos estão documentados nos repositórios públicos do meu GitHub.
Projetos
Análise e Monitoramento da Velocidade do Vento em Brasília (2001-2018)
O estudo analisa a velocidade média do vento em Brasília (2001–2018) por meio de uma abordagem integrada de séries temporais e Controle Estatístico de Processo. Um modelo SARIMA é ajustado para remover dependência temporal e sazonalidade, seguindo a metodologia Box-Jenkins. A adequação do modelo é validada por diagnósticos de resíduos (Ljung-Box e Shapiro-Wilk). Os resíduos são então monitorados via gráfico de controle para valores individuais, avaliando a estabilidade do processo.
Ver ProjetoAnálise do Saldo de Emprego do Maranhão (2007–2017)
O trabalho analisa a série temporal mensal do saldo de emprego no Maranhão (2007–2017), investigando sua volatilidade, ciclos e padrões sazonais. São aplicadas técnicas de decomposição e testes de raiz unitária para avaliar estacionariedade e tendência. Um modelo SARIMA é ajustado e validado por meio de diagnósticos dos resíduos. O modelo validado é utilizado para gerar previsões dentro e fora da amostra, subsidiando análises do mercado de trabalho. Os resultados contribuem para a compreensão da dinâmica do emprego no estado, oferecendo subsídios quantitativos para planejamento e formulação de políticas públicas.
Ver ProjetoAnálise e Predição de Aprovação de Empréstimos
O projeto desenvolve um fluxo completo de modelagem preditiva para aprovação de empréstimos, desde a exploração e preparação dos dados até a avaliação de modelos de classificação. São comparados algoritmos como Regressão Logística, SVM e Random Forest quanto à capacidade preditiva e generalização. O desempenho é analisado por métricas de classificação, calibragem probabilística e curvas de aprendizado. A importância das variáveis é utilizada para apoiar a interpretação dos resultados e a tomada de decisão. Os resultados evidenciam os principais fatores associados à aprovação de crédito, auxiliando nas decisões automatizadas em contextos financeiros.
Ver ProjetoModelo de Regressão com base na Distribuição Burr XII unitária inflacionada em zero ou uns
A distribuição Burr XII unitária (UBXII) é uma ferramenta útil para modelar dados contínuos restritos ao intervalo (0, 1). No entanto, ela não acomoda dados que incluem valores exatos de zero e/ou um. Para superar essa limitação, este trabalho propõe modelos de regressão inflacionados em zeros (ZIUBXII) ou uns (OIUBXII), que combinam uma distribuição discreta para lidar com a inflação e a distribuição UBXII para os valores no intervalo aberto. . O trabalho apresenta a formulação teórica, a estimação via máxima verossimilhança e a aplicação prática do modelo utilizando o pacote GAMLSS em R.
Ver ProjetoAnálise Estatística de fatores socioeconômicos e geográficos associados à Mortalidade Infantil
Análise de regressão com distribuição Binomial Negativa para modelar a mortalidade infantil no Paraná, em 2010. O projeto focou em seleção de variáveis, diagnóstico de modelo e validação estatística, demonstrando o impacto de fatores como latitude, longitude e IFDM.
Ver ProjetoAnálise de Dados Eleitorais com QGIS (em andamento)
O projeto capacita o uso do QGIS para análise espacial de dados eleitorais e censitários brasileiros, integrando cartografia temática e ciência política. Aborda técnicas de geoprocessamento, visualização e automação de mapas, com dados do TSE e IBGE. Explora fundamentos da geografia eleitoral, autocorrelação espacial e identificação de padrões de voto. Enfatiza boas práticas de inferência espacial, prevenindo a falácia ecológica e apoiando análises socioeleitorais rigorosas.
Ver Projeto