Beatriz Woos Buffon

Graduanda em Estatística | Cientista de Dados | R | Python | SQL | ML

Sobre Mim

Sua Foto

Cientista de dados em formação com dois anos de experiência em modelagem estatística aplicada, análise de dados e desenvolvimento de distribuições para dados limitados. Atualmente, atuo como bolsista de Iniciação Científica no projeto “Modelos dinâmicos para variáveis positivas ou duplamente limitadas”, com foco em regressão, estimação via máxima verossimilhança e simulação.

Tenho experiência em análise e tratamento de dados com R e Python, incluindo séries temporais, regressão, construção de dashboards automatizados e interfaces gráficas. Possuo familiaridade com bibliotecas amplamente utilizadas na ciência de dados, além de conhecimentos em SQL, Git e Power BI. Domino conceitos fundamentais da Estatística, como inferência, probabilidade, modelagem estatística e previsão.

Experiência Profissional

Estagiária em Iniciação Científica

Universidade Federal de Santa Maria | set 2022 - Atual

  • Atuo na área de estatística com ênfase em teoria de distribuições, modelos dinâmicos e de regressão para séries temporais duplamente limitadas. Desenvolvo propostas metodológicas inovadoras, como uma nova distribuição unitária inflacionada (UBXII). Utilizo a linguagem R para a implementação computacional e análise dos modelos. Paralelamente, dedico-me à divulgação científica e projeto de extensão da estatística da Universidade Federal de Santa Maria, com a criação de conteúdos acessíveis sobre estatística.
  • Possuo ampla participação em eventos acadêmicos e científicos, com destaque para o 25º SINAPE (Simpósio Brasileiro de Probabilidade e Estatística), SouthStat Meeting - Encontro Sul-Brasileiro de Estatística e Ciência de Dados, Jornadas de Jóvenes Investigadores da Asociación de Universidades Grupo Montevideo (AUGM), além de diversas Semanas Acadêmicas de Estatística. Apresentei trabalhos relacionados à educação estatística, desenvolvimento de ações extensionistas por meio de redes sociais e modelagem estatística aplicada, como no estudo da distribuição Burr XII unitária inflacionada. Em 2023, recebi a Distinción de Presentación Póster - Ganador de la Sala Temática na 30ª Jornada de Jóvenes Investigadores da AUGM, em reconhecimento à qualidade do trabalho apresentado. Também publiquei trabalhos completos e resumos em anais de congressos nacionais e internacionais, abordando temas como a democratização do ensino de estatística, análise de dados com Python e comunicação científica através de novas mídias. Ademais, participei ativamente na criação de materiais para redes sociais e vídeos de divulgação científica no âmbito do projeto StatUFSM.
  • Ao longo da graduação, atuei em diversos projetos de pesquisa, extensão e ensino com ênfase na aplicação e divulgação da Estatística em contextos acadêmicos e sociais.
    • Pesquisa:
      • Desde 2023, participo do projeto "Modelos dinâmicos para variáveis aleatórias duplamente limitadas: como prever indicadores de desenvolvimento sustentável?", que visa desenvolver novos modelos autoregressivos (GAS) baseados em distribuições alternativas à Beta, com aplicações em indicadores dos ODS, como mortalidade, energia limpa e mudanças climáticas.
    • Extensão:
      • StatUFSM: A Estatística ao alcance de todos (2022 - atual): produção de conteúdos visuais e audiovisuais sobre Estatística e Ciência de Dados, com foco em democratização do conhecimento via redes sociais, dashboards interativos e eventos presenciais.
      • CodeQ (2023 - 2024): desenvolvimento de uma plataforma educacional voltada à introdução intuitiva à programação na Engenharia.
      • Criação de material didático para oficinas e museu de matemática (2023 - atual): elaboração de materiais interativos e oficinas para estudantes e professores da Educação Básica, incentivando o ensino lúdico de matemática.
    • Ensino:
      • "Uso de redes sociais e conteúdos digitais como ferramenta de ensino em Estatística" (2022 - 2024): promove a criação de recursos educacionais online e estratégias de comunicação científica voltadas à formação de estudantes e interessados na área.

Analista de Dados e Segurança da Informação | LGPD

eGestor | nov 2022 - set 2023

  • Análise e interpretação dos dados para impulsionar decisões estratégicas de negócios e fornecer insights valiosos à empresa. Construção de indicadores e dashboards com Python e Looker Studio.
  • Resolução de problemas em conjunto à Lei Geral de Proteção de Dados (LGPD), análise de dados, geração de relatórios e dashboards interativos com Python para o acompanhamento dos dados da empresa.

Habilidades

Técnicas

  • R, Python, visualização de dados
  • Regressão, MLG, Série temporais
  • Git, GitHub
  • Power BI, Looker Studio
  • SQL

Soft Skills

  • Trabalho em equipe
  • Comunicação clara
  • Resolução de problemas
  • Gestão de tempo
  • Aprendizado contínuo

Idiomas

  • Português - Nativo
  • Inglês - Intermediário

Estatística

  • Modelos Probabilísticos (Normal, Poisson, Binomial)
  • Algoritmos de Regressão, classificação, clusterização
  • Métricas de performance dos algoritmos (RMSE, MAE, MAPE, Confusion Matrix, Precisão, Recall, Curva ROC, Curva Lift, AUC, Silhouette Score, DB-Index).
  • Estatística descritiva (localização, dispersão, assimetria, kurtosis, densidade)
  • Construção de modelos de Séries Temporais

Projetos

Análise Estatística de fatores socioeconômicos e geográficos associados à Mortalidade Infantil

Neste trabalho, foi realizada uma análise estatística com foco na modelagem da mortalidade infantil no estado do Paraná (2010), utilizando um conjunto de dados com 399 observações. A variável-respostA foi modelada por meio de uma regressão com distribuição Binomial Negativa, apropriada para dados de contagem com sobredispersão.Foram aplicadas técnicas de seleção de variáveis, diagnóstico de modelo (como análise de resíduos, alavancagem, DFFITS, Distância de Cook), teste de especificação RESET e coeficiente de determinação generalizado. A função de ligação logarítmica foi usada devido à natureza positiva da variável-resposta. Os resultadoS indicaram que variáveis como latitude, longitude, índice de desenvolvimento (IFDM) e log da população têm impacto significativo na mortalidade infantil. O modelo mostrou-se adequado, com bom ajuste e validade estatística confirmada por diagnósticos e predições coerentes com os dados observados.

Ver Projeto

Modelo de Regressão com base na Distribuição Burr XII unitária inflacionada em zero ou uns

Nos últimos anos novas distribuições de probabilidade e modelos de regressão foram propostas no contexto de dados unitários. A distribuição Burr XII unitária (UBXII) foi proposta para a modelagem de dados contínuos e restritos ao intervalo unitário do tipo (0,1). No entanto, esta distribuição não acomoda situações em que os dados incluem zeros ou uns. Assim, quando a variável de interesse apresenta restrições em intervalos do tipo [0, 1), (0,1] ou [0,1], é necessário estender o modelo UBXII para incluir esta característica. A abordagem mais comum é a construção de modelos inflacionados, que envolve a mistura de duas distribuições: uma distribuição discreta para a inclusão da inflação em zero ou um, e uma distribuição contínua unitária para os valores no intervalo unitário aberto. Neste sentido, com o objetivo de possibilitar a modelagem de dados inflacionados, o presente trabalho utiliza a distribuição UBXII, por meio de uma reparametrização em termos do quantil. Apresentamos os modelos de regressão baseados nas distribuições UBXII e IUBXII, discutimos a estimação dos parâmetros por máxima verossimilhança, realizamos a maximização númerica da função de log-verossimilhança através do pacote GAMLSS no software R. Adicionalmente, está na etapa de aplicação do modelo proposto a um conjunto de dados reais para demonstrar sua aplicabilidade e potencial em contextos práticos.

Ver Projeto

Evolução e tendências da velocidade do vento em Brasília: Uma abordagem Estatística

Este relatório tem como objetivo analisar a série temporal da velocidade média do vento registrada na estação meteorológica 83377, localizada em Brasília. A base de dados utilizada abrange medições mensais de velocidade média e de velocidade máxima média do vento (em metros por segundo), coletadas entre janeiro de 2001 e dezembro de 2018. Brasília, situada no Planalto Central, possui um clima caracterizado por estações bem definidas — chuvosa e seca — e é influenciada por sua elevada altitude. A dinâmica dos ventos exerce papel relevante nesse contexto, afetando a sensação térmica, a dispersão de poluentes e outros processos atmosféricos. A análise da série temporal visa identificar padrões sazonais, tendências e possíveis mudanças estruturais ao longo do tempo. Para isso, serão utilizadas técnicas estatísticas e gráficas, como decomposição, testes de estacionariedade e modelagem adequada da série, com o intuito de compreender a evolução da velocidade do vento na região.

Ver Projeto

Contato

beatriz.buffon@acad.ufsm.br

(55) 99164-5792

Santa Maria, Rio Grande do Sul