Engenheiro de Dados Cientista de Dados Arquiteto de Dados
Sobre mim
Sou um amante da computação que busca explorar a capacidade de processamento das máquinas
na extração de informações úteis de grandes massas de dados.
Busco aplicar conceitos estatisticos, econométricos e de programação bem como técnicas de
Big data analytics, Big data real-time analytics, Business analytics, Data engineer, A.I. e principalmente Machine Learning para gerar as melhores soluções para os problemas que envolvam Data Science e A.I.
Ah! E não basta apenas produzir boas análises ou construir bons modelos preditivos se não criarmos bons gráficos (Afinal, uma imagem vale mais do que mil palavras, não é mesmo?) e é por isso que tenho um cuidado especial nas etapas de visualização de dados e design de dashboards para garantir que cada estudo feito possa elucidar as respostas que os dados podem nos fornecer para cada desafio.
Sigo o conceito T-Shaped, pois acredito que a capacidade de produzir soluções eficazes e eficientes dependem fundamentalmente dos conhecimentos previamente adquiridos.
Estes são meus níveis de habiliade com as tecnologias mais populares no mercado atualmente:
Estes são os principais pontos de ganho de experiência e títulos que obtive durante minha jornada até hoje...
Junho, 2022 - Atual
Atuo como professor em disciplinas relacionadas a Big Data. Dentre os temas lecionados, destacam-se: Engenharia, ciência e arquitetura de dados; modelagem de banco de dados, data warehouses, data lakes e lake houses; lógica de programação, técnicas de programação e arquitetura de software; e desenvolvimento em cloud.
Outubro, 2021 - Atual
Lidero os times de engenharia de dados, arquitetura de dados e data quality assurance para fornecer dados úteis na geração de valor para a empresa.
Junho, 2021 - Atual
Atuo orquestrando a concepção de diferentes estratégias para extrair, transformar, armazenar e gerar valor para a empresa por meio de dados. Também arquiteto atividades que envolvam a proteção de dados sensíveis e a sustentação do fornecimento de dados.
Outubro, 2020 - Atual
Faço parte do time de Business Intelligence da Clicksign buscando, através de automações e integrações, transformar pilhas de dados em informações relevantes para gerar novos conhecimento e insights. Além das análises e modelagens preditivas, desenvolvo scripts e projetos de integração entre bases de dados, APIs e Webservices REST construídos com o auxílio de ferramentas como Python, PostgreSQL, Apache Airflow, etc.
Janeiro, 2023
O Microsoft Power BI vem crescendo de forma incrível no mercado e por isto, busquei estudar formas de criar análises de dados completas utilizando exclusivamente essa ferramenta. Além disso, executei a modelagem e análise de dados extraídos de Data Warehouses e Data Lakes a partir da aplicação.
Janeiro, 2023
Dominei os fundamentos da arquitetura de dados e soluções em nuvem. Entendi como funciona o processamento de fluxos contínuos de dados, entrega de dados em solução de armazenamento (Data Lake, Data Warehouse, DBs modernos) e o processamento de dados massivos. Além disto, estudei os serviços mais utilizados nos principais players do mercado em cloud, como AWS, GCP e Azure.
Dezembro, 2022
Desenvolvi habilidades em análise de dados, como: tratamento de valores ausentes, limpeza e processamento de dados, geração de análises estatísticas descritivas, aplicação de binarização e encoding de variáveis categóricas e engenharia de atributos.
Dezembro, 2022
Aprimorei o conhecimento necessário para o design e automação de pipelines de dados de forma eficiente com diferentes cenários e diferentes ferramentas. Trabalhei a automação de pipelines de dados com Dremio, AirFlow, Apache Kafka, Apache Beam, Snowflake, Stitch, Keboola e Dataedo.
Dezembro, 2022
Desenvolvi arquiteturas e integrações de processos ETL e ELT usando Oracle Data Integrator, Pentaho, Apache NiFi, Apache Spark, AWS Glue, Amazon Athena e Azure Data Factory.
Dezembro, 2022
Aprendi por meio de diferentes cenários a como modelar os dados, escolhendo o tipo de armazenamento apropriado em cada situação. E com um detalhe: fazendo toda a configuração na prática. O trabalho do Arquiteto de Dados é cuidar dos dados. E para fazer este trabalho bem-feito precisei dominar as principais soluções de armazenamento de dados, como bancos de dados relacionais, bancos NoSQL, Data Lakes e Data Stores. Mas não é só isso. Estudei como alinhar esse conhecimento com Governança de Dados, Segurança e Integração, além de como saber trabalhar com Linguagem SQL.
Dezembro, 2022
Estudei um tema de extrema importância e ainda negligenciado: Governança de Dados. Aprendi a construir um Plano Corporativo de Governança de Dados e um Plano de Gestão de Metadados, tudo alinhado com a LGPD – Lei Geral de Proteção de Dados.
Outubro, 2022
Aprendi como desenvolver pipelines de big data automatizadas para coletar, preparar, armazenar e processar dados. Projetei arquiteturas escaláveis, on premises e em cloud.
Julho, 2022
Na era da informação, a engenharia de dados é uma das profissões que mais têm crescido. Essa área é fundamental para orientar organizações a tomar melhores decisões de negócios baseadas em dados e garantir informações precisas, consistentes e ágeis. Por isso, busquei me tornar um especialista na área criando soluções mais robustas e escaláveis de forma prática.
Março, 2022
SQL (Structured Query Language) é uma linguagem projetada para gerenciar dados em bancos de dados relacionais. A linguagem é o método mais comum de acessar dados em bancos de dados e uma das habilidades mais requisitadas em análise de dados. Através de labs, exercícios, estudos de caso e projetos, desenvolvi habilidades que aplico diariamente no meu dia a dia de trabalho.
Fevereiro, 2022
Aprendi a trabalhar com a AWS (Amazon Web Service) de forma profissional, compreendi como funciona Cloud Computing e como utilizar recursos computacionais em nuvem, reduzindo custo e aumentando a eficiência para implementar diferentes tipos de soluções.
Janeiro, 2022
Aprendi a trabalhar com mineração de Dados utilizando o clássico pacote estatístico SPSS.
Outubro, 2021
Conhecimento de negócio é uma das habilidades principais do Cientista de Dados. E neste curso aprendi a aplicar técnicas analíticas em áreas de negócio como Marketing, Finanças e RH, coletando dados, definindo métricas, criando modelos e extraindo insights que gerem valor para as empresas e suportem as tomadas de decisões.
Setembro, 2021
Conhecimento de negócio é uma das habilidades principais do Cientista de Dados. E neste curso aprendi a aplicar técnicas analíticas em áreas de negócio como Marketing, Finanças e RH, coletando dados, definindo métricas, criando modelos e extraindo insights que gerem valor para as empresas e suportem as tomadas de decisões.
Agosto, 2021
Neste curso aprendi os conceitos de machine learning em detalhes. Estudei os principais algoritmos de machine learning e aprendi como implementá-los usando R e Python. Estudei: Regressão, Classificação, Decision Trees, Random Forest, Naive Bayes, Nearest Neighbours (KNN), K-Means, etc.
Dezembro, 2020
Este é um curso de engenharia de dados. Armazenar big data é um desafio, dadas as suas características: dados gerados em alta velocidade, alto volume e grande variedade. Neste curso aprendi a criar um cluster Hadoop, como configurar um cluster Hadoop, como aplicar técnicas de mapeamento/redução nos dados. Criei um data hub com Hadoop e HBase, e apliquei ETL para carregar dados no Hadoop. Extraí dados usando R, Python e Pig, apliquei algoritmos de Machine Learning no Hadoop e configurei o Hadoop e Spark para criar uma poderosa solução de big data.
Julho, 2020
Utilizei a linguagem Python para coletar, organizar e analisar dados, além de implementar os principais algoritmos de Machine Learning. Também aprendi a trabalhar com o framework Spark para armazenar Big Data e realizar análise de dados em tempo real.
Junho, 2020
Aprendi a usar a linguagem de programação R aplicada a problemas econômicos. Estudei como ferramentas estatísticas podem nos ajudar a entender variáveis econômicas utilizando os principais pacotes da linguagem R para análises econométricas além de compreender as melhores formas de apresentar os resultados para suportar decisões de negócio.
Junho, 2020
Séries temporais são um tema negligenciado por grande parte dos profissionais no mercado e é por isso que busquei aprender a realizar o pré-processamento, a modelagem, a análise estatística e a previsão de séries temporais em Python usando modelos AR, MA, ARMA, ARIMA, SARIMA e Prophet, com visualização e avaliação das previsões dos modelos.
Maio, 2020
Conhecer os conceitos estátisticos é fundamental no processo de análise de dados. Por isso, busquei me aperfeiçoar nas técnicas de visualização de dados, associação e correlação de variáveis, probabilidade, variáveis aleatórias e distribuições de probabilidade, inferência estatística, design de experimentos e análise de variância (ANOVA), testes de hipótese e machine Learning utilizando a linguagem de programação R.
Fevereiro, 2020
Dominar a análise de Big Data é algo que demanda muito estudo, por isso mergulhei neste universo e busquei aprender as principais técnicas para analisar e extrair conhecimento e valor dos dados aplicando diversas técnicas estátisticas e construindo vários modelos de machine learning. Nesta jornada pratiquei o que aprendi com duas das maiores ferramentas usadas por um Data Scientist: a linguagem R e o e Azure Machine Learning.
Janeiro, 2020
Quanto maior for o número de ferramentas que dominarmos, maior será nossa capacidade de resolver diferentes tipos de problemas, não é mesmo? Então porque não aprender a trabalhar com Data Science com uma das maiores e mais poderosas linguagem de programação no mundo hoje. Bom, foi o que eu resolvi fazer.
Dezembro, 2019
Não existe um número suficiente de profissionais qualificados em
Big Data Analytics no mercado Brasileiro e internacional. Por isso busquei aprender os principais conceitos em análise de dados através de uma das mais poderosas ferramentas analíticas disponíveis atualmente.
Outubro, 2019
O Linux é um dos S.O.s mais usados no mundo e quando o assunto é Data Science e I.A, conhecer suas características pode nos ajudar a gerar soluções mais eficientes. Sabendo disso, busquei entender os pilares que sustentam esta tecnologia.
Setembro, 2019
Neste ponto aprendi sobre o funcionamento do Sistema Financeiro. Obtive conhecimento das leis que regem as funções dos principais players do mercado para em seguida exercitar a análise de custos abordando as principais fontes de financiamento disponíveis. Estudei quais técnicas podem ser usadas para se avaliar o desempenho de um investimento e administrar o seu risco e compreendi o funcionamento da Bolsa de Valores e às técnicas de análise de ações.
Julho, 2019
Bom, após definir o rumo da minha vida profissional, era hora de buscar por conhecimento especializado que me habilitasse a utilizar a Inteligência Artificial na produção de soluções eficientes para diferentes problemas de negócio. Com isso em mente, comecei uma formação de analista de inteligência de mercado entendendo os fundamentos da Economia.
Outubro, 2018
Refinei os conceitos que até então havia obtido dentro da Visual Computing.
Outubro, 2018
Bom, a curiosidade me fez elevar o nível dos estudos e insatisfeito em só conseguir detectar faces, passei a buscar maneiras de classificar cada uma delas. Nesta procura, aprendi a manusear a bliblioteca Dlib e todos os excelentes algoritmos que possui para as tarefas de Visual Computing.
Outubro, 2018
Por perceber a proeminência da Inteligência artificial na vida do
ser humano, iniciei minha jornada neste universo buscando criar programas dotados da capacidade de detectar faces humanas com o apoio da linguagem Python e da tão conhecida biblioteca OpenCV.
Janeiro, 2018
Não basta ser eficiente, é preciso parecer eficiente. E é por isso que me aprofundei mais nos conceitos que norteiam todo o processo de design de páginas Web atrativas e inovadoras utilizando HTML 5, CSS 3 e Javascrit.
Janeiro, 2018
Integrei ferramentas específicas a um projeto completo de E-commerce objetivando entender as técnicas mais eficientes para a construção e upgrade de projetos de grande escala.
Janeiro, 2018
Explorei os princípios que fundamentam o mundo dos Banco de dados relacionais aplicando-os na prática com o famoso MySQL.
Janeiro, 2018
Ampliei meus conhecimentos sobre progamação Web utilizando as tecnologias mais populares do mercado: PHP 7, CSS 3, HTML 5, Javascrit e o banco de dados MySQL. Como resultado prático, desenvolvi um projeto de E-commerce completo.
Junho, 2022
Ter a capacidade de criar e gerenciar infraestruturas de dados se tornou uma necessidade latente no mercado. Por isso, busquei aprender a projetar e implementar soluções e plataformas de Big Data, seja para uso analítico ou operacional. Estudei como obter e tratar dados e armazenar dados de forma eficiente para aumentar o diferencial competitivo das organizações.
Junho, 2021 - Julho, 2022
Estamos na era do Big Data, onde a informação é um dos ativos mais valiosos e sua importância só tende a aumentar. Neste curso, aprendi a como desvendar dados, antecipar o futuro, desenvolver novas tecnologias de maneira ética e responsável, em conexão com as principais tendências do mundo. Adquiri habilidades para exercer múltiplas atividades, atuando como cientista de dados, engenheiro ou arquiteto de dados, engenheiro de IA e Machine Learning, analista de inteligência de mercado, dentre outros.
Agosto, 2015 - Julho, 2019
Alcancei após árduos 3,5 anos o grau de bacharel em Ciência da computação pela Universidade Estadual da Zona Oeste do Rio de Janeiro (UEZO).
Janeiro, 2023 - Janeiro, 2025
Alcancei a certificação de especialista em análise de dados pela Data Science Academy.
Janeiro, 2023
O Analista de Dados serve como guardião dos dados de uma organização para que as partes interessadas possam entender os dados e usá-los para tomar decisões estratégicas de negócios. É uma função técnica, mas que requer uma visão de negócio para ajudar os tomadores de decisão a compreenderem os resultados das análises. Nesta formação, adquiri habilidades avançadas em SQL, Python, Data Lakes, Data Stores, Data Warehouses e Power BI.
Dezembro, 2022
Os Arquitetos de Dados são profissionais encarregados de definir políticas, procedimentos, modelos e tecnologias que serão usados para coletar, organizar, armazenar e recuperar informações para a organização. Nesta formação, desenvolvi as habilidades de design, arquitetura e modelagem de pipelines e soluções de dados.
Dezembro, 2022
Adquiri as habilidades necessárias para criar DAGs confiáveis e poderosas de forma eficaz seguindo as melhores práticas no Apache Airflow. Isso inclui escolher os operadores certos de acordo com as necessidades, definir os valores do argumento da tarefa com sabedoria, saber qual recurso usar e suas limitações e tomar decisões corretas no design das DAGs.
Novembro, 2022
Adquiri habilidades fundamentais necessárias para criar, gerenciar e monitorar DAGs com eficiência no Apache Airflow. Isso inclui escolher o executor certo com base nas necessidades atuais, saber em quais casos de uso o Airflow é adequado ou não, monitorar tarefas, entender como as tarefas são agendadas e ser capaz de criar DAGs básicas, mas bem projetadas.
Abril, 2022 - Abril, 2024
Alcancei a certificação de especialista em ciência de dados pela Data Science Academy.
Junho, 2020 - Outubro, 2021
Aprendi a atuar como um “Mago de Dados”, podendo adquirir massas de dados de diversas fontes e então limpar, tratar, organizar e prepará-los; para em seguida, aplicar habilidades matemáticas, estatísticas e machine learning para descobrir insights ocultos de negócios e gerar inteligência.
Junho, 2019 - Junho, 2020
Essa formação me preparou para atuar com análise de dados econômicos e assim ajudar a empresa ou cliente a obter vantagem competitiva e tomar decisões mais informadas. Foi uma excelente oportunidade de aprender sobre os fundamentos da análise econômica, tema de grande relevância para empresas públicas e privadas e para aqueles que pensam em empreender em Ciência de Dados.
Dezembro, 2021
O Airflow é uma plataforma para criar, agendar e monitorar fluxos de trabalho de maneira programática. Mas, questionei se seria possível usá-lo para processar dados. Haveriam vantagens nisso? Quais os benefícios de usá-lo em uma empresa? Seria possível aprender como criar pipelines consistentes e simples para tratar baixos volumes de dados? Quais arquiteturas de pipelines poderíamos construir no Airflow?
Janeiro, 2021
Neste episódio do Podcast DSA, expliquei um pouco da minha trajetória profissional, meu mindset, minhas alegrias e frustrações. Além disso, contei como foi conquistar meu primeiro emprego como Cientista de Dados e as tarefas do dia a dia.
Agosto, 2018 - Agosto, 2020
Busquei entender e refinar técnicas de reconhecimento e detecção de objetos como linhas, faces humanas e células. Também foi desenvolvido, como uma ramificação destes estudos, uma análise de otimização de detecção de bordas em células, para facilitar o processo de construção de modelos 3D nas áreas biológicas, farmacológicas e médicas.
Agora que já sabe um pouco sobre mim, gostaria de apresentar alguns dos projetos nos quais trabalhei. Por favor, sinta-se livre para analisá-los e caso tenha alguma dúvida, sugestão ou apenas queira trocar uma ideia sobre algum deles, não hesite em entrar em contato comigo!
Estes são alguns trabalhos em que posso utilizar minhas habilidades para gerar soluções eficientes e eficazes em problemas que você possa enfrentar.
Aplicar diferentes técnicas estatísticas para descrever, organizar e sumarizar seu conjunto de dados para que possa entender o que aconteceu.
Utilizar uma forma de análise avançada baseada em buscas detalhadas, descoberta de dados, data mining e correlações para examinar seus dados e responder à pergunta: "Por que isso aconteceu?".
Criar modelos preditivos que analisem fatos históricos e atuais para fazer previsões sobre eventos futuros ou desconhecidos de seu interesse.
Definir a melhor estratégia de ações que você pode tomar com base nos dados disponíveis.
Manusear ferramentas estatísticas e de Data Science em variáveis econômicas para extrair insights econômicos.
Criar gráficos responsivos e interativos com excelentes designs para sumarizar seus dados e proporcionar a visualização da Big Picture.
Fornecer apoio especializado para a definição e resolução de problemas minimizando as chances de falha no desenvolvimento de sua solução.
Será uma honra poder te ajudar!