Dicas para quem deseja iniciar uma carreira na área de Ciência de Dados: carreiras, habilidades, cursos, ferramentas e recursos.


Antes de começar o roteiro de estudos na área de Ciência de Dados, é importante entender o que essa área abrange.
Ciência de Dados é a exploração e análise de todos os dados disponíveis, estruturados ou não, com o objetivo de desenvolver compreensão, extrair conhecimento e formular ações que gerem resultados. Cientistas de Dados são uma nova geração de especialistas analíticos que têm as habilidades técnicas para resolver problemas complexos e a curiosidade de explorar quais são os problemas que precisam ser resolvidos.


Existem diversas funções dentro da área de dados, como:


  • Cientista de Dados

  • Engenheiro de Dados

  • Analista de Dados

  • Engenheiro de Machine Learning

  • Engenheiro de IA

  • Engenheiro DataOps

  • Arquiteto de Dados. 


Funções mais voltadas para o desenvolvimento, embora requeiram conhecimento em dados, incluem 


  • Engenheiro Blockchain

  • Desenvolvedor RPA. 


É importante destacar que essas são funções e não graduações, ou seja, não há regulamentação e qualquer profissional, com ou sem graduação (ou graduação em qualquer área), pode exercê-las.


Para os iniciantes na área de dados, é recomendado fazer um curso introdutório em Ciência de Dados. O curso de Introdução à Ciência de Dados 3.0 da Data Science Academy (DSA) é uma das melhores sugestões para conhecer um pouco mais sobre todas as funções dentro da área de dados. 


Alguns dos fundamentos que devem ser aprendidos incluem: 


  • Álgebra Linear e Matrizes

  • Dataframe e Series

  • Metodologias Ágeis

  • Modelagem de Dados Multidimensional

  • OLAP



Ferramentas e Linguagens:


  • Bibliotecas Externas

  • Estruturas de dados

  • Excel

  • Funções

  • Git/Github

  • Manipulação de Data Frames

  • POO

  • Python

  • R

  • Spark

  • SQL

  • Subconjunto de dados


Negócios:


  • Aprender sobre o negócio

  • Curiosidade

  • Driven

  • Gestão de negócios

  • Ideia básica de negócios



Matemática:


  • Derivada, limite, integral

  • Função de custo

  • Descendente gradiente

  • Compreensão matemática básica dos algoritmos sendo executados


Estatística Básica:


  • Análise Exploratória dos Dados

  • ANOVA

  • Assimetria e Curtose

  • Correlação

  • Distribuições contínuas (normal, poisson, gaussiano)

  • Estatística Descritiva (média, mediana, desvio padrão, variância)

  • Função de distribuição acumulada

  • Histograma, percentis e outliers

  • Regressão Linear e Logística

  • Teorema de Bayes

  • Teorema do Limite Central

  • Teoria da probabilidade

  • Teste de Hipóteses e Testes A/B

  • Teste de Qui Quadrado

  • Tipos de variáveis

  • Variáveis aleatórias


Data Visualization


  • Bibliotecas de dataviz (matplotlib, seaborn, plotly)

  • Dashboards

  • Ferramentas de dataviz (Power BI, Google Data Studio, Tableau)

  • Reports com foco para perguntas de negócios

  • Storytelling com dados



Data Wrangling


  • Extração de dados de sites, APIs, DBs

  • Formatação de dados (conversão de tipo)

  • Noção de ETL

  • SQL

  • Técnicas para lidar com valores ausentes

  • Transformação de dados



Machine Learning


  • Análise de Sentimentos

  • Aprendizado Supervisionado e Não Supervisionado

  • Boosting

  • Clusterização

  • Ensemble (Random forest, adaboost, etc)

  • Métricas de performance (RMS, acurácia, matriz de confusão, ROC, etc)

  • Otimização de hiperparâmetros

  • Overfitting

  • PCA

  • Redes Neurais

  • Tratamento Variável Numérica e Categórica


Soft Skills: 


  • Comunicação

  • Coordenação de projeto

  • Empatia

  • Foco

  • Habilidades de fazer pontes, trabalhar cross

  • Life long learning - Aprender a aprender → Curiosidade

  • Organização

  • Pensamento crítico

  • Técnicas de aprendizado - saber aprender



📚 LISTA DE LIVROS:





Comentários

Postagens mais visitadas deste blog

O que é Git e GitHub? E por qual razão o GitHub é essencial para estudantes de tecnologia?

Gerenciamento de tempo eficaz: Aprenda a aumentar sua produtividade com a técnica Pomodoro

A importância da cultura data-driven para o sucesso empresarial