Dicas para quem deseja iniciar uma carreira na área de Ciência de Dados: carreiras, habilidades, cursos, ferramentas e recursos.
Antes de começar o roteiro de estudos na área de Ciência de Dados, é importante entender o que essa área abrange. Ciência de Dados é a exploração e análise de todos os dados disponíveis, estruturados ou não, com o objetivo de desenvolver compreensão, extrair conhecimento e formular ações que gerem resultados. Cientistas de Dados são uma nova geração de especialistas analíticos que têm as habilidades técnicas para resolver problemas complexos e a curiosidade de explorar quais são os problemas que precisam ser resolvidos.
Existem diversas funções dentro da área de dados, como:
Cientista de Dados
Engenheiro de Dados
Analista de Dados
Engenheiro de Machine Learning
Engenheiro de IA
Engenheiro DataOps
Arquiteto de Dados.
Funções mais voltadas para o desenvolvimento, embora requeiram conhecimento em dados, incluem
Engenheiro Blockchain
Desenvolvedor RPA.
É importante destacar que essas são funções e não graduações, ou seja, não há regulamentação e qualquer profissional, com ou sem graduação (ou graduação em qualquer área), pode exercê-las.
Para os iniciantes na área de dados, é recomendado fazer um curso introdutório em Ciência de Dados. O curso de Introdução à Ciência de Dados 3.0 da Data Science Academy (DSA) é uma das melhores sugestões para conhecer um pouco mais sobre todas as funções dentro da área de dados.
Alguns dos fundamentos que devem ser aprendidos incluem:
Álgebra Linear e Matrizes
Dataframe e Series
Metodologias Ágeis
Modelagem de Dados Multidimensional
OLAP
Ferramentas e Linguagens:
Bibliotecas Externas
Estruturas de dados
Excel
Funções
Git/Github
Manipulação de Data Frames
POO
Python
R
Spark
SQL
Subconjunto de dados
Negócios:
Aprender sobre o negócio
Curiosidade
Driven
Gestão de negócios
Ideia básica de negócios
Matemática:
Derivada, limite, integral
Função de custo
Descendente gradiente
Compreensão matemática básica dos algoritmos sendo executados
Estatística Básica:
Análise Exploratória dos Dados
ANOVA
Assimetria e Curtose
Correlação
Distribuições contínuas (normal, poisson, gaussiano)
Estatística Descritiva (média, mediana, desvio padrão, variância)
Função de distribuição acumulada
Histograma, percentis e outliers
Regressão Linear e Logística
Teorema de Bayes
Teorema do Limite Central
Teoria da probabilidade
Teste de Hipóteses e Testes A/B
Teste de Qui Quadrado
Tipos de variáveis
Variáveis aleatórias
Data Visualization
Bibliotecas de dataviz (matplotlib, seaborn, plotly)
Dashboards
Ferramentas de dataviz (Power BI, Google Data Studio, Tableau)
Reports com foco para perguntas de negócios
Storytelling com dados
Data Wrangling
Extração de dados de sites, APIs, DBs
Formatação de dados (conversão de tipo)
Noção de ETL
SQL
Técnicas para lidar com valores ausentes
Transformação de dados
Machine Learning
Análise de Sentimentos
Aprendizado Supervisionado e Não Supervisionado
Boosting
Clusterização
Ensemble (Random forest, adaboost, etc)
Métricas de performance (RMS, acurácia, matriz de confusão, ROC, etc)
Otimização de hiperparâmetros
Overfitting
PCA
Redes Neurais
Tratamento Variável Numérica e Categórica
Soft Skills:
Comunicação
Coordenação de projeto
Empatia
Foco
Habilidades de fazer pontes, trabalhar cross
Life long learning - Aprender a aprender → Curiosidade
Organização
Pensamento crítico
Técnicas de aprendizado - saber aprender
📚 LISTA DE LIVROS:
Data Science do Zero: https://amzn.to/3GLG9xN
Data Science para Negócios: https://amzn.to/3FLpI3c
Python para Análise de Dados: https://amzn.to/3IkONng
Estatística Prática para Cientista de Dados: https://amzn.to/33SUhqe
Aprendizado de Máquina com Scikit-Learn, Keras & Tensorflow: https://amzn.to/3KwzyJG
Storytelling com dados: https://amzn.to/3nHlu6k
Data Science para Negócios : https://amzn.to/3FLpI3c
📽 CONTEÚDO DE MIDIA
Trilha da EstaTiDados: https://www.youtube.com/playlist?list=PLjdDBZW3EmXe6hO2Rt5Q9I5wzRZ7j7K8P
Podcast Data Hackers
Comentários
Postar um comentário