Cientista de dados sr

Ituiutaba

Triggo

Anunciada dia 22 novembro

Descrição

DescriptionDescrição da Posição Profissional responsável por desenvolver e implementar soluções analíticas avançadas e modelos de machine learning que geram valor estratégico para o negócio. Lidera projetos de ciência de dados end-to-end, desde a definição do problema até a implantação de modelos em produção, utilizando o ecossistema Google Cloud Platform (GCP) para construir soluções escaláveis e robustas.RequirementsRequisitosGraduação em Ciência da Computação, Estatística, Matemática, Engenharia ou áreas correlatas (Mestrado/Doutorado desejável) Experiência mínima de 6-8 anos em ciência de dados e analytics Experiência comprovada em projetos de ML/IA com impacto mensurável no negócio Portfólio de projetos demonstrando expertise técnica Certificações GCP (Professional Data Engineer, Professional ML Engineer) desejáveis Hard Skills Essenciais:Google Cloud Platform (Sênior): BigQuery, Vertex AI, Cloud Storage, Dataflow, Dataproc, Cloud Functions, Cloud Run Machine Learning: Algoritmos supervisionados e não-supervisionados, deep learning, NLP, computer vision, séries temporais Programação: Python avançado (scikit-learn, TensorFlow, PyTorch, Keras), R, SQL avançado MLOps: Vertex AI Pipelines, Kubeflow, MLflow, versionamento de modelos, monitoramento em produção Feature Engineering: Criação, seleção e transformação de features, feature stores Estatística: Testes de hipóteses, inferência estatística, análise exploratória avançada, experimentação A/B Big Data: PySpark, Apache Beam, processamento distribuído no Dataproc Visualização: Looker, Data Studio, Matplotlib, Seaborn, Plotly Diferenciais:IA Generativa: LLMs, Vertex AI Generative AI, prompt engineering, RAG (Retrieval-Augmented Generation) AutoML: Vertex AI AutoML, otimização de hiperparâmetros Real-time ML: Streaming analytics, Pub/Sub, online predictions Governança de Dados: Data Catalog, Dataplex, políticas de privacidade e ética em IA DevOps: CI/CD para ML, Docker, Kubernetes (GKE), Terraform Frameworks especializados: XGBoost, LightGBM, CatBoost, Hugging Face Transformers Soft SkillsPensamento analítico: Capacidade de estruturar problemas complexos e definir abordagens analíticas adequadas Visão de negócio: Tradução de desafios de negócio em problemas de ciência de dados e vice-versa Comunicação estratégica: Apresentação de insights e resultados para audiências técnicas e não-técnicas, storytelling com dados Liderança técnica: Mentoria de cientistas júnior/pleno, definição de melhores práticas Curiosidade intelectual: Investigação profunda de dados e fenômenos, questionamento constante Colaboração multidisciplinar: Trabalho efetivo com engenheiros, analistas, product managers e stakeholders de negócio Experimentação: Mindset científico, design de experimentos, validação rigorosa de hipóteses Gestão de projetos: Priorização, planejamento e entrega de projetos de dados com autonomia Resiliência: Persistência diante de problemas complexos e resultados iniciais negativos Ética em IA: Consciência sobre vieses, fairness, explicabilidade e impacto social dos modelos Responsabilidades PrincipaisLiderar projetos de ciência de dados do início ao fim (discovery, desenvolvimento, deploy, monitoramento) Desenvolver modelos de ML/IA escaláveis e performáticos utilizando GCP Realizar análises exploratórias complexas e gerar insights acionáveis Implementar pipelines de MLOps para automação e monitoramento de modelos Definir métricas de sucesso e avaliar impacto de negócio das soluções Colaborar com engenheiros de dados na construção de features e pipelines Mentorear cientistas de dados júnior e pleno Manter-se atualizado com state-of-the-art em ML/IA e avaliar aplicabilidade Documentar metodologias, experimentos e resultados Garantir boas práticas de governança, ética e explicabilidade dos modelos Diferenciais CompetitivosPublicações em conferências/journals de ML/IA Contribuições open-source em projetos de ciência de dados Experiência com múltiplas clouds (Azure, AWS) além de GCP Conhecimento em domínios específicos (finanças, saúde, varejo, etc.) Experiência com produtos de dados e data products Vivência em ambientes ágeis (Scrum, Kanban) Stack Tecnológico GCP Detalhado Dados e ArmazenamentoBigQuery: Data warehouse, SQL analytics, ML integrado (BQML) Cloud Storage: Data lake, armazenamento de datasets e artefatos Cloud SQL / Cloud Spanner: Bancos relacionais Firestore / Bigtable: Bancos NoSQL Machine Learning e IAVertex AI: Plataforma unificada de ML (training, deployment, monitoring) Vertex AI Workbench: Notebooks gerenciados (Jupyter) AutoML: Treinamento automatizado de modelos Pre-trained APIs: Vision AI, Natural Language AI, Speech-to-Text, Translation Processamento de DadosDataflow: Apache Beam, processamento batch e streaming Dataproc: Clusters Spark/Hadoop gerenciados Pub/Sub: Mensageria e streaming de eventos Cloud Composer: Orquestração (Apache Airflow) Deploy e ServingCloud Run: Containerização serverless Cloud Functions: Funções serverless GKE (Google Kubernetes Engine): Orquestração de containers Vertex AI Endpoints: Serving de modelos Governança e MonitoramentoData Catalog: Catalogação e descoberta de dados Dataplex: Governança unificada de dados Cloud Monitoring: Observabilidade e alertas Cloud Logging: Logs centralizados Benefits

Se candidatar

Criar um alerta

Salvar