Detalhes do Emprego
Instituto de Pesquisas ELDORADO
Desculpe, este trabalho não está disponível em sua região
Responsabilidades e atribuições:
1. Atuar como principal contato técnico para equipes e clientes internos, abordando e solucionando problemas de suporte e solicitações técnicas relacionadas a sistemas de produção.
2. Conduzir análises técnicas aprofundadas de incidentes, realizando investigações de causa raiz e colaborando com equipes de engenharia para propor e implementar soluções.
3. Monitorar, relatar e solucionar problemas de pipeline de dados e sistemas de back-end, aplicando soluções alternativas ou correções conforme necessário para garantir a operação contínua.
4. Colaborar com equipes de Engenharia e SRE (Engenharia de Confiabilidade do Site) para aprimorar os processos de Gerenciamento de Incidentes e Gerenciamento de Problemas para uma resolução de problemas mais eficaz.
5. Trabalhar em estreita colaboração com gerentes de projeto e equipes de operações para garantir uma comunicação tranquila, a progressão de projetos em andamento no prazo e correções de produção.
6. Analisar fluxos de trabalho e criar relatórios de defeitos / falhas detalhados, acompanhando os problemas até a resolução e garantindo o acompanhamento e o encerramento adequados.
Requisitos e qualificações:
1. Proficiência em depuração de problemas técnicos em ambientes de produção de alto volume e ritmo acelerado.
2. Proficiente em SQL e familiarizado com ecossistemas de Big Data como Cassandra, Flink, Kafka e outras tecnologias relacionadas.
3. Forte conhecimento de scripts com Python ou linguagens similares para automatizar tarefas e solucionar problemas de forma eficiente.
4. Experiência em depuração de API Requests e problemas de respostas usando ferramentas como Charles, logs de rede ou métodos semelhantes para resolver incidentes de produção.
5. Experiência com implementação e administração de ferramentas de monitoramento, registro e telemetria (por exemplo, Splunk, Prometheus, etc.) para manter a integridade da produção.
6. Familiaridade com sistemas de controle de versão como Git e reconhecimento das melhores práticas de programação.
7. Conhecimento de ferramentas e fluxos de trabalho de gerenciamento de incidentes, bem como experiência com análise de causa raiz em ambientes de produção.
8. Inglês avançado para escrita e conversação (obrigatório, pois a equipe é global, com a maior parte alocada fora do Brasil).
#J-18808-Ljbffr