Desenvolvedor(a) Sênior Java (Spring Boot) com conhecimento em Big Data
Sobre a vaga
Estamos buscando uma pessoa Desenvolvedora Sênior para construir e evoluir APIs e microserviços em Java/Spring Boot que operam sobre grandes volumes de dados e dados geoespaciais (GIS), com atuação forte em processamento distribuído (Apache Spark) e analytics/warehouse (BigQuery). O foco é entregar sistemas escaláveis e observáveis, conectando back-end transacional a pipelines e camadas analíticas com alta exigência de performance e custo.
Responsabilidades
* Projetar, implementar e manter microserviços Spring Boot (REST/gRPC) com foco em desempenho, segurança, resiliência e observabilidade.
* Implementar e manter fluxos de dados geoespaciais (ingestão, validação, enriquecimento, indexação espacial, consultas e agregações).
* Construir integrações e serviços que disparam/orquestram/consomem processamento em Apache Spark (batch e/ou streaming), incluindo operações geoespaciais quando necessário.
* Modelar e otimizar dados no BigQuery, incluindo tabelas com colunas/estruturas geoespaciais e padrões de consulta eficientes.
* Definir padrões de arquitetura, contratos e governança (versionamento de API, schemas, compatibilidade, qualidade de dados).
* Garantir qualidade: testes automatizados, revisão de código, padrões de segurança e operação em produção (SLOs/SLIs, incident response).
* Mentorar pessoas do time e liderar iniciativas técnicas (RFCs/ADRs, refactors, hardening de produção).
Requisitos obrigatórios
Back-end
* Experiência sólida com Java (preferencialmente 17+) e Spring Boot em produção.
* Domínio de APIs (REST), autenticação/autorização (JWT/OAuth2), validação, tratamento de erros e versionamento.
* Experiência com persistência e modelagem: JPA/Hibernate e/ou JDBC, tuning de queries e migrações.
* Práticas de engenharia: testes (unitários/integração/contrato), CI/CD e observabilidade (logs/métricas/tracing).
GIS / Geoespacial (requisito principal)
* Experiência prática com dados geoespaciais: geometria vs geografia, sistemas de coordenadas (CRS/SRID), projeções e transformações.
* Capacidade de implementar e otimizar operações espaciais: interseção, buffer, união, diferença, distância, snapping, simplificação, validação de geometrias, etc.
* Experiência com pelo menos um dos seguintes:
* PostGIS (consultas e indexação espacial com GiST/SP-GiST, funções ST_*)
* BigQuery GIS (GEOGRAPHY, ST_*, boas práticas de consulta/custo)
* Bibliotecas GIS (ex.: JTS/GEOS, GDAL/OGR, GeoTools) aplicadas no backend/pipelines
* Familiaridade com formatos geoespaciais: GeoJSON, WKT/WKB, Shapefile/GeoPackage (ou equivalentes), e noções de qualidade/topológica.
Apache Spark (avançado)
* Experiência avançada com Spark SQL / DataFrames/Datasets e otimização: particionamento, shuffle, cache/persist, broadcast joins.
* Capacidade de diagnosticar gargalos (skew, spill, retries) e fazer tuning de jobs.
* Familiaridade com formatos e otimizações: Parquet/Avro, compressão, layout, schema evolution.
* Experiência com Spark geoespacial (desejável, mas conta muito): Apache Sedona ou equivalente.
BigQuery
* Domínio de BigQuery SQL e boas práticas de modelagem para analytics.
* Otimização de custo/performance: partitioning, clustering, pruning, redução de bytes processados.
* Experiência com cargas e integrações (load jobs, pipelines de ingestão, padrões de atualização/merge).
Diferenciais
* GCP: IAM/Service Accounts, VPC, Cloud Storage, Pub/Sub, Cloud Run/GKE.
* Lakehouse/formatos: Iceberg / Delta / Hudi.
* Orquestração: Airflow/Composer, Dagster.
* Streaming: Kafka/PubSub, Spark Structured Streaming; idempotência e semânticas de entrega.
* Infra: Docker/Kubernetes, Terraform.
* Indexação espacial avançada e grids (H3/S2), geoprocessamento em escala, otimizações para custo/performance.
O que esperamos de senioridade (Sênior)
* Autonomia para atuar de ponta a ponta: descoberta, desenho, implementação, operação e melhoria contínua.
* Capacidade de sustentar decisões com trade-offs claros (custo, performance, consistência, governança).
* Influência técnica: elevar padrões do time (arquitetura, qualidade, confiabilidade, produtividade).
Modelo e faixa salarial
* Regime: PJ
* Modelo: híbrido
* Faixa salarial: R$ 20.000 a R$ 25.000/mês