1. A área de dados da Bradesco Seguros – contexto e desafios iniciais
Sandro e Thiago foram contratados há cerca de quatro anos para estruturar uma área de dados independente da do banco. A Bradesco Seguros é uma holding que engloba diversos negócios (seguros, saúde, previdência, capitalização, etc.), cada um com suas particularidades. O grande desafio inicial foi construir uma plataforma única, com governança e engenharia, que atendesse a todas as empresas do grupo, respeitando a regulação do setor (SUSEP, LGPD, etc.). Ambos vieram de outros mercados (Sandro do ramo de transporte de valores; Thiago de telecomunicações) e precisaram aprender rapidamente o negócio de seguros.
2. Pilares da estratégia: engenharia de dados e governança de dados
A divisão de responsabilidades é clara: Thiago lidera a plataforma e engenharia de dados; Sandro lidera a governança de dados. Juntos, adotaram o padrão hub & spoke (data mesh) – a área central (hub) define padrões, políticas, processos e tecnologia; os spokes (unidades de negócio) têm liberdade para construir produtos de dados de forma descentralizada, mas sempre dentro das diretrizes e com o suporte do hub. O lema da governança é: “orientar, habilitar e monitorar” – evitar ser uma área burocrática.
3. Stack tecnológico: Azure, Databricks, Power BI e Unity Catalog
A Bradesco Seguros optou por uma infraestrutura em nuvem Azure, com Databricks como solução central (tanto para engenharia de dados quanto para cientistas e analistas). Para visualização, utilizam Power BI de forma descentralizada, com padrões de workspace e pastas por diretoria. Para governança e catalogação, adotaram o Unity Catalog (linhagem de dados, gestão de metadados, qualidade de dados). A esteira de DataOps é apoiada por ferramentas como Sonar para qualidade de código, além de um time de QA que faz validação antes da publicação em produção.
4. Governança de dados: políticas, pilares e curadoria
Sandro detalha os pilares da governança: (1) Políticas e processos – documentação oficial, divulgada a toda a companhia; (2) Concessão e revogação de acessos; (3) Curadoria e catalogação – criação de “produtos de dados” com aval do dono do dado (owner); (4) Data Quality – métricas de completude, consistência, validação junto ao negócio; (5) Cultura data-driven – ações para diferentes níveis (executivo, operacional), incluindo uma comunidade de dados com mais de 500 membros; (6) Auditoria e observabilidade – verificação contínua de conformidade, acessos, e eventuais gaps.
Um princípio fundamental: não se compartilha dados brutos. Qualquer dado compartilhado deve ser um produto de dados curado, certificado pelo owner e catalogado. O time de governança atua como facilitador, garantindo que os desenvolvedores (spokes) sigam os padrões sem engessar a operação.
5. Confiabilidade dos dados e o papel do dono do dado
Thiago e Sandro enfatizam que a confiabilidade dos dados não é decidida pelo time de TI, mas sim pelo dono do dado (owner) – a área de negócio responsável por aquele dado. A governança fornece métricas, processos e monitoramento, mas a certificação de que o dado é “oficial” cabe ao negócio. Além disso, a plataforma trabalha prioritariamente com dados oriundos de sistemas fonte (evitando dados “trabalhados” sem rastreabilidade) e aplica camadas de data quality automáticas. A linhagem completa (do transacional ao produto final) é registrada no catálogo, garantindo transparência.
6. Cultura e letramento de dados: comunidade, newsletters e portal
A transformação cultural é um dos maiores desafios. A Bradesco Seguros investe em:
- Comunidade de dados (+500 membros) – fórum para divulgar novidades, processos e boas práticas.
- Newsletters e ações segmentadas – comunicação para executivos, operacionais e técnicos.
- Portal de governança – com normas, procedimentos, e centro de solicitação de projetos (gestão de dados, analytics, produtos de dados, modelos).
- Reciclagens e treinamentos contínuos – pois o público muda constantemente (entradas, saídas, movimentações).
Thiago ressalta que “a ferramenta ajuda, mas quem garante a confiabilidade são as pessoas, e o processo de aculturamento nunca termina”.
7. Processo de desenvolvimento e publicação: do exploratório ao produto
Qualquer usuário (de qualquer área) pode solicitar um espaço exploratório no ambiente Databricks. Ali, ele pode acessar dados já disponíveis (produtos já catalogados) ou até dados fora do ambiente analítico (ex.: arquivos CSV). Isso permite gerar hipóteses e fazer provas de conceito. Quando ele decide que aquela solução deve se tornar um produto oficial (dashboard, modelo, pipeline), aí entra a esteira governada:
- Desenvolvimento deve seguir padrões (nomes, segurança, documentação).
- A publicação passa por QA e pelo time de governança (centralizada).
- O SLA de publicação é curto (normalmente de um período para o outro), evitando gargalos.
- Para BI (Power BI), o desenvolvedor pode usar a ferramenta livremente; a intervenção da área central ocorre no momento da publicação, para estruturar o ambiente de forma saudável.
8. Mensuração de sucesso e indicadores
Thiago explica que o principal balizador é o feedback dos clientes internos – o que eles têm dificuldade, o que precisam. A partir daí, a engenharia busca soluções na plataforma (Databricks, por exemplo, evolui rapidamente) ou desenvolve atalhos. Além disso, medem:
- Tempo de entrega (ex.: antes, a ingestão de dados levava 4 meses; hoje, 2 semanas).
- Valor agregado – cada projeto é avaliado se gera receita, reduz despesa ou atende regulatório.
- Conformidade e observabilidade – sem gaps de acesso, sem dados não autorizados.
Sandro complementa: a governança também faz auditoria contínua para garantir que o ambiente está em linha com as políticas.
9. IA generativa e automação: labs e uso produtivo
A Bradesco Seguros já possui labs de IA generativa para:
- Geração de metadados e curadoria assistida.
- Conversão de códigos legados (SAS, por exemplo) para a plataforma moderna.
- Gestão de incidentes – interpretação de incidentes recorrentes e até reexecução automatizada (já em fase de POC com resultados positivos).
Há um cuidado especial com segurança e governança, mas a diretriz executiva incentiva o uso produtivo de IA.
10. Principais aprendizados e conselhos para outras empresas
Para gestores que estão em um ambiente caótico ou no início da jornada de dados, Sandro e Thiago recomendam:
- Não se desesperar – empresas de todos os portes estão no mesmo barco; o importante é começar.
- Definir uma estratégia de dados (o que se espera daquela área) antes de escolher ferramentas.
- Começar pequeno, por casos de uso – um cenário, um problema real, entregar valor rápido e replicar.
- Ferramenta é consequência – primeiro o problema, depois a tecnologia. Existem opções abertas e acessíveis para todos os portes.
- Trazer as áreas de negócio como co-criadoras – se elas participarem da construção das regras, se sentirão pertencentes e adotarão a solução.
- Colaboração entre governança e engenharia – processos precisam ser revistos em conjunto continuamente (PDCA).
11. Conselhos para quem está começando na área de dados
- Estude – há conteúdo gratuito de excelente qualidade (YouTube, LinkedIn, Instagram).
- Entenda o que te atrai – engenharia de dados, ciência de dados, governança, BI, etc. O mercado precisa de engenheiros de dados (há mais dados desestruturados do que estruturados).
- Não negligencie o negócio – ser extremamente técnico sem entender a demanda do cliente não gera valor. “Aprender a língua do negócio é primordial.”
- Explore, troque ideias, pergunte – profissionais experientes estão abertos a ajudar (LinkedIn, comunidades).