Para o Head de Risco e Crédito de uma fintech em 2026, a pergunta que decide o orçamento de dados não é "qual bureau tem o melhor score", e sim "qual fonte externa eleva o lift do meu modelo no segmento que eu realmente quero aprovar, sem inflar o custo por proposta". A resposta raramente é um único provedor. É uma carteira de dados — bureau de crédito para profundidade de histórico, mais camadas complementares (cadastral, societária, judicial) que cobrem o thin file, validam identidade e reduzem falso positivo — calibrada por métricas de poder discriminante (KS, AUC) e por economia unitária (custo por consulta efetiva, custo por proposta aprovada). Este guia organiza essa decisão de forma conceitual, na linguagem de quem responde por inadimplência, aprovação e auditoria.
O ponto de partida: por que dados externos pesam mais em 2026
Finsiders Brasil / IBGE / Serasa Experian, 2025-2026
O crédito digital brasileiro deixou de ser um experimento de margem. Segundo a Pesquisa Fintechs de Crédito Digital 2025, conduzida pela PwC em parceria com a ABCD (Associação Brasileira de Crédito Digital), o setor originou volumes na casa das dezenas de bilhões de reais e atende dezenas de milhões de clientes pessoa física — público que, em boa parte, os bancos tradicionais não conseguiam pontuar. Esse é o terreno do Head de Risco: cada ponto de poder discriminante a mais no modelo se traduz em mais aprovação saudável ou menos perda esperada.
A mudança estrutural de 2026 é a disponibilidade de dados. O Open Finance — ecossistema de compartilhamento de dados financeiros mediante consentimento do cliente, coordenado pelo Banco Central — passou a alimentar a originação de crédito em escala. A Finsiders Brasil reporta que, só no primeiro semestre de 2025, instituições financiaram cerca de R$ 12 bilhões com apoio de dados de Open Finance, acumulando aproximadamente R$ 30 bilhões desde o início do monitoramento. Em fevereiro de 2026, a portabilidade de crédito 100% digital entrou em operação como a primeira aplicação transacional do cluster de crédito do Open Finance brasileiro.
"As instituições passaram a enxergar o risco de forma mais fiel." A leitura de renda informal e de múltiplas fontes de receita, antes invisível ao modelo tradicional, materializa o risco em vez de presumi-lo — relevante num país com mais de 40 milhões de trabalhadores informais, quase 40% da força de trabalho, segundo o IBGE (fonte: Finsiders Brasil / IBGE, 2026, link).
O problema concreto: thin file e renda invisível
Thin file — definição. Termo que descreve o cliente com histórico de crédito raso ou inexistente nos bureaus: poucas operações, pouca recência, pouca variedade de obrigações. O modelo tradicional, treinado em comportamento de pagamento registrado, tem pouca informação para discriminar bom de mau pagador nesse grupo — e tende a recusar por precaução, deixando aprovação saudável na mesa.
É exatamente onde dados externos complementares mudam a economia da decisão. Um motorista de aplicativo que recebe cerca de R$ 4.500 por mês de forma quase diária, sem holerite, praticamente não pontuava no modelo antigo. Com dados de Open Finance, a recorrência aparece e a renda deixa de ser suposição. Para o Head de Risco, isso significa um ganho de poder discriminante concentrado justamente na faixa de maior volume e maior atrito comercial.
Bureau de crédito vs. dados complementares: papéis distintos
O erro recorrente em comitês de crédito é tratar todo dado externo como substituto do bureau. Não é. Bureau e dados complementares ocupam funções diferentes na cadeia de decisão, e a carteira ideal os combina.
Os bureaus de crédito — Serasa Experian, Boa Vista (Equifax), SPC Brasil, Quod e TransUnion — concentram histórico de pagamento, restritivos, Cadastro Positivo e scores derivados. São profundos em comportamento financeiro registrado, mas caros por consulta enriquecida e pouco flexíveis para casos de uso fora do score padrão. Em 2026, os principais bureaus assinaram acordo com o Banco Central para compartilhamento de informações, ampliando a base disponível (fonte: ANBC / LinkedIn, 2026, link).
Os dados complementares — fornecidos por provedores DaaS (Data as a Service) e IDtechs — entram onde preço, flexibilidade de API e cobertura de identidade decidem: validação cadastral, dados societários (KYB), enriquecimento de PJ, indicadores de consistência e sinais antifraude. Não competem de frente no score; complementam-no, sobretudo no thin file e na validação de quem é o proponente.
| Camada de dado | O que entrega | Onde decide | Faixa de preço de mercado por consulta |
|---|---|---|---|
| Bureau (score + restritivo + Positivo) | Profundidade de histórico, poder preditivo consolidado | Decisão de limite e precificação no cliente com histórico | Até R$ 30+ na consulta com score completo |
| Cadastral complementar | Validação e consistência de CPF/CNPJ, endereço, contato | Onboarding, deduplicação, prevenção de fraude de 1ª parte | R$ 0,05 a R$ 0,50 |
| Societário (KYB) | Quadro de sócios, beneficiário final, vínculos PJ | Crédito PJ, compliance, risco de concentração | Variável por profundidade do grafo societário |
| Judicial / restrições | Processos, protestos, ações de execução | Ajuste fino de risco e recuperação | Por consulta, conforme abrangência |
| Open Finance (consentido) | Fluxo transacional, renda recorrente, comprometimento | Thin file, renda informal, redução de recusa | Custo de integração + processamento |
Faixas de preço refletem padrões de mercado de contratação por API pay-per-use, em que a validação cadastral costuma custar entre R$ 0,05 e R$ 0,50 e a consulta com bureau e score chega a R$ 30 ou mais. Use-as como referência de ordem de grandeza, não como tabela fechada de qualquer fornecedor específico.
As métricas que importam para o Head de Risco
A escolha de dados se justifica por número, não por narrativa de fornecedor. Quatro famílias de métricas sustentam a decisão.
1. Poder discriminante: KS e AUC
KS (Kolmogorov-Smirnov) — definição. Mede a distância máxima entre as distribuições acumuladas de bons e maus pagadores ao longo do score. Quanto maior o KS, melhor o modelo separa quem paga de quem não paga. AUC (Area Under the ROC Curve) — definição. Probabilidade de o modelo ordenar corretamente um par aleatório bom/mau; 0,5 é aleatório, 1,0 é separação perfeita. A pergunta operacional para qualquer fonte nova é direta: quanto de KS/AUC incremental ela adiciona ao meu modelo campeão, no meu público, no meu período de safra?
O ganho relevante quase nunca é uniforme. Uma fonte de Open Finance pode adicionar pouco KS no cliente com bureau espesso e muito KS no thin file. Por isso a avaliação correta é por subpopulação, não na média geral — é no recorte que o dado paga (ou não) seu custo.
2. Economia unitária: custo por proposta aprovada
Poder preditivo sem custo controlado destrói margem. O Head de Risco precisa enxergar o gasto com dados como percentual da receita da operação — tipicamente algo entre 1% e 5% — e, sobretudo, o custo por proposta aprovada: quanto de consulta externa se gasta para gerar uma aprovação saudável. Uma fonte cara que só confirma o que o bureau já dizia tem ganho marginal nulo e custo positivo; sai da carteira.
3. Captura de fraude e falso positivo
Risco de crédito e risco de fraude se confundem na originação digital. O Brasil registrou quase 7 milhões de tentativas de fraude apenas no primeiro semestre de 2025, alta de 29,5% sobre o mesmo período do ano anterior, segundo o Indicador de Tentativas de Fraude da Serasa Experian, com o setor bancário como principal alvo. A identidade sintética — combinação de dados reais vazados com informação fictícia para criar um proponente que não existe — desafia o KYC convencional e contamina a própria base de treino do modelo de crédito. Aqui, dados cadastrais de consistência e sinais antifraude medem-se por taxa de captura, falso positivo e latência em tempo real, não por KS.
4. Qualidade técnica da fonte
Um dado preditivo que chega tarde, instável ou com cobertura baixa não entra em produção. O Head de Risco avalia, junto ao CTO e ao Head de Dados, a latência (p99), o uptime contratual, a taxa de retorno positivo (hit rate) e a estabilidade da resposta ao longo do tempo — variável que, quando degrada, derruba o modelo sem aviso.
O mercado se consolida — e isso muda a carteira
A consolidação dos bureaus em valores de aquisição (R$ milhões)
A camada de identidade e antifraude que abastece os modelos de risco está em forte consolidação, o que tem efeito direto sobre dependência de fornecedor. Em 2026, a Serasa Experian adquiriu a idwall, startup de verificação de identidade e onboarding digital, em transação aprovada pelo Cade e avaliada em torno de R$ 400 milhões a R$ 450 milhões, segundo a Finsiders Brasil e a CNN Brasil. A idwall havia captado R$ 260 milhões em dez anos; a compra é a primeira da Serasa desde a aquisição da ClearSale, por cerca de R$ 2 bilhões, em 2024.
No mercado de verificação de identidade seguem atuando players como Unico, Certta (antiga CAF) e Incognia. Para o Head de Risco, a leitura estratégica é clara: a consolidação aumenta o poder de precificação dos grandes bureaus sobre a camada antifraude. Manter pelo menos uma fonte complementar independente — um provedor DaaS de validação cadastral e KYB com flexibilidade de API — preserva poder de negociação e reduz risco de concentração de fornecedor.
Como decidir, na prática: um roteiro de avaliação
Roteiro de avaliação de uma nova fonte de dados
- 1Defina a subpopulação-alvo
Thin file, PJ recém-aberta ou renda informal — o ganho médio engana, meça onde dói.
- 2Construa a base de teste retroativa
Use safras com desempenho já conhecido (bom/mau realizado) para medir lift de verdade.
- 3Mensure KS e AUC incrementais
Compare o modelo campeão com e sem a fonte, por subpopulação, não só na média.
- 4Calcule a economia unitária
Custo por consulta efetiva e custo por proposta aprovada projetados no volume real.
- 5Teste cobertura e estabilidade
Hit rate, latência p99, uptime e consistência da resposta ao longo do período.
- 6Verifique a base legal
STJ dispensa consentimento na proteção ao crédito; Open Finance exige consentimento. Documente a trilha.
- 7Decida pela carteira
A pergunta final é o ganho marginal sobre o que você já tem em produção.
A seleção de uma nova fonte de dados não deveria depender de demonstração comercial. Deveria passar por um bake-off comparativo com dados reais da própria operação. Roteiro recomendado:
- Defina a subpopulação-alvo. Thin file? PJ recém-aberta? Renda informal? O ganho médio engana; meça onde dói.
- Construa a base de teste retroativa. Safras com desempenho conhecido (bom/mau já realizado), para medir lift de verdade.
- Mensure KS e AUC incrementais do modelo campeão com e sem a fonte, por subpopulação — não só na média.
- Calcule a economia unitária. Custo por consulta efetiva e custo por proposta aprovada, projetados no volume real.
- Teste cobertura e estabilidade. Hit rate, latência p99, uptime e consistência da resposta ao longo do período.
- Verifique a base legal. Para proteção ao crédito, o STJ pacificou que o tratamento dispensa consentimento; para Open Finance, o consentimento é o eixo. Documente a trilha.
- Decida pela carteira, não pela fonte isolada. A pergunta final é o ganho marginal sobre o que você já tem em produção.
Governança, LGPD e auditabilidade
Nenhum ganho de KS sobrevive a um achado de auditoria. O Head de Risco moderno responde tanto pela performance do modelo quanto pela sua defensabilidade. A LGPD (Lei Geral de Proteção de Dados) e o entendimento do STJ tornam o uso de dados para proteção ao crédito viável sem consentimento, mas exigem finalidade legítima documentada, minimização e trilha de auditoria. Para crédito PJ, o KYB e a checagem de beneficiário final dialogam diretamente com as obrigações de prevenção à lavagem de dinheiro da Circular BCB 3.978/2020.
A regra prática: toda fonte que entra no modelo precisa ter origem, base legal e versão rastreáveis. Quando o regulador, o auditor ou o comitê de crédito perguntar por que uma proposta foi recusada, a resposta tem de reconstituir a decisão — incluindo qual dado externo pesou e sob qual amparo legal foi consultado.
O melhor dado externo de 2026 não é o que tem o maior score de catálogo. É o que adiciona poder discriminante na subpopulação que você quer aprovar, a um custo por proposta que preserva margem, com cobertura estável e trilha de auditoria limpa. Tudo o mais é narrativa de fornecedor.
Perguntas frequentes
Dados complementares substituem o bureau de crédito?
Não. Bureau e dados complementares têm papéis distintos. O bureau entrega profundidade de histórico e poder preditivo consolidado, decisivos no cliente com comportamento financeiro registrado. Dados complementares — cadastral, societário, judicial, Open Finance — cobrem thin file, validam identidade e enriquecem PJ, onde o bureau é raso ou caro. A carteira ideal combina as duas camadas.
Como medir se uma nova fonte de dados vale o custo?
Por lift incremental e economia unitária. Meça o ganho de KS e AUC do seu modelo campeão com e sem a fonte, segmentado por subpopulação, sobre safras com desempenho já conhecido. Em paralelo, calcule o custo por consulta efetiva e o custo por proposta aprovada no volume real. Uma fonte que só confirma o que o bureau já dizia tem ganho marginal nulo e deve ficar de fora.
Por que o Open Finance importa tanto para o thin file em 2026?
Porque revela renda recorrente e fluxo transacional que o histórico de crédito tradicional não captura — caso típico do trabalhador informal, que soma mais de 40 milhões de pessoas no Brasil segundo o IBGE. Com o consentimento do cliente, a recorrência de receita materializa o risco em vez de presumi-lo, gerando ganho de poder discriminante concentrado justamente na faixa que o modelo antigo recusava por falta de informação.
A consolidação dos bureaus aumenta o risco de dependência de fornecedor?
Sim. Aquisições como a da idwall pela Serasa Experian em 2026, por cerca de R$ 400 milhões a R$ 450 milhões, concentram a camada de identidade e antifraude nos grandes bureaus e ampliam o poder de precificação deles. Manter pelo menos um provedor DaaS independente para validação cadastral e KYB preserva flexibilidade de API e poder de negociação, reduzindo risco de concentração.
Quais métricas de fraude o Head de Risco deve acompanhar, além de KS e AUC?
Taxa de captura de fraude, taxa de falso positivo e latência em tempo real. Risco de crédito e risco de fraude se confundem na originação digital, e a identidade sintética contamina a própria base de treino do modelo. Com quase 7 milhões de tentativas de fraude só no primeiro semestre de 2025 (Serasa Experian), sinais cadastrais de consistência e antifraude precisam de métricas próprias, distintas do poder discriminante de crédito.
Usar dados externos para crédito exige consentimento do cliente?
Depende da finalidade. Para proteção ao crédito, o STJ pacificou que o tratamento de dados dispensa consentimento, desde que com finalidade legítima documentada e minimização, sob a LGPD. Já o Open Finance opera sobre consentimento explícito do titular. Em ambos os casos, a fonte precisa de origem, base legal e versão rastreáveis para sustentar a decisão diante de auditoria e regulador.
Leia também no DataHub
Fontes
- PwC / ABCD — Pesquisa Fintechs de Crédito Digital 2025 (2025)
- Finsiders Brasil — Open Finance já ajuda a redesenhar o acesso ao crédito (2026)
- Serasa Experian — Indicador de Tentativas de Fraude (recorde 1º semestre 2025) (2025)
- Finsiders Brasil — Serasa adquire idwall por cerca de R$ 400 milhões (2026)
- CNN Brasil — Cade aprova compra da idwall pela Serasa (2026)
- ANBC / LinkedIn — BC e bureaus de crédito assinam acordo para compartilhamento de informações (2026)
- Banco Central do Brasil — Open Finance (2026)