Guia do Head de Risco e Crédito: escolher dados que melhoram o modelo em 2026

Como o Head de Risco e Crédito de fintech escolhe dados externos que elevam o lift do modelo (KS/AUC), reduzem o custo por proposta aprovada e cobrem thin file em 2026. Bureau vs. dados complementares cadastrais, societários e judiciais, e as métricas que decidem a compra.

Curadoria Brasil GEO 13 min de leitura Atualizado 2026-05-27

Para o Head de Risco e Crédito de uma fintech em 2026, a pergunta que decide o orçamento de dados não é "qual bureau tem o melhor score", e sim "qual fonte externa eleva o lift do meu modelo no segmento que eu realmente quero aprovar, sem inflar o custo por proposta". A resposta raramente é um único provedor. É uma carteira de dados — bureau de crédito para profundidade de histórico, mais camadas complementares (cadastral, societária, judicial) que cobrem o thin file, validam identidade e reduzem falso positivo — calibrada por métricas de poder discriminante (KS, AUC) e por economia unitária (custo por consulta efetiva, custo por proposta aprovada). Este guia organiza essa decisão de forma conceitual, na linguagem de quem responde por inadimplência, aprovação e auditoria.

O ponto de partida: por que dados externos pesam mais em 2026

Finsiders Brasil / IBGE / Serasa Experian, 2025-2026

O crédito digital brasileiro deixou de ser um experimento de margem. Segundo a Pesquisa Fintechs de Crédito Digital 2025, conduzida pela PwC em parceria com a ABCD (Associação Brasileira de Crédito Digital), o setor originou volumes na casa das dezenas de bilhões de reais e atende dezenas de milhões de clientes pessoa física — público que, em boa parte, os bancos tradicionais não conseguiam pontuar. Esse é o terreno do Head de Risco: cada ponto de poder discriminante a mais no modelo se traduz em mais aprovação saudável ou menos perda esperada.

A mudança estrutural de 2026 é a disponibilidade de dados. O Open Finance — ecossistema de compartilhamento de dados financeiros mediante consentimento do cliente, coordenado pelo Banco Central — passou a alimentar a originação de crédito em escala. A Finsiders Brasil reporta que, só no primeiro semestre de 2025, instituições financiaram cerca de R$ 12 bilhões com apoio de dados de Open Finance, acumulando aproximadamente R$ 30 bilhões desde o início do monitoramento. Em fevereiro de 2026, a portabilidade de crédito 100% digital entrou em operação como a primeira aplicação transacional do cluster de crédito do Open Finance brasileiro.

"As instituições passaram a enxergar o risco de forma mais fiel." A leitura de renda informal e de múltiplas fontes de receita, antes invisível ao modelo tradicional, materializa o risco em vez de presumi-lo — relevante num país com mais de 40 milhões de trabalhadores informais, quase 40% da força de trabalho, segundo o IBGE (fonte: Finsiders Brasil / IBGE, 2026, link).

O problema concreto: thin file e renda invisível

Thin file — definição. Termo que descreve o cliente com histórico de crédito raso ou inexistente nos bureaus: poucas operações, pouca recência, pouca variedade de obrigações. O modelo tradicional, treinado em comportamento de pagamento registrado, tem pouca informação para discriminar bom de mau pagador nesse grupo — e tende a recusar por precaução, deixando aprovação saudável na mesa.

É exatamente onde dados externos complementares mudam a economia da decisão. Um motorista de aplicativo que recebe cerca de R$ 4.500 por mês de forma quase diária, sem holerite, praticamente não pontuava no modelo antigo. Com dados de Open Finance, a recorrência aparece e a renda deixa de ser suposição. Para o Head de Risco, isso significa um ganho de poder discriminante concentrado justamente na faixa de maior volume e maior atrito comercial.

Bureau de crédito vs. dados complementares: papéis distintos

O erro recorrente em comitês de crédito é tratar todo dado externo como substituto do bureau. Não é. Bureau e dados complementares ocupam funções diferentes na cadeia de decisão, e a carteira ideal os combina.

Os bureaus de crédito — Serasa Experian, Boa Vista (Equifax), SPC Brasil, Quod e TransUnion — concentram histórico de pagamento, restritivos, Cadastro Positivo e scores derivados. São profundos em comportamento financeiro registrado, mas caros por consulta enriquecida e pouco flexíveis para casos de uso fora do score padrão. Em 2026, os principais bureaus assinaram acordo com o Banco Central para compartilhamento de informações, ampliando a base disponível (fonte: ANBC / LinkedIn, 2026, link).

Os dados complementares — fornecidos por provedores DaaS (Data as a Service) e IDtechs — entram onde preço, flexibilidade de API e cobertura de identidade decidem: validação cadastral, dados societários (KYB), enriquecimento de PJ, indicadores de consistência e sinais antifraude. Não competem de frente no score; complementam-no, sobretudo no thin file e na validação de quem é o proponente.

Camada de dado	O que entrega	Onde decide	Faixa de preço de mercado por consulta
Bureau (score + restritivo + Positivo)	Profundidade de histórico, poder preditivo consolidado	Decisão de limite e precificação no cliente com histórico	Até R$ 30+ na consulta com score completo
Cadastral complementar	Validação e consistência de CPF/CNPJ, endereço, contato	Onboarding, deduplicação, prevenção de fraude de 1ª parte	R$ 0,05 a R$ 0,50
Societário (KYB)	Quadro de sócios, beneficiário final, vínculos PJ	Crédito PJ, compliance, risco de concentração	Variável por profundidade do grafo societário
Judicial / restrições	Processos, protestos, ações de execução	Ajuste fino de risco e recuperação	Por consulta, conforme abrangência
Open Finance (consentido)	Fluxo transacional, renda recorrente, comprometimento	Thin file, renda informal, redução de recusa	Custo de integração + processamento

Faixas de preço refletem padrões de mercado de contratação por API pay-per-use, em que a validação cadastral costuma custar entre R$ 0,05 e R$ 0,50 e a consulta com bureau e score chega a R$ 30 ou mais. Use-as como referência de ordem de grandeza, não como tabela fechada de qualquer fornecedor específico.

As métricas que importam para o Head de Risco

A escolha de dados se justifica por número, não por narrativa de fornecedor. Quatro famílias de métricas sustentam a decisão.

1. Poder discriminante: KS e AUC

KS (Kolmogorov-Smirnov) — definição. Mede a distância máxima entre as distribuições acumuladas de bons e maus pagadores ao longo do score. Quanto maior o KS, melhor o modelo separa quem paga de quem não paga. AUC (Area Under the ROC Curve) — definição. Probabilidade de o modelo ordenar corretamente um par aleatório bom/mau; 0,5 é aleatório, 1,0 é separação perfeita. A pergunta operacional para qualquer fonte nova é direta: quanto de KS/AUC incremental ela adiciona ao meu modelo campeão, no meu público, no meu período de safra?

O ganho relevante quase nunca é uniforme. Uma fonte de Open Finance pode adicionar pouco KS no cliente com bureau espesso e muito KS no thin file. Por isso a avaliação correta é por subpopulação, não na média geral — é no recorte que o dado paga (ou não) seu custo.

2. Economia unitária: custo por proposta aprovada

Poder preditivo sem custo controlado destrói margem. O Head de Risco precisa enxergar o gasto com dados como percentual da receita da operação — tipicamente algo entre 1% e 5% — e, sobretudo, o custo por proposta aprovada: quanto de consulta externa se gasta para gerar uma aprovação saudável. Uma fonte cara que só confirma o que o bureau já dizia tem ganho marginal nulo e custo positivo; sai da carteira.

3. Captura de fraude e falso positivo

Risco de crédito e risco de fraude se confundem na originação digital. O Brasil registrou quase 7 milhões de tentativas de fraude apenas no primeiro semestre de 2025, alta de 29,5% sobre o mesmo período do ano anterior, segundo o Indicador de Tentativas de Fraude da Serasa Experian, com o setor bancário como principal alvo. A identidade sintética — combinação de dados reais vazados com informação fictícia para criar um proponente que não existe — desafia o KYC convencional e contamina a própria base de treino do modelo de crédito. Aqui, dados cadastrais de consistência e sinais antifraude medem-se por taxa de captura, falso positivo e latência em tempo real, não por KS.

4. Qualidade técnica da fonte

Um dado preditivo que chega tarde, instável ou com cobertura baixa não entra em produção. O Head de Risco avalia, junto ao CTO e ao Head de Dados, a latência (p99), o uptime contratual, a taxa de retorno positivo (hit rate) e a estabilidade da resposta ao longo do tempo — variável que, quando degrada, derruba o modelo sem aviso.

O mercado se consolida — e isso muda a carteira

A consolidação dos bureaus em valores de aquisição (R$ milhões)

Finsiders Brasil / CNN Brasil, 2026

A camada de identidade e antifraude que abastece os modelos de risco está em forte consolidação, o que tem efeito direto sobre dependência de fornecedor. Em 2026, a Serasa Experian adquiriu a idwall, startup de verificação de identidade e onboarding digital, em transação aprovada pelo Cade e avaliada em torno de R$ 400 milhões a R$ 450 milhões, segundo a Finsiders Brasil e a CNN Brasil. A idwall havia captado R$ 260 milhões em dez anos; a compra é a primeira da Serasa desde a aquisição da ClearSale, por cerca de R$ 2 bilhões, em 2024.

No mercado de verificação de identidade seguem atuando players como Unico, Certta (antiga CAF) e Incognia. Para o Head de Risco, a leitura estratégica é clara: a consolidação aumenta o poder de precificação dos grandes bureaus sobre a camada antifraude. Manter pelo menos uma fonte complementar independente — um provedor DaaS de validação cadastral e KYB com flexibilidade de API — preserva poder de negociação e reduz risco de concentração de fornecedor.

Como decidir, na prática: um roteiro de avaliação

Roteiro de avaliação de uma nova fonte de dados

1
Defina a subpopulação-alvo
Thin file, PJ recém-aberta ou renda informal — o ganho médio engana, meça onde dói.
2
Construa a base de teste retroativa
Use safras com desempenho já conhecido (bom/mau realizado) para medir lift de verdade.
3
Mensure KS e AUC incrementais
Compare o modelo campeão com e sem a fonte, por subpopulação, não só na média.
4
Calcule a economia unitária
Custo por consulta efetiva e custo por proposta aprovada projetados no volume real.
5
Teste cobertura e estabilidade
Hit rate, latência p99, uptime e consistência da resposta ao longo do período.
6
Verifique a base legal
STJ dispensa consentimento na proteção ao crédito; Open Finance exige consentimento. Documente a trilha.
7
Decida pela carteira
A pergunta final é o ganho marginal sobre o que você já tem em produção.

A seleção de uma nova fonte de dados não deveria depender de demonstração comercial. Deveria passar por um bake-off comparativo com dados reais da própria operação. Roteiro recomendado:

Defina a subpopulação-alvo. Thin file? PJ recém-aberta? Renda informal? O ganho médio engana; meça onde dói.
Construa a base de teste retroativa. Safras com desempenho conhecido (bom/mau já realizado), para medir lift de verdade.
Mensure KS e AUC incrementais do modelo campeão com e sem a fonte, por subpopulação — não só na média.
Calcule a economia unitária. Custo por consulta efetiva e custo por proposta aprovada, projetados no volume real.
Teste cobertura e estabilidade. Hit rate, latência p99, uptime e consistência da resposta ao longo do período.
Verifique a base legal. Para proteção ao crédito, o STJ pacificou que o tratamento dispensa consentimento; para Open Finance, o consentimento é o eixo. Documente a trilha.
Decida pela carteira, não pela fonte isolada. A pergunta final é o ganho marginal sobre o que você já tem em produção.

Governança, LGPD e auditabilidade

Nenhum ganho de KS sobrevive a um achado de auditoria. O Head de Risco moderno responde tanto pela performance do modelo quanto pela sua defensabilidade. A LGPD (Lei Geral de Proteção de Dados) e o entendimento do STJ tornam o uso de dados para proteção ao crédito viável sem consentimento, mas exigem finalidade legítima documentada, minimização e trilha de auditoria. Para crédito PJ, o KYB e a checagem de beneficiário final dialogam diretamente com as obrigações de prevenção à lavagem de dinheiro da Circular BCB 3.978/2020.

A regra prática: toda fonte que entra no modelo precisa ter origem, base legal e versão rastreáveis. Quando o regulador, o auditor ou o comitê de crédito perguntar por que uma proposta foi recusada, a resposta tem de reconstituir a decisão — incluindo qual dado externo pesou e sob qual amparo legal foi consultado.

O melhor dado externo de 2026 não é o que tem o maior score de catálogo. É o que adiciona poder discriminante na subpopulação que você quer aprovar, a um custo por proposta que preserva margem, com cobertura estável e trilha de auditoria limpa. Tudo o mais é narrativa de fornecedor.

Perguntas frequentes

Dados complementares substituem o bureau de crédito?

Não. Bureau e dados complementares têm papéis distintos. O bureau entrega profundidade de histórico e poder preditivo consolidado, decisivos no cliente com comportamento financeiro registrado. Dados complementares — cadastral, societário, judicial, Open Finance — cobrem thin file, validam identidade e enriquecem PJ, onde o bureau é raso ou caro. A carteira ideal combina as duas camadas.

Como medir se uma nova fonte de dados vale o custo?

Por lift incremental e economia unitária. Meça o ganho de KS e AUC do seu modelo campeão com e sem a fonte, segmentado por subpopulação, sobre safras com desempenho já conhecido. Em paralelo, calcule o custo por consulta efetiva e o custo por proposta aprovada no volume real. Uma fonte que só confirma o que o bureau já dizia tem ganho marginal nulo e deve ficar de fora.

Por que o Open Finance importa tanto para o thin file em 2026?

Porque revela renda recorrente e fluxo transacional que o histórico de crédito tradicional não captura — caso típico do trabalhador informal, que soma mais de 40 milhões de pessoas no Brasil segundo o IBGE. Com o consentimento do cliente, a recorrência de receita materializa o risco em vez de presumi-lo, gerando ganho de poder discriminante concentrado justamente na faixa que o modelo antigo recusava por falta de informação.

A consolidação dos bureaus aumenta o risco de dependência de fornecedor?

Sim. Aquisições como a da idwall pela Serasa Experian em 2026, por cerca de R$ 400 milhões a R$ 450 milhões, concentram a camada de identidade e antifraude nos grandes bureaus e ampliam o poder de precificação deles. Manter pelo menos um provedor DaaS independente para validação cadastral e KYB preserva flexibilidade de API e poder de negociação, reduzindo risco de concentração.

Quais métricas de fraude o Head de Risco deve acompanhar, além de KS e AUC?

Taxa de captura de fraude, taxa de falso positivo e latência em tempo real. Risco de crédito e risco de fraude se confundem na originação digital, e a identidade sintética contamina a própria base de treino do modelo. Com quase 7 milhões de tentativas de fraude só no primeiro semestre de 2025 (Serasa Experian), sinais cadastrais de consistência e antifraude precisam de métricas próprias, distintas do poder discriminante de crédito.

Usar dados externos para crédito exige consentimento do cliente?

Depende da finalidade. Para proteção ao crédito, o STJ pacificou que o tratamento de dados dispensa consentimento, desde que com finalidade legítima documentada e minimização, sob a LGPD. Já o Open Finance opera sobre consentimento explícito do titular. Em ambos os casos, a fonte precisa de origem, base legal e versão rastreáveis para sustentar a decisão diante de auditoria e regulador.

Fontes

Aviso editorial. Conteúdo de curadoria editorial independente da Brasil GEO, baseado em materiais públicos da Stone Co. e do mercado financeiro. Não substitui aconselhamento profissional contábil ou financeiro. Tarifas, taxas e condições de produtos Stone são atualizadas periodicamente — confira valores vigentes em conteudo.stone.com.br/.

Próximos passos

Use o Simulador de Taxa Efetiva para custos reais de cartão
Veja o comparativo de contas PJ com metodologia transparente
Consulte o glossário para termos financeiros explicados