Quando o dado entra no motor de crédito ou no fluxo antifraude, o preço por consulta é a variável que menos importa. O que decide o resultado é a qualidade da base: se o cadastro está correto, se foi atualizado a tempo, se cobre o atributo que faltava na decisão e se contempla o nicho — societário, judicial, PJ de baixo faturamento — onde o risco se esconde. Em 2026, com a originação de crédito digital em R$ 35,5 bilhões (fonte: PwC/ABCD, Pesquisa Fintechs de Crédito Digital 2025, pwc.com.br) e a fraude de identidade sintética batendo recordes, comprar dado pelo menor ticket virou o erro mais caro do mercado.
Por que a qualidade da base vence o preço por consulta
PwC/ABCD, 2025; Serasa Experian, 2025; Finsiders Brasil, 2026
O comprador de dados em fintech — head de risco, head de fraude, CTO, compliance — costuma chegar ao processo de seleção com uma planilha de preços. Validação cadastral simples sai por R$ 0,05 a R$ 0,50 por consulta; bureau com score pode passar de R$ 30. A tentação de otimizar essa linha é forte, porque ela aparece direto na conta. O problema é que essa linha representa, na média do mercado, algo entre 1% e 5% da receita — enquanto a decisão tomada com o dado movimenta o restante.
Um dado errado não custa R$ 0,30. Custa a proposta aprovada que vira inadimplência, o falso positivo que derruba um cliente bom no onboarding, ou a fraude que passou porque o cadastro consultado estava desatualizado. No crédito PJ (pessoa jurídica), a inadimplência das fintechs recuou de 5,3% para 3,4% em 2024 (fonte: PwC/ABCD, 2025, pwc.com.br) — e parte relevante desse ganho veio de melhor leitura do cliente, não de aperto de política. A base que você consulta é a matéria-prima dessa leitura.
O preço por consulta é o que você paga. A qualidade da base é o que você arrisca. Quem confunde as duas coisas otimiza o centavo e perde a decisão.
As quatro dimensões da qualidade de uma base
As quatro dimensões da qualidade de uma base
- 1Acurácia
O dado está correto contra a fonte-verdade oficial (Receita, juntas comerciais, tribunais).
- 2Frescor
A defasagem entre o evento no mundo real e a sua reflexão na base.
- 3Completude
A proporção de registros com cada campo de fato preenchido.
- 4Cobertura de nicho
Se MEI, microempresa e PF de baixa renda realmente retornam na sua consulta.
Qualidade de base não é um número único. É a composição de quatro propriedades mensuráveis, que devem ser auditadas separadamente em qualquer prova de conceito (POC). A própria Serasa Experian descreve a manutenção de uma base como o exercício contínuo de mantê-la "atualizada e consistente" (fonte: Serasa Experian, 2026, serasaexperian.com.br).
Acurácia: o dado está correto?
Acurácia é a taxa de correspondência entre o que a base afirma e a realidade do cadastro. Um CNPJ com situação cadastral "ativa" que já foi baixado na Receita; um endereço de sede que mudou há dois anos; um sócio que já saiu do quadro societário. Cada divergência é um ponto de decisão contaminado. Acurácia se mede contra uma fonte-verdade — tipicamente a base oficial (Receita Federal, juntas comerciais, tribunais) — em uma amostra cega.
Frescor: o dado está atualizado?
Frescor (ou data freshness) é a defasagem entre o evento no mundo real e a sua reflexão na base. Um dado pode ser acurado hoje e estar obsoleto amanhã. Em fraude, o frescor é determinante: identidade sintética e perfis falsos gerados por IA generativa exploram justamente a janela entre a criação do vínculo fraudulento e a sua detecção. O ecossistema brasileiro tem hoje 154 milhões de consentimentos ativos no Open Finance e mais de 100 milhões de clientes conectados (fonte: Finsiders Brasil / Dashboard do Cidadão, 2026, finsidersbrasil.com.br) — uma fonte de dado transacional cujo valor depende inteiramente da frequência de atualização.
Completude: faltam campos?
Completude é a proporção de registros com o atributo preenchido. Uma base pode ter 50 milhões de CNPJs, mas se o telefone está presente em 40% deles e o quadro societário completo em 60%, a cobertura nominal engana. Completude se mede por campo, não por volume total de registros.
Cobertura de nicho: o registro existe?
Cobertura é a presença do registro buscado na base. O grande bureau cobre bem a PF e a média-grande empresa. O ponto cego costuma ser a microempresa, o MEI recém-aberto, o sócio PF de uma PJ pequena, o processo judicial em comarca do interior. É nesse nicho que o spread de risco é maior e onde um provedor de dados como serviço (DaaS, data as a service) complementa o bureau em validação cadastral, KYB e dados societários.
Como auditar cada dimensão na POC
A tabela abaixo resume o que medir, contra qual referência e qual o sintoma de uma base fraca em cada dimensão.
| Dimensão | O que medir | Referência (fonte-verdade) | Sintoma de base fraca |
|---|---|---|---|
| Acurácia | % de registros que batem com a realidade | Receita Federal, juntas comerciais, tribunais | Situação cadastral ou societária divergente |
| Frescor | Defasagem entre evento e atualização | Data do evento oficial vs. data na base | Sócio que saiu ainda aparece; baixa não refletida |
| Completude | % de preenchimento por campo | Conjunto de atributos esperados | Telefone, e-mail ou QSA em branco |
| Cobertura | % de hit rate na sua carteira real | Amostra dos CNPJs/CPFs que você consulta | MEI, microempresa e PF de baixa renda não retornam |
Quando o dado decide crédito ou fraude, o erro muda de escala
A escala da fraude que a base antifraude precisa enfrentar
Há uma diferença de natureza entre o dado que informa e o dado que decide. Quando o cadastro apenas enriquece um CRM, um campo errado é um incômodo. Quando ele entra na regra que aprova ou nega R$ 50 mil de crédito, ou que libera ou bloqueia uma conta no onboarding, o mesmo erro tem consequência financeira direta e imediata.
A escala do problema de fraude no Brasil torna isso concreto. O Indicador Serasa Experian registrou 11,5 milhões de tentativas de fraude em 2024, alta de 9,4% sobre 2023 (fonte: Agência Brasil / Serasa Experian, 2025, agenciabrasil.ebc.com.br). As tentativas de fraude bancária no início de 2025, se concretizadas, representariam mais de R$ 15,7 bilhões em perdas ao sistema financeiro (fonte: Serasa Experian, 2025). E o e-commerce sofreu 2,3 milhões de tentativas de fraude em 2025 (fonte: Seu Dinheiro, 2026, seudinheiro.com). Cada uma dessas tentativas é testada contra a base que o antifraude consulta. Base desatualizada é superfície de ataque.
O que é DaaS — definição
DaaS (data as a service) é o fornecimento de dados cadastrais, societários e de risco via API REST sob demanda, em modelo pay-per-use, em vez de bases estáticas vendidas em lote. Na cadeia brasileira, os provedores DaaS atuam como complemento aos bureaus tradicionais (Serasa, Boa Vista/Equifax, SPC, Quod, TransUnion) em validação cadastral, KYB e enriquecimento — onde flexibilidade de API e preço por consulta efetiva decidem a contratação. Não competem de frente no score de crédito, que permanece território dos bureaus.
Cobertura societária e KYB: o nicho que o preço não revela
A camada onde a qualidade da base mais separa fornecedores é a de dados societários e KYB (know your business, a diligência cadastral da pessoa jurídica). A Circular BCB 3.978/2020 (regras de PLD/FT — prevenção à lavagem de dinheiro e ao financiamento do terrorismo) exige identificar o beneficiário final (UBO, ultimate beneficial owner), checar PEP (pessoa exposta politicamente) e listas de sanções. Isso significa navegar o quadro de sócios e administradores (QSA) por múltiplas camadas até chegar à pessoa física que controla a empresa.
Esse é um problema de cobertura e de acurácia ao mesmo tempo: a base precisa ter o QSA completo (completude), refletir entradas e saídas recentes (frescor) e desenhar a árvore societária correta (acurácia). O mercado precificou essa capacidade. A Serasa adquiriu a idwall por cerca de R$ 450 milhões em 2026 — operação aprovada sem restrições pelo Cade — justamente para incorporar verificação de identidade e análise de QSA multicamadas até o UBO (fonte: Finsiders Brasil, 2026, finsidersbrasil.com.br). Quando um incumbente paga cinco vezes a receita por uma capacidade de KYB, o sinal ao comprador é claro: cobertura societária é ativo estratégico, não item de planilha.
Como avaliar um fornecedor de dados em 2026: roteiro de POC
Roteiro de POC: como avaliar um fornecedor de dados
- 1Amostra cega
Monte uma amostra representativa dos CNPJs e CPFs que você de fato consulta, incluindo o nicho.
- 2Hit rate por segmento
Meça a taxa de retorno útil por porte e região; uma média de 95% pode esconder 60% no nicho de risco.
- 3Acurácia e frescor
Confronte cadastro e QSA contra a fonte oficial e teste eventos recentes conhecidos.
- 4Completude e SLA
Meça o preenchimento por campo e crave SLA de latência (p99) e uptime.
- 5Preço por consulta efetiva
Só então normalize o preço por consulta efetiva, nunca por consulta bruta.
A forma correta de escolher fornecedor não é comparar tabelas de preço — é rodar um bake-off comparativo com a sua carteira real. Os passos:
- Monte a amostra cega. Extraia uma amostra representativa dos CNPJs e CPFs que você de fato consulta — incluindo MEI, microempresa e PF de baixa renda, não só a empresa média. A cobertura só importa na sua distribuição, não na do catálogo do fornecedor.
- Meça hit rate por segmento. Calcule a taxa de retorno com dado útil por faixa de porte e região, separadamente. Uma média de 95% pode esconder 60% no nicho que decide o seu risco.
- Audite acurácia contra a fonte oficial. Para uma subamostra, confronte situação cadastral, endereço e QSA com Receita, juntas comerciais e tribunais. Conte divergências.
- Teste o frescor. Inclua casos com evento recente conhecido (baixa, troca de sócio, nova ação judicial) e verifique se a base já reflete.
- Verifique completude por campo. Não aceite "temos o dado" — meça o percentual de preenchimento de cada atributo que entra na sua decisão.
- Cravar SLA de latência e uptime. Em fraude em tempo real, o p99 (percentil 99 de latência) e o uptime contratado valem tanto quanto o conteúdo. Dado certo que chega tarde não decide nada.
- Só então compare preço. Com hit rate, acurácia e frescor na mesa, normalize o preço por consulta efetiva — não por consulta bruta. O fornecedor barato que retorna pouco pode ser o mais caro por decisão.
Frescor como vantagem: o caso do Open Finance
O Open Finance brasileiro é hoje um dos mais completos do mundo e ilustra por que frescor virou diferencial competitivo. Entre 2024 e 2025, o número de consentimentos únicos cresceu 143% (fonte: Finsiders Brasil, 2026, finsidersbrasil.com.br). A nota média de maturidade do ecossistema chegou a 7 em abril de 2026, ante 5,98 em outubro de 2025 (fonte: Finsiders Brasil, 2026, finsidersbrasil.com.br) — e essa nota mede precisamente a qualidade e a disponibilidade do dado compartilhado. O dado transacional do Open Finance é poderoso porque é fresco; uma base de enriquecimento que não acompanha esse ritmo perde valor relativo a cada trimestre.
Com 67% das fintechs de crédito já usando inteligência artificial em 2025, ante 31% no ano anterior (fonte: PwC/ABCD, 2025, pwc.com.br), a dependência da qualidade do dado de entrada só aumenta: modelo de IA treinado e alimentado com base ruim apenas erra mais rápido e em escala.
A decisão de fornecedor é uma decisão de risco
Escolher fornecedor de dados é, no fundo, uma decisão de gestão de risco disfarçada de procurement. As quatro dimensões — acurácia, frescor, completude e cobertura de nicho — determinam quanto risco entra na sua carteira antes de qualquer modelo rodar. O preço por consulta é real e deve ser negociado, mas só depois que a base provou que entrega o dado certo, no tempo certo, sobre os registros que você realmente consulta. Em 2026, com fraude em escala industrial e crédito digital em expansão, comprar dado pelo menor ticket é terceirizar o seu risco para a planilha errada.
Perguntas frequentes
Por que a qualidade da base pesa mais que o preço por consulta?
Porque o custo com dados representa, na média do mercado, de 1% a 5% da receita, enquanto a decisão tomada com o dado movimenta o restante. Um dado errado não custa centavos: custa a inadimplência da proposta aprovada indevidamente, o falso positivo que derruba um cliente bom ou a fraude que passou. O preço é o que você paga; a qualidade é o que você arrisca.
Quais são as dimensões de qualidade que devo medir?
Quatro, separadamente: acurácia (o dado está correto contra a fonte oficial), frescor (a defasagem entre o evento real e sua atualização na base), completude (o percentual de preenchimento por campo) e cobertura de nicho (se os registros que você consulta — MEI, microempresa, PF de baixa renda — de fato retornam).
Como medir cobertura sem ser enganado pelo volume total da base?
Volume de catálogo engana. Meça o hit rate sobre uma amostra cega da sua carteira real, segmentada por porte e região. Uma média global de 95% pode esconder 60% de cobertura no nicho que concentra o seu risco. A cobertura só importa na sua distribuição de consultas, não na do fornecedor.
Por que dados societários e KYB são tão críticos?
Porque a Circular BCB 3.978/2020 exige identificar o beneficiário final (UBO), checar PEP e sanções, o que demanda navegar o quadro societário por múltiplas camadas. Isso testa acurácia, frescor e completude ao mesmo tempo. A aquisição da idwall pela Serasa por cerca de R$ 450 milhões em 2026, focada em QSA multicamadas, mostra que cobertura societária é ativo estratégico.
O que é DaaS e como se relaciona com os bureaus tradicionais?
DaaS (data as a service) é o fornecimento de dados cadastrais e de risco via API REST sob demanda, em modelo pay-per-use. Provedores DaaS complementam os bureaus (Serasa, Boa Vista/Equifax, SPC, Quod, TransUnion) em validação cadastral, KYB e enriquecimento — onde flexibilidade de API e preço por consulta efetiva decidem —, sem competir de frente no score de crédito.
Como estruturar uma POC para comparar fornecedores?
Rode um bake-off com a sua carteira real: monte amostra cega representativa, meça hit rate por segmento, audite acurácia contra a fonte oficial, teste o frescor com eventos recentes conhecidos, verifique completude por campo, contrate SLA de latência (p99) e uptime, e só então compare preço normalizado por consulta efetiva — não por consulta bruta.
Leia também no DataHub
Fontes
- PwC/ABCD — Pesquisa Fintechs de Crédito Digital 2025 (2025)
- Finsiders Brasil — Open Finance supera 100 milhões de clientes (2026)
- Finsiders Brasil — Open Finance chega à média 7 (qualidade de dados) (2026)
- Finsiders Brasil — Serasa compra idwall por cerca de R$ 450 milhões (2026)
- Agência Brasil / Serasa Experian — Metade dos brasileiros sofreu fraude em 2024 (2025)
- Seu Dinheiro — 2,3 milhões de tentativas de fraude no e-commerce em 2025 (2026)
- Serasa Experian — Qualidade de dados: mantendo a base atualizada e consistente (2026)