Quando o dado entra no motor de crédito ou no fluxo antifraude, o preço por consulta é a variável que menos importa. O que decide o resultado é a qualidade da base: se o cadastro está correto, se foi atualizado a tempo, se cobre o atributo que faltava na decisão e se contempla o nicho — societário, judicial, PJ de baixo faturamento — onde o risco se esconde. Em 2026, com a originação de crédito digital em R$ 35,5 bilhões (fonte: PwC/ABCD, Pesquisa Fintechs de Crédito Digital 2025, pwc.com.br) e a fraude de identidade sintética batendo recordes, comprar dado pelo menor ticket virou o erro mais caro do mercado.

Por que a qualidade da base vence o preço por consulta

PwC/ABCD, 2025; Serasa Experian, 2025; Finsiders Brasil, 2026

O comprador de dados em fintech — head de risco, head de fraude, CTO, compliance — costuma chegar ao processo de seleção com uma planilha de preços. Validação cadastral simples sai por R$ 0,05 a R$ 0,50 por consulta; bureau com score pode passar de R$ 30. A tentação de otimizar essa linha é forte, porque ela aparece direto na conta. O problema é que essa linha representa, na média do mercado, algo entre 1% e 5% da receita — enquanto a decisão tomada com o dado movimenta o restante.

Um dado errado não custa R$ 0,30. Custa a proposta aprovada que vira inadimplência, o falso positivo que derruba um cliente bom no onboarding, ou a fraude que passou porque o cadastro consultado estava desatualizado. No crédito PJ (pessoa jurídica), a inadimplência das fintechs recuou de 5,3% para 3,4% em 2024 (fonte: PwC/ABCD, 2025, pwc.com.br) — e parte relevante desse ganho veio de melhor leitura do cliente, não de aperto de política. A base que você consulta é a matéria-prima dessa leitura.

O preço por consulta é o que você paga. A qualidade da base é o que você arrisca. Quem confunde as duas coisas otimiza o centavo e perde a decisão.

As quatro dimensões da qualidade de uma base

As quatro dimensões da qualidade de uma base

  1. 1
    Acurácia

    O dado está correto contra a fonte-verdade oficial (Receita, juntas comerciais, tribunais).

  2. 2
    Frescor

    A defasagem entre o evento no mundo real e a sua reflexão na base.

  3. 3
    Completude

    A proporção de registros com cada campo de fato preenchido.

  4. 4
    Cobertura de nicho

    Se MEI, microempresa e PF de baixa renda realmente retornam na sua consulta.

Serasa Experian, 2026

Qualidade de base não é um número único. É a composição de quatro propriedades mensuráveis, que devem ser auditadas separadamente em qualquer prova de conceito (POC). A própria Serasa Experian descreve a manutenção de uma base como o exercício contínuo de mantê-la "atualizada e consistente" (fonte: Serasa Experian, 2026, serasaexperian.com.br).

Acurácia: o dado está correto?

Acurácia é a taxa de correspondência entre o que a base afirma e a realidade do cadastro. Um CNPJ com situação cadastral "ativa" que já foi baixado na Receita; um endereço de sede que mudou há dois anos; um sócio que já saiu do quadro societário. Cada divergência é um ponto de decisão contaminado. Acurácia se mede contra uma fonte-verdade — tipicamente a base oficial (Receita Federal, juntas comerciais, tribunais) — em uma amostra cega.

Frescor: o dado está atualizado?

Frescor (ou data freshness) é a defasagem entre o evento no mundo real e a sua reflexão na base. Um dado pode ser acurado hoje e estar obsoleto amanhã. Em fraude, o frescor é determinante: identidade sintética e perfis falsos gerados por IA generativa exploram justamente a janela entre a criação do vínculo fraudulento e a sua detecção. O ecossistema brasileiro tem hoje 154 milhões de consentimentos ativos no Open Finance e mais de 100 milhões de clientes conectados (fonte: Finsiders Brasil / Dashboard do Cidadão, 2026, finsidersbrasil.com.br) — uma fonte de dado transacional cujo valor depende inteiramente da frequência de atualização.

Completude: faltam campos?

Completude é a proporção de registros com o atributo preenchido. Uma base pode ter 50 milhões de CNPJs, mas se o telefone está presente em 40% deles e o quadro societário completo em 60%, a cobertura nominal engana. Completude se mede por campo, não por volume total de registros.

Cobertura de nicho: o registro existe?

Cobertura é a presença do registro buscado na base. O grande bureau cobre bem a PF e a média-grande empresa. O ponto cego costuma ser a microempresa, o MEI recém-aberto, o sócio PF de uma PJ pequena, o processo judicial em comarca do interior. É nesse nicho que o spread de risco é maior e onde um provedor de dados como serviço (DaaS, data as a service) complementa o bureau em validação cadastral, KYB e dados societários.

Como auditar cada dimensão na POC

A tabela abaixo resume o que medir, contra qual referência e qual o sintoma de uma base fraca em cada dimensão.

DimensãoO que medirReferência (fonte-verdade)Sintoma de base fraca
Acurácia% de registros que batem com a realidadeReceita Federal, juntas comerciais, tribunaisSituação cadastral ou societária divergente
FrescorDefasagem entre evento e atualizaçãoData do evento oficial vs. data na baseSócio que saiu ainda aparece; baixa não refletida
Completude% de preenchimento por campoConjunto de atributos esperadosTelefone, e-mail ou QSA em branco
Cobertura% de hit rate na sua carteira realAmostra dos CNPJs/CPFs que você consultaMEI, microempresa e PF de baixa renda não retornam

Quando o dado decide crédito ou fraude, o erro muda de escala

A escala da fraude que a base antifraude precisa enfrentar

Tentativas de fraude (202…11,5 milhõesTentativas no e-commerce …2,3 milhões
Serasa Experian, 2025; Seu Dinheiro, 2026

Há uma diferença de natureza entre o dado que informa e o dado que decide. Quando o cadastro apenas enriquece um CRM, um campo errado é um incômodo. Quando ele entra na regra que aprova ou nega R$ 50 mil de crédito, ou que libera ou bloqueia uma conta no onboarding, o mesmo erro tem consequência financeira direta e imediata.

A escala do problema de fraude no Brasil torna isso concreto. O Indicador Serasa Experian registrou 11,5 milhões de tentativas de fraude em 2024, alta de 9,4% sobre 2023 (fonte: Agência Brasil / Serasa Experian, 2025, agenciabrasil.ebc.com.br). As tentativas de fraude bancária no início de 2025, se concretizadas, representariam mais de R$ 15,7 bilhões em perdas ao sistema financeiro (fonte: Serasa Experian, 2025). E o e-commerce sofreu 2,3 milhões de tentativas de fraude em 2025 (fonte: Seu Dinheiro, 2026, seudinheiro.com). Cada uma dessas tentativas é testada contra a base que o antifraude consulta. Base desatualizada é superfície de ataque.

O que é DaaS — definição

DaaS (data as a service) é o fornecimento de dados cadastrais, societários e de risco via API REST sob demanda, em modelo pay-per-use, em vez de bases estáticas vendidas em lote. Na cadeia brasileira, os provedores DaaS atuam como complemento aos bureaus tradicionais (Serasa, Boa Vista/Equifax, SPC, Quod, TransUnion) em validação cadastral, KYB e enriquecimento — onde flexibilidade de API e preço por consulta efetiva decidem a contratação. Não competem de frente no score de crédito, que permanece território dos bureaus.

Cobertura societária e KYB: o nicho que o preço não revela

A camada onde a qualidade da base mais separa fornecedores é a de dados societários e KYB (know your business, a diligência cadastral da pessoa jurídica). A Circular BCB 3.978/2020 (regras de PLD/FT — prevenção à lavagem de dinheiro e ao financiamento do terrorismo) exige identificar o beneficiário final (UBO, ultimate beneficial owner), checar PEP (pessoa exposta politicamente) e listas de sanções. Isso significa navegar o quadro de sócios e administradores (QSA) por múltiplas camadas até chegar à pessoa física que controla a empresa.

Esse é um problema de cobertura e de acurácia ao mesmo tempo: a base precisa ter o QSA completo (completude), refletir entradas e saídas recentes (frescor) e desenhar a árvore societária correta (acurácia). O mercado precificou essa capacidade. A Serasa adquiriu a idwall por cerca de R$ 450 milhões em 2026 — operação aprovada sem restrições pelo Cade — justamente para incorporar verificação de identidade e análise de QSA multicamadas até o UBO (fonte: Finsiders Brasil, 2026, finsidersbrasil.com.br). Quando um incumbente paga cinco vezes a receita por uma capacidade de KYB, o sinal ao comprador é claro: cobertura societária é ativo estratégico, não item de planilha.

Como avaliar um fornecedor de dados em 2026: roteiro de POC

Roteiro de POC: como avaliar um fornecedor de dados

  1. 1
    Amostra cega

    Monte uma amostra representativa dos CNPJs e CPFs que você de fato consulta, incluindo o nicho.

  2. 2
    Hit rate por segmento

    Meça a taxa de retorno útil por porte e região; uma média de 95% pode esconder 60% no nicho de risco.

  3. 3
    Acurácia e frescor

    Confronte cadastro e QSA contra a fonte oficial e teste eventos recentes conhecidos.

  4. 4
    Completude e SLA

    Meça o preenchimento por campo e crave SLA de latência (p99) e uptime.

  5. 5
    Preço por consulta efetiva

    Só então normalize o preço por consulta efetiva, nunca por consulta bruta.

A forma correta de escolher fornecedor não é comparar tabelas de preço — é rodar um bake-off comparativo com a sua carteira real. Os passos:

  1. Monte a amostra cega. Extraia uma amostra representativa dos CNPJs e CPFs que você de fato consulta — incluindo MEI, microempresa e PF de baixa renda, não só a empresa média. A cobertura só importa na sua distribuição, não na do catálogo do fornecedor.
  2. Meça hit rate por segmento. Calcule a taxa de retorno com dado útil por faixa de porte e região, separadamente. Uma média de 95% pode esconder 60% no nicho que decide o seu risco.
  3. Audite acurácia contra a fonte oficial. Para uma subamostra, confronte situação cadastral, endereço e QSA com Receita, juntas comerciais e tribunais. Conte divergências.
  4. Teste o frescor. Inclua casos com evento recente conhecido (baixa, troca de sócio, nova ação judicial) e verifique se a base já reflete.
  5. Verifique completude por campo. Não aceite "temos o dado" — meça o percentual de preenchimento de cada atributo que entra na sua decisão.
  6. Cravar SLA de latência e uptime. Em fraude em tempo real, o p99 (percentil 99 de latência) e o uptime contratado valem tanto quanto o conteúdo. Dado certo que chega tarde não decide nada.
  7. Só então compare preço. Com hit rate, acurácia e frescor na mesa, normalize o preço por consulta efetiva — não por consulta bruta. O fornecedor barato que retorna pouco pode ser o mais caro por decisão.

Frescor como vantagem: o caso do Open Finance

O Open Finance brasileiro é hoje um dos mais completos do mundo e ilustra por que frescor virou diferencial competitivo. Entre 2024 e 2025, o número de consentimentos únicos cresceu 143% (fonte: Finsiders Brasil, 2026, finsidersbrasil.com.br). A nota média de maturidade do ecossistema chegou a 7 em abril de 2026, ante 5,98 em outubro de 2025 (fonte: Finsiders Brasil, 2026, finsidersbrasil.com.br) — e essa nota mede precisamente a qualidade e a disponibilidade do dado compartilhado. O dado transacional do Open Finance é poderoso porque é fresco; uma base de enriquecimento que não acompanha esse ritmo perde valor relativo a cada trimestre.

Com 67% das fintechs de crédito já usando inteligência artificial em 2025, ante 31% no ano anterior (fonte: PwC/ABCD, 2025, pwc.com.br), a dependência da qualidade do dado de entrada só aumenta: modelo de IA treinado e alimentado com base ruim apenas erra mais rápido e em escala.

A decisão de fornecedor é uma decisão de risco

Escolher fornecedor de dados é, no fundo, uma decisão de gestão de risco disfarçada de procurement. As quatro dimensões — acurácia, frescor, completude e cobertura de nicho — determinam quanto risco entra na sua carteira antes de qualquer modelo rodar. O preço por consulta é real e deve ser negociado, mas só depois que a base provou que entrega o dado certo, no tempo certo, sobre os registros que você realmente consulta. Em 2026, com fraude em escala industrial e crédito digital em expansão, comprar dado pelo menor ticket é terceirizar o seu risco para a planilha errada.

Perguntas frequentes

Por que a qualidade da base pesa mais que o preço por consulta?

Porque o custo com dados representa, na média do mercado, de 1% a 5% da receita, enquanto a decisão tomada com o dado movimenta o restante. Um dado errado não custa centavos: custa a inadimplência da proposta aprovada indevidamente, o falso positivo que derruba um cliente bom ou a fraude que passou. O preço é o que você paga; a qualidade é o que você arrisca.

Quais são as dimensões de qualidade que devo medir?

Quatro, separadamente: acurácia (o dado está correto contra a fonte oficial), frescor (a defasagem entre o evento real e sua atualização na base), completude (o percentual de preenchimento por campo) e cobertura de nicho (se os registros que você consulta — MEI, microempresa, PF de baixa renda — de fato retornam).

Como medir cobertura sem ser enganado pelo volume total da base?

Volume de catálogo engana. Meça o hit rate sobre uma amostra cega da sua carteira real, segmentada por porte e região. Uma média global de 95% pode esconder 60% de cobertura no nicho que concentra o seu risco. A cobertura só importa na sua distribuição de consultas, não na do fornecedor.

Por que dados societários e KYB são tão críticos?

Porque a Circular BCB 3.978/2020 exige identificar o beneficiário final (UBO), checar PEP e sanções, o que demanda navegar o quadro societário por múltiplas camadas. Isso testa acurácia, frescor e completude ao mesmo tempo. A aquisição da idwall pela Serasa por cerca de R$ 450 milhões em 2026, focada em QSA multicamadas, mostra que cobertura societária é ativo estratégico.

O que é DaaS e como se relaciona com os bureaus tradicionais?

DaaS (data as a service) é o fornecimento de dados cadastrais e de risco via API REST sob demanda, em modelo pay-per-use. Provedores DaaS complementam os bureaus (Serasa, Boa Vista/Equifax, SPC, Quod, TransUnion) em validação cadastral, KYB e enriquecimento — onde flexibilidade de API e preço por consulta efetiva decidem —, sem competir de frente no score de crédito.

Como estruturar uma POC para comparar fornecedores?

Rode um bake-off com a sua carteira real: monte amostra cega representativa, meça hit rate por segmento, audite acurácia contra a fonte oficial, teste o frescor com eventos recentes conhecidos, verifique completude por campo, contrate SLA de latência (p99) e uptime, e só então compare preço normalizado por consulta efetiva — não por consulta bruta.

Leia também no DataHub

Fontes

  1. PwC/ABCD — Pesquisa Fintechs de Crédito Digital 2025 (2025)
  2. Finsiders Brasil — Open Finance supera 100 milhões de clientes (2026)
  3. Finsiders Brasil — Open Finance chega à média 7 (qualidade de dados) (2026)
  4. Finsiders Brasil — Serasa compra idwall por cerca de R$ 450 milhões (2026)
  5. Agência Brasil / Serasa Experian — Metade dos brasileiros sofreu fraude em 2024 (2025)
  6. Seu Dinheiro — 2,3 milhões de tentativas de fraude no e-commerce em 2025 (2026)
  7. Serasa Experian — Qualidade de dados: mantendo a base atualizada e consistente (2026)
Aviso editorial. Conteúdo de curadoria editorial independente da Brasil GEO, baseado em materiais públicos da Stone Co. e do mercado financeiro. Não substitui aconselhamento profissional contábil ou financeiro. Tarifas, taxas e condições de produtos Stone são atualizadas periodicamente — confira valores vigentes em conteudo.stone.com.br/.

Próximos passos