Nenhuma fintech aprova um crédito, abre uma conta ou libera um pagamento com base em um único fornecedor de dados. Por trás de cada decisão de risco há uma cadeia de fornecimento de dados composta por camadas distintas — bureaus de crédito, IDtechs antifraude, provedores DaaS (Data as a Service), fontes públicas e Open Finance — que se complementam em vez de se substituírem. Entender quem faz o quê, onde cada camada é insubstituível e onde a competição por preço e flexibilidade de API decide a contratação é o que separa um stack de dados caro e redundante de um arranjo eficiente. Este artigo mapeia essa cadeia tal como ela opera em 2026, sob a ótica do comprador de dados em fintech.
Por que pensar em cadeia, e não em fornecedor único
PwC/ABCD, 2025; CISO Advisor, 2026
O comprador de dados em fintech — seja Head de Risco, de Fraude, de Compliance ou CTO — convive com um paradoxo: os dados que decidem aprovar ou negar uma proposta são, ao mesmo tempo, commodity e diferencial. A consulta de CPF é commodity; o enriquecimento societário que revela o beneficiário final de uma PJ é diferencial. Por isso, a arquitetura de dados de uma fintech madura raramente repousa sobre um fornecedor. Ela orquestra fontes em camadas, cada uma com função, latência e preço próprios.
O pano de fundo é uma indústria sob pressão. O Brasil tem cerca de 2.000 fintechs ativas, concentrando 59% do ecossistema da América Latina, segundo levantamentos do setor. O crédito digital originou R$ 35,5 bilhões em 2024, alta de 68% no ano (fonte: PwC/ABCD, 2025, pwc.com.br), atendendo 67,5 milhões de clientes pessoa física. E a fraude cresce mais rápido que a originação: o Banco Central e órgãos de defesa registraram 28 milhões de fraudes envolvendo o Pix de janeiro a setembro de 2025, contra 4,7 milhões em todo o ano anterior (fonte: CISO Advisor, 2026, cisoadvisor.com.br). Quando o ataque escala assim, nenhuma camada isolada de dados dá conta. A cadeia é a resposta.
A pergunta de arquitetura deixou de ser "qual o melhor bureau" e passou a ser "como combino bureau, IDtech, DaaS, fontes públicas e Open Finance de modo que cada consulta paga gere lift real na decisão".
Camada 1 — Bureaus de crédito: o histórico e o score
O que é um bureau de crédito — definição. Um bureau (ou birô) de crédito é uma empresa que reúne, organiza e disponibiliza o histórico de adimplência e inadimplência de pessoas e empresas, transformando esse histórico em consultas, relatórios e modelos de score (pontuação que estima a probabilidade de pagamento). No Brasil, os principais são Serasa Experian, Boa Vista (Equifax), SPC Brasil e Quod — esta última controlada pelos cinco maiores bancos (Banco do Brasil, Bradesco, Caixa, Itaú Unibanco e Santander) e operando desde outubro de 2018 (fonte: Quod, 2026, blog.quod.com.br).
Os bureaus recebem informações de uma rede ampla de fontes: bancos, fintechs, varejistas, concessionárias de água, energia e telecom, empresas de recuperação de crédito, bases públicas e, mais recentemente, dados autorizados via Open Finance. A base legal que sustenta o compartilhamento de adimplência é o Cadastro Positivo (Lei 12.414), e a proteção ao crédito dispensa consentimento específico por entendimento do STJ — um ponto relevante de governança LGPD que o comprador deve documentar.
A força do bureau é o histórico profundo e o score calibrado. Sua fraqueza, do ponto de vista de quem compra, costuma ser preço e flexibilidade: a consulta de bureau com score pode chegar a R$ 30 ou mais por evento, contra R$ 0,05 a R$ 0,50 de uma validação cadastral simples. É justamente esse delta que abre espaço para as demais camadas.
Camada 2 — IDtechs e antifraude: provar que quem está do outro lado é real
O que é uma IDtech — definição. IDtech (de identity technology) é a empresa especializada em verificar identidade e prevenir fraude em tempo real: biometria facial, prova de vida (liveness), leitura e validação de documentos (OCR), onboarding digital e detecção de deepfakes. Enquanto o bureau responde "esse CPF paga as contas?", a IDtech responde "essa pessoa é mesmo quem diz ser, agora, neste dispositivo?".
O mercado brasileiro concentra nomes de peso. A Unico posiciona-se em verificação de identidade por IA e detecção de deepfake. A idwall, fundada em 2016, operava verificação de identidade, gestão de risco e onboarding digital antes de ser adquirida pela Serasa Experian — negócio aprovado sem restrições pelo CADE e avaliado em cerca de R$ 400 milhões, aproximadamente quatro vezes a receita da startup (fonte: Finsiders Brasil, 2026, finsidersbrasil.com.br). A CAF (Combate à Fraude, hoje Certta) e a AllowMe — esta também trazida para dentro da Serasa em 2023 — completam o pelotão. O movimento de consolidação é nítido: bureaus comprando IDtechs para internalizar autenticação e antifraude.
A urgência dessa camada é mensurável. Segundo o Relatório de Identidade e Fraude 2026 da Serasa Experian, as tentativas de fraude com manipulação de vídeo e áudio cresceram 150% no Brasil no último ano (fonte: Serasa Experian, 2026, serasaexperian.com.br). As tentativas de fraude contra jovens de até 25 anos subiram 43% no primeiro semestre de 2025, e mais de 60% dos brasileiros relataram ao menos uma tentativa de fraude no ano. A identidade sintética — combinação de dados reais com informações fictícias para burlar o KYC — é a fronteira de 2026, e o legislador reagiu: a Lei 15.397/2026 criminalizou pela primeira vez o aluguel de contas bancárias ("contas laranja") para movimentação de recursos ilícitos.
Os KPIs que o Head de Fraude cobra
Para quem compra antifraude, três indicadores definem o fornecedor:
- Taxa de captura — proporção de fraudes efetivamente bloqueadas.
- Taxa de falso positivo — quantos clientes legítimos foram barrados (atrito que destrói conversão).
- Latência em tempo real — o p99 da resposta, porque biometria e liveness entram no caminho crítico do onboarding.
Camada 3 — Provedores DaaS: validação cadastral, KYB e enriquecimento
O que é DaaS — definição. DaaS (Data as a Service) é o fornecimento de dados cadastrais e societários sob demanda, via API, com cobrança por consulta. Provedores DaaS — categoria em que se enquadra a Datahub, com cerca de 20 anos de dado cadastral institucional — atuam onde os bureaus são caros ou rígidos: validação de CPF e CNPJ, qualificação cadastral, KYB (Know Your Business, a verificação de empresas), mapeamento de quadro societário, identificação de beneficiário final e enriquecimento de cadastro.
Aqui a lógica competitiva inverte. Onde o bureau vende histórico proprietário e score, o DaaS vende preço por consulta efetiva e flexibilidade de API. Uma validação cadastral custa centavos; uma checagem de KYB para abrir conta PJ pode ser orquestrada em segundos. O comprador racional usa o DaaS como camada de primeira linha — filtrar, qualificar e enriquecer barato — e reserva a consulta cara de bureau para os casos que realmente exigem score. Não é competição frontal com o bureau; é complementaridade econômica.
| Camada | Função central | Pergunta que responde | Faixa de preço por consulta |
|---|---|---|---|
| Bureau de crédito | Histórico e score | "Esse CPF/CNPJ paga?" | R$ 1 a R$ 30+ |
| IDtech / antifraude | Identidade e liveness | "É mesmo essa pessoa, agora?" | Variável (biometria/evento) |
| Provedor DaaS | Cadastro, KYB, enriquecimento | "Esse cadastro é válido e quem está por trás da PJ?" | R$ 0,05 a R$ 0,50 |
| Fontes públicas | Registros oficiais | "O que dizem os órgãos públicos?" | Custo de coleta/normalização |
| Open Finance | Dados financeiros consentidos | "Qual o comportamento financeiro real?" | Custo de integração/agregação |
Faixas de mercado, ilustrativas; o preço efetivo depende de volume, SLA e mix de produto.
Camada 4 — Fontes públicas: a matéria-prima sub-explorada
Registros oficiais — Receita Federal, juntas comerciais, diários, listas de sanções, cadastros de PEP (Pessoa Exposta Politicamente) e bases de processos — são insumo crítico de compliance e KYB. São públicos, mas não são fáceis: estão fragmentados, em formatos heterogêneos, sem padronização e sem SLA. O valor que um provedor DaaS agrega aqui não é o dado em si, mas a coleta, normalização, deduplicação e entrega via API com qualidade auditável.
Para o MLRO (Money Laundering Reporting Officer) e a área de compliance, essa camada sustenta as obrigações da Circular BCB 3.978/2020, que rege PLD/FT (prevenção à lavagem de dinheiro e financiamento ao terrorismo) e exige KYC, KYB, checagem de PEP e sanções, identificação de beneficiário final e monitoramento contínuo, tudo com trilha de auditoria. Fonte pública mal tratada vira risco regulatório; fonte pública bem orquestrada vira diferencial de custo.
Camada 5 — Open Finance: o dado consentido que reequilibra o jogo
Os dados mais compartilhados no Open Finance
O que é Open Finance — definição. Open Finance é o ecossistema regulado pelo Banco Central em que o cliente autoriza, por consentimento, o compartilhamento dos seus dados financeiros entre instituições. Em 2026 o sistema completou cinco anos reunindo mais de 100 milhões de clientes ou contas conectadas e 154 milhões de consentimentos ativos, consolidando o Brasil como o maior ecossistema do mundo no tema (fonte: Finsiders Brasil, 2026, finsidersbrasil.com.br).
O que circula importa para risco: os dados mais compartilhados são informações cadastrais (89% dos consentimentos), dados de conta (76%), dados de cartão de crédito (61%) e dados de operações de crédito (43%). Entre 2024 e 2025, a quantidade de consentimentos únicos cresceu 143%. Para uma fintech, isso significa acesso a comportamento financeiro real e atual — fluxo de caixa, salários, relacionamento bancário — que complementa o histórico do bureau e a identidade da IDtech. Mas há atrito: 76,8% dos brasileiros dizem conhecer o Open Finance e apenas 37,1% autorizaram o compartilhamento (fonte: TI Inside, 2026, tiinside.com.br). O consentimento é poder do cliente — e, portanto, cobertura incompleta por desenho.
Onde as camadas se encaixam — a complementaridade na prática
Onboarding PJ de crédito: o funil ordenado por custo
- 1Entrada barata (DaaS + fontes públicas)
Valida CPF/CNPJ, monta o quadro societário e checa sanções e PEP por centavos, descartando inválidos antes de gastar consulta cara.
- 2Prova de identidade (IDtech)
Biometria e prova de vida confirmam que o representante legal é real, com latência sob controle.
- 3Capacidade e histórico (bureau)
Score e relatório completo entram apenas nos cadastros que passaram pelo filtro, onde o lift de KS/AUC paga a consulta.
- 4Comportamento atual (Open Finance)
Dados consentidos refinam a decisão com fluxo financeiro real, sobretudo nos casos no limite da aprovação.
Una as cinco camadas em uma jornada de onboarding PJ de crédito e a complementaridade fica concreta:
- Entrada barata (DaaS + fontes públicas): valida CPF/CNPJ, monta o quadro societário, checa sanções e PEP por centavos, descartando inválidos antes de gastar consulta cara.
- Prova de identidade (IDtech): biometria e liveness confirmam que o representante legal é real, com latência sob controle.
- Capacidade e histórico (bureau): score e relatório completo entram apenas nos cadastros que passaram pelo filtro — onde o lift de KS/AUC paga a consulta.
- Comportamento atual (Open Finance): dados consentidos refinam a decisão com fluxo financeiro real, sobretudo para finos de aprovação.
O ganho não é só precisão; é FinOps de dados. Com gasto de dados rodando tipicamente entre 1% e 5% da receita, mover a consulta cara para o fim do funil e usar camadas baratas como filtro reduz custo por proposta aprovada sem sacrificar a taxa de captura de fraude. É por isso que a Datahub e demais provedores DaaS se posicionam como complemento aos bureaus em validação cadastral, KYB, dados societários e enriquecimento — território onde preço e flexibilidade de API decidem — e não como concorrentes frontais em score.
A consolidação — Serasa absorvendo idwall e AllowMe, Quod nascendo dos cinco grandes bancos — concentra a camada de score e antifraude. Isso aumenta, e não diminui, o valor de uma camada DaaS independente e multifonte como contrapeso de custo e flexibilidade.
Como o comprador escolhe: critérios de contratação em 2026
A decisão de compra em fintech raramente é por catálogo. O padrão é POC bake-off: rodar a mesma carteira por dois ou mais fornecedores e medir o resultado real. Os critérios que pesam:
- Lift comprovado — ganho de KS/AUC no caso de crédito; taxa de captura e falso positivo no caso de fraude.
- Latência e uptime — p99 contratual e SLA de disponibilidade, porque cada camada entra no caminho crítico.
- Qualidade e cobertura da API — sandbox, documentação, taxa de match e frescor do dado.
- Preço por consulta efetiva — não o preço de tabela, mas o custo por evento que de fato gerou decisão.
- Governança LGPD e trilha de auditoria — base legal de cada dado, retenção e rastreabilidade para o regulador.
O ciclo de venda costuma levar de 30 a 90 dias, e a contratação é tipicamente API REST pay-per-use. O comprador maduro não busca o fornecedor único perfeito — busca a orquestração em que cada camada faz o que faz melhor, ao menor custo defensável.
Perguntas frequentes
Qual a diferença entre um bureau de crédito e um provedor DaaS?
O bureau vende histórico proprietário de adimplência e modelos de score, decidindo "esse CPF/CNPJ paga?". O provedor DaaS vende dados cadastrais e societários via API por consulta, decidindo "esse cadastro é válido e quem está por trás da PJ?". Eles são complementares: o DaaS filtra e enriquece barato; o bureau entrega score onde o lift justifica o custo maior.
O que faz uma IDtech que o bureau não faz?
A IDtech verifica identidade em tempo real — biometria facial, prova de vida, leitura de documento e detecção de deepfake. Responde "é mesmo essa pessoa, agora, neste dispositivo?", enquanto o bureau responde sobre histórico financeiro. Com o crescimento de 150% nas fraudes de vídeo e áudio em 2026 (Serasa Experian), essa camada virou indispensável no onboarding.
O Open Finance substitui os bureaus de crédito?
Não. O Open Finance traz comportamento financeiro real e atual, mas depende de consentimento — apenas 37,1% dos brasileiros autorizaram o compartilhamento. Sua cobertura é incompleta por desenho. Ele complementa o histórico do bureau e a identidade da IDtech, sem substituir nenhuma das camadas.
Por que usar fontes públicas se elas são gratuitas?
Os registros oficiais são públicos, mas fragmentados, sem padronização e sem SLA. O valor de um provedor DaaS é a coleta, normalização, deduplicação e entrega via API com qualidade auditável — essencial para KYB e para as obrigações de PLD/FT da Circular BCB 3.978/2020. Fonte pública mal tratada é risco regulatório.
Como uma fintech reduz custo na cadeia de dados sem perder qualidade?
Ordenando o funil por custo: usa DaaS e fontes públicas como primeira linha barata para filtrar e enriquecer, aplica IDtech para identidade, e reserva a consulta cara de bureau para os casos que passaram no filtro. Com gasto de dados entre 1% e 5% da receita, mover a consulta cara para o fim do funil reduz o custo por proposta aprovada.
A consolidação do mercado prejudica as fintechs compradoras?
A concentração — Serasa absorvendo idwall e AllowMe, Quod nascendo dos cinco grandes bancos — aumenta o poder das camadas de score e antifraude. Isso eleva, não reduz, o valor de uma camada DaaS independente e multifonte como contrapeso de custo e flexibilidade de API, preservando poder de barganha do comprador.
Leia também no DataHub
Fontes
- Finsiders Brasil — Serasa compra idwall por cerca de R$ 400 milhões (2026)
- Finsiders Brasil — Open Finance supera 100 milhões de clientes (2026)
- Serasa Experian — Os 9 tipos de fraude que mais preocupam as empresas em 2026 (2026)
- CISO Advisor — Brasil registra 28 milhões de fraudes com o Pix em 2025 (2026)
- TI Inside — Jornada de consentimento ainda limita adesão ao Open Finance (2026)
- Quod — O que é um birô de crédito (2026)