Panorama de mercado
A consolidação mudou o mapa: um neobank virou a maior instituição privada por clientes
O mercado financeiro brasileiro atravessou em 2025 e 2026 um ponto de inflexão estrutural. A Nubank tornou-se a maior instituição financeira privada do Brasil por número de clientes ao fim de 2025, com mais de 112 milhões de clientes, o equivalente a cerca de 61% da população adulta do país, e anunciou intenção de obter licença bancária no Brasil em 2026 [fonte: Nubank/Business Wire, 2025-2026].
Esse movimento não é isolado. Ele sinaliza a maturação de uma geração inteira de bancos digitais que saiu da fase de aquisição acelerada de base e entrou na fase de monetização por carteira (crédito, seguros, investimentos), que é justamente onde o dado de risco e de enriquecimento deixa de ser conveniência e passa a ser insumo crítico de margem.
A corrida por licença bancária importa para a demanda de dados por um motivo direto. Operar como banco amplia o leque de produtos de crédito e a exposição a risco regulatório, e cada produto novo exige uma nova camada de decisão automatizada ancorada em dados sobre o mesmo cliente. Quanto maior a base e mais amplo o portfólio, maior a frequência com que cada CPF e cada CNPJ precisa ser reavaliado.
O BaaS adensa a infraestrutura e multiplica os pontos de onboarding
Em paralelo à consolidação dos neobanks, o Banking as a Service (BaaS) adensa a infraestrutura financeira do país. O mercado brasileiro de BaaS foi avaliado em cerca de US$ 870 milhões em 2025 e deve chegar a US$ 1,78 bilhão até 2032, com CAGR de aproximadamente 10,8% entre 2026 e 2032, com fintechs e neobanks representando 45% do mercado em 2025 [fonte: MarkNtel Advisors, 2025].
O efeito do BaaS sobre a demanda de dados é multiplicador. Provedores como QI Tech, Dock, Celcoin, Fitbank e Zoop embutem conta, crédito e pagamentos em empresas que não são instituições financeiras, do varejo à plataforma de software. Cada empresa que passa a oferecer serviço financeiro embarcado vira um novo ponto de onboarding de PF e PJ, com a mesma obrigação de verificar identidade, validar cadastro e avaliar risco que um banco teria.
O Brasil já conta com mais de 2.000 fintechs ativas, cerca de 56% das fintechs da América Latina, e desde setembro de 2025 passou a exigir que fintechs sigam as mesmas regras de KYC/AML aplicadas aos bancos, com monitoramento contínuo obrigatório [fonte: Didit/Celcoin, 2025-2026]. A equiparação regulatória significa que o adensamento do BaaS não gera apenas mais onboardings, gera mais onboardings sob exigência de compliance equivalente à de banco.
Aplicação DataHub
Duas frentes para o mesmo cliente consolidado
Um neobank consolidado é um comprador de dados em duas frentes simultâneas, e a consolidação reforça ambas.
Na frente de Marketing & Vendas, a base massiva exige enriquecimento para sustentar crescimento de carteira sem degradar qualidade: lookalike para encontrar novos clientes com perfil semelhante aos melhores pagadores, market share para dimensionar a fatia conquistada por segmento e região, e enriquecimento cadastral para qualificar leads e personalizar oferta. A DataHub sustenta essa frente com mais de 275 milhões de CPFs e mais de 70 milhões de CNPJs, cruzados com mais de 600 fontes de dados [fonte: DataHub, 2026].
Na frente de Risco & Compliance, a escala de base transforma o monitoramento de carteira em um problema contínuo: KYC e KYB no onboarding, prevenção a fraude, e reavaliação perpétua de risco em milhões de contas. Aqui a atualização do dado é o diferencial. A DataHub atualiza mais de 40 milhões de registros por mês na Receita Federal, com base 100% LGPD e mais de 20 anos de operação [fonte: DataHub, 2026].
A API é a forma de entrega que acompanha a multiplicação de onboardings
Para a stack de BaaS, a forma de entrega importa tanto quanto o dado. Quando um provedor embute conta e crédito em dezenas ou centenas de empresas clientes, ele não consegue operar com processos manuais de consulta. Ele precisa de dados que entrem no fluxo programático de cada onboarding, em tempo de decisão.
A API é a principal forma de entrega da DataHub, e é exatamente o formato que conversa com a arquitetura de embedded finance. Cada novo onboarding disparado por um cliente do provedor de BaaS aciona, de forma automatizada, o enriquecimento cadastral e os sinais de risco necessários para aprovar, recusar ou escalar a decisão. SaaS e Projetos Especiais complementam a entrega, mas a API é o que viabiliza o volume.
Esse desenho responde ao gap de execução que a própria indústria reconhece. Segundo a McKinsey, 88% das organizações já usam IA em ao menos uma função, mas menos de 25% escalaram para produção em escala, sendo segurança e risco a principal barreira [fonte: McKinsey, 2026]. Dado confiável, atualizado e auditável, entregue por API, é o que destrava a operação em escala que a consolidação de neobanks e BaaS exige.
Dados e provas
O dimensionamento do mercado em números
Os números que sustentam a tese de demanda por dados na onda de consolidação:
- Mais de 112 milhões de clientes na Nubank, cerca de 61% da população adulta, com intenção de licença bancária em 2026 [fonte: Nubank/Business Wire, 2025-2026].
- BaaS brasileiro de US$ 870 milhões (2025) para US$ 1,78 bilhão (2032), CAGR 10,8%, com 45% do mercado em fintechs e neobanks [fonte: MarkNtel Advisors, 2025].
- Mais de 2.000 fintechs ativas no Brasil, cerca de 56% da América Latina, com KYC/AML equiparado a bancos desde setembro de 2025 [fonte: Didit/Celcoin, 2025-2026].
- Perdas com fraudes no sistema financeiro de R$ 10,1 bilhões em 2024, alta de 17% sobre 2023 [fonte: FEBRABAN/Finsiders, 2024-2025].
- A prevenção a fraude superou marketing como prioridade de investimento: quase 40% das empresas planejam direcionar mais recursos à prevenção a fraude, acima de marketing (30,4%) [fonte: Serasa Experian via CartaCapital, 2025-2026].
A base proprietária que responde a essa demanda
Do lado da oferta, a camada de inteligência operacional da DataHub se ancora em provas de dados canônicas que endereçam tanto a frente de crescimento quanto a de risco da stack neobank/BaaS:
- Mais de 275 milhões de CPFs e mais de 70 milhões de CNPJs [fonte: DataHub, 2026].
- Mais de 600 fontes de dados integradas [fonte: DataHub, 2026].
- Mais de 100 milhões de CPFs com renda presumida e mais de 70 milhões de CPFs com histórico trabalhista de até 7 anos [fonte: DataHub, 2026].
- Mais de 40 milhões de registros por mês atualizados na Receita Federal [fonte: DataHub, 2026].
- Operação 100% LGPD há mais de 20 anos [fonte: DataHub, 2026].
O contraste com o benchmark de mercado é instrutivo. A Serasa Experian, líder do setor, opera mais de 6,5 milhões de consultas diárias e protege mais de 2,2 bilhões de transações comerciais por ano [fonte: Serasa Experian, 2025-2026]. A DataHub não se posiciona como bureau de score concorrente, e sim como camada complementar de fontes alternativas que o bureau tradicional não cobre, entregue por API.
Como resume o relatório da McKinsey sobre o estado da confiança em IA, no contexto do gargalo que trava a escala: a barreira não é a tecnologia, é a confiança no dado. "Segurança e risco continuam sendo o principal obstáculo para colocar a IA em produção em escala" [fonte: McKinsey, 2026].
Tendências 2027
Para onde caminha a demanda de dados na consolidação
O movimento de 2026 projeta vetores claros para 2027:
- Adensamento contínuo do BaaS rumo a US$ 1,78 bilhão até 2032, multiplicando onboardings PJ e PF e a necessidade de enriquecimento via API tanto em risco quanto em marketing e vendas [fonte: Nubank/MarkNtel, 2025-2026].
- KYC e monitoramento perpétuo como padrão: com fintechs equiparadas a bancos e monitoramento contínuo obrigatório, a verificação pontual de onboarding deixa de bastar e a demanda migra para camadas de risco perpétuo via API, alimentadas por fontes vivas e reatualizadas [fonte: Didit/Celcoin, 2025-2026].
- Escalada de fraude de identidade sintética e deepfakes pressionando antifraude e KYB, reforçando o investimento em verificação de beneficiário final e detecção de empresas de fachada, com perdas projetadas crescentes para o golpe do Pix nos próximos anos [fonte: FEBRABAN/Finsiders, 2024-2025].
- Compliance como motor de crescimento, não custo: a inversão de orçamento, com prevenção a fraude acima de marketing, consolida-se em 2027 com fintechs e meios de pagamento tratando dados de risco como vantagem competitiva [fonte: Serasa Experian via CartaCapital, 2025-2026].
Leia também no DataHub
Fontes
- Nubank (sala de imprensa) / Business Wire (2025-2026)
- MarkNtel Advisors - Brazil Banking as a Service (BaaS) Market (2025)
- Didit / Celcoin - KYC and AML Compliance in Brazil (2025-2026)
- FEBRABAN / Finsiders Brasil (2024-2025)
- Serasa Experian via CartaCapital - prevenção a fraude acima de marketing (2025-2026)
- Serasa Experian - Quem Somos (2025-2026)
- McKinsey - State of AI trust in 2026 (2026)