Dado bom envelhece bem. Quem começou a guardar registro de CNPJ em 2004, quando Receita Federal, juntas comerciais e cartórios mal tinham se digitalizado, hoje carrega mais de vinte anos de história que nenhum concorrente novo consegue comprar. Essa é a tese da Datahub. Fundada como Dataminer em 29 de dezembro de 2004, a empresa acumulou cobertura de 45 milhões de empresas e 245 milhões de consumidores, virou subsidiária de companhia listada na NASDAQ e, em 2026, transforma esse estoque em produtos de decisão. O ativo não é o software. É o tempo.
Da Dataminer à plataforma de decisão
- 2004Fundação como Dataminer, em São Paulo: enriquecimento cadastral e validação de dados para crédito e cobrança.
- 2005-2020Construção do estoque: cerca de 45 milhões de empresas, 245 milhões de consumidores e mais de 100 milhões de registros por mês.
- 2021Aquisição pela Nuvini e rebranding para Datahub Big Data & Analytics.
- 2023IPO da Nuvini na NASDAQ (ticker NVNI); a Datahub passa a subsidiária de companhia aberta.
- 2024-2025Transição de liderança e continuidade da visão com o fundador-CEO.
- 2026Inflexão de IA: roadmap de produtos (Operational Health Index, Timeline PJ, Score Compliance via MCP).
Por que o tempo de estoque de dados é uma vantagem que não se compra:
Datahub / Nuvini, 2026
Existe uma assimetria pouco discutida no mercado de dados. Você contrata engenheiros em uma semana, aluga GPU em uma tarde e treina um modelo em dias. O que você não acelera é a série histórica. Um CNPJ aberto em 2008 que trocou de sócio três vezes, atrasou tributo em 2015, sumiu do CAGED em 2019 e reapareceu emitindo nota em 2023 conta uma história. Essa narrativa só existe para quem estava observando o tempo todo.
O dado cadastral tem uma propriedade rara: ele compõe. Cada ano de coleta adiciona uma camada que não pode ser reconstruída depois. Um entrante de 2026 enxerga a fotografia de hoje. Quem guarda registro desde 2004 vê o filme inteiro. E decisão de risco, de crédito e de fraude é quase sempre leitura de trajetória, não de instante.
O mundo está migrando de dados para decisões. Por 20 anos, empresas compraram dashboards. Por 10 anos, analytics. A próxima década pagará por decisões.
Essa frase resume a aposta. Mas ela só é crível na boca de quem tem o lastro. É aí que a história da Datahub deixa de ser nostalgia corporativa e vira argumento comercial.
2004: a Dataminer e o problema do cadastro sujo
No começo dos anos 2000, conceder crédito no Brasil era um exercício de fé. As bases públicas se digitalizavam aos poucos. Um analista de cobrança dependia de cadastro preenchido à mão, telefone que não atendia e endereço que já não existia. A Dataminer nasceu para resolver exatamente isso: enriquecimento cadastral e validação de dados para crédito e cobrança.
O movimento era simples de descrever e difícil de executar. A ideia: integrar Receita Federal, juntas comerciais (como as JUCESPs), RAIS, CAGED, cartórios de protesto e, mais tarde, Coaf, Banco Central, Reclame Aqui e ProCon em um único hub consultável. Cada fonte tinha seu formato, sua latência, seu ruído. A empresa passou a processar mais de 100 milhões de registros por mês e a manter um estoque que cresceria por duas décadas.
O nome do produto que sobreviveu ao tempo já dizia a ambição: um hub de dados. Não um relatório. Uma camada de verdade onde marketing, vendas, risco e compliance bebem da mesma fonte. Quem já tentou cruzar três planilhas de cadastro de fornecedores entende o tamanho do problema que isso evita.
2005 a 2020: a construção silenciosa do estoque
Os quinze anos seguintes foram de acúmulo. Pouco glamour, muito rigor. A cada fonte nova integrada, a cobertura ganhava profundidade e a série histórica, espessura. Foi nesse período que a base chegou a cerca de 45 milhões de empresas brasileiras e 245 milhões de consumidores.
Para dimensionar: a Receita Federal disponibiliza hoje, de forma aberta, a base de CNPJ para download (fonte: Receita Federal, 2026, dados.gov.br). Qualquer um baixa a fotografia. O que não se baixa é o histórico de como cada registro se comportou ao longo de quinze anos. Essa é a diferença entre ter o dado e ter a memória do dado.
O período também consolidou a base de clientes de referência. Em comunicação pública da aquisição, em 2021, apareceram nomes como Itaú Unibanco, Equifax, TransUnion, Dell, TOTVS, Comgás, CPFL e Edenred (fonte: NeoFeed, 2021, neofeed.com.br). Bureaus de crédito comprando dado de um fornecedor de dado é um sinal forte de qualidade.
2021: a Nuvini e o acesso a capital
Em 12 de abril de 2021, a Dataminer foi adquirida pela Nuvini, holding de SaaS B2B fundada por Pierre Schurmann. Foi a quarta aquisição do grupo, anunciada junto a uma captação de R$ 400 milhões para financiar novas compras (fonte: NeoFeed, 2021, neofeed.com.br). O valor específico da transação da Dataminer não foi divulgado.
Três efeitos práticos. Primeiro, o rebranding: Dataminer virou Datahub Big Data & Analytics, alinhando a marca ao produto que já existia. Segundo, a integração a um portfólio que hoje reúne empresas de SaaS na América Latina (fonte: Nuvini, 2023, nuvini.co). Terceiro, e mais importante: capital para sair do modo sobrevivência e investir em produto.
A lógica da Nuvini segue uma escola de capital paciente. Compra negócios de software lucrativos, mantém a operação e escala com disciplina financeira. Para a Datahub, isso significou previsibilidade para um ativo que precisa de continuidade. Estoque de dado quebra se você para de coletar.
2023: a NASDAQ e a disciplina de companhia aberta
Em outubro de 2023, a Nuvini concluiu sua combinação de negócios com a Mercato Partners Acquisition Corporation, um SPAC, e passou a ser negociada na NASDAQ sob o ticker NVNI. As ações começaram a ser negociadas em 2 de outubro de 2023 (fonte: Nvni Group, 2023, sec.gov).
Aqui mora um ponto que o leitor de risco aprecia. Ser subsidiária de companhia listada nos Estados Unidos significa viver sob Regulation FD e disciplina de divulgação. Na prática, a Datahub opera com governança de empresa pública, não de startup. Para quem vai depender de um fornecedor de dado no núcleo de uma decisão de crédito ou compliance, esse é um filtro de confiabilidade que poucos players locais oferecem.
A NASDAQ não adiciona um byte ao estoque de dados. Mas adiciona algo que pesa na hora de fechar contrato enterprise: previsibilidade institucional e prestação de contas auditada.
2024 e 2025: transição de liderança sem ruptura
Toda empresa de duas décadas passa por trocas no comando. Em 2024, Rogério Signorini, com passagem por Fiserv, Cielo, Braspag e Visa, assumiu como CEO, trazendo bagagem de pagamentos e infraestrutura financeira. Em 2025, o fundador reassumiu o comando, preservando continuidade na visão de longo prazo.
Continuidade não é detalhe cosmético em negócio de dado. A coerência de metodologia ao longo dos anos é o que mantém a série histórica comparável. Trocar de critério a cada gestão corromperia justamente o ativo que dá valor. A transição ordenada protegeu o que estava no centro: a integridade do estoque.
2026: do dado guardado à decisão entregue
2026: três produtos âncora que releem os mesmos 20 anos de dado
- 1Operational Health Index PJ
Índice de 0 a 1.000 que combina sete sinais multifonte para responder se a empresa está viva ou é fachada (seis dos sete sinais já vivem no estoque de 20 anos).
- 2Monitoramento + Timeline PJ
Feed cronológico por CNPJ com narrativa causal gerada por LLM, cruzando eventos societários, protestos, recuperação judicial, fiscais e de mídia.
- 3Score Compliance via MCP
Primeiro Score Compliance brasileiro distribuído via Model Context Protocol, para rodar dentro de Claude, ChatGPT, Copilot ou Salesforce Einstein.
Por vinte anos a Datahub respondeu à pergunta "quem é essa empresa?". Em 2026, a pergunta muda para "o que eu faço com essa empresa?". A inflexão foi formalizada com um roadmap de produtos de IA aprovado pela holding e três produtos âncora. São três frentes:
- Operational Health Index PJ: um índice de 0 a 1.000 que combina sete sinais multifonte (emissão fiscal, CAGED/RAIS, presença web, vagas, reclamações, movimentação societária e sinais financeiros) para responder se uma empresa está viva ou é fachada. Seis dos sete sinais já vivem no estoque de 20 anos. Detalhamos em Operational Health Index PJ.
- Monitoramento + Timeline PJ unificada: um feed cronológico por CNPJ com narrativa causal gerada por LLM, cruzando eventos societários, protestos, recuperação judicial, fiscais e de mídia. A leitura completa está em Monitoramento e Timeline PJ.
- Score Compliance via MCP: o primeiro Score Compliance brasileiro distribuído via Model Context Protocol, para rodar dentro de Claude, ChatGPT, Copilot ou Salesforce Einstein. O MCP foi lançado pela Anthropic em novembro de 2024 como padrão aberto (fonte: Anthropic, 2024, anthropic.com) e já foi adotado por OpenAI e outros. Veja Score Compliance via MCP.
Repare no fio condutor. Cada produto novo de 2026 é, no fundo, uma nova forma de ler os mesmos vinte anos de dado. A IA não substitui o estoque. Ela o monetiza.
A linha do tempo da Datahub em uma tabela
| Ano | Marco | O que mudou no ativo de dado |
|---|---|---|
| 2004 | Fundação como Dataminer (SP) | Início da coleta; foco em enriquecimento cadastral |
| 2005-2020 | Construção do estoque | Chega a ~45M empresas e ~245M consumidores; 100M+ registros/mês |
| 2021 | Aquisição pela Nuvini | Rebranding para Datahub; capital e portfólio |
| 2023 | Nuvini na NASDAQ (NVNI) | Governança de companhia aberta (Reg FD) |
| 2024-2025 | Transição de liderança | Continuidade metodológica preservada |
| 2026 | Inflexão de IA | Estoque vira produto de decisão (Health Index, Timeline, MCP) |
Da cobrança de 2004 à Decision Intelligence de 2026
As duas ondas de mercado que a Datahub cavalga: 2024 vs. 2030
A evolução das soluções acompanha a maturidade do mercado. Saiu do enriquecimento cadastral puro para três linhas comercializadas hoje, com uma quarta em consolidação:
- Compliance e Risco, a linha mais madura: KYC, KYE, KYS e KYB, validação cadastral, prevenção a fraude e AML cobrindo Coaf, Banco Central, OFAC, ONU, UE, PEP e beneficiário final. Aprofundamos em KYC, KYE, KYS e KYB.
- Marketing e Vendas: enriquecimento de leads com porte, setor, faturamento estimado e decisor, sobre uma base de 45 milhões de empresas.
- Geolocalização (Munddi): inteligência de localização para abertura de loja, redes de franquia e estudos de mercado.
- Decision Intelligence: a camada de 2026 que combina as três anteriores em workflows decisórios completos.
O contexto de mercado sustenta a direção. O mercado global de Decision Intelligence foi estimado em US$ 13,3 bilhões em 2024, projetado para US$ 50,1 bilhões em 2030, a um CAGR de 24,7% (fonte: MarketsandMarkets, 2024, marketsandmarkets.com). O de agentes de IA salta de US$ 5,1 bilhões em 2024 para US$ 47,1 bilhões em 2030, CAGR de 44,8% (fonte: MarketsandMarkets, 2024, marketsandmarkets.com). A Datahub chega a essa onda com algo escasso: dado proprietário brasileiro de duas décadas.
Como o estoque de 20 anos entra no seu workflow:
Para o diretor de risco de uma fintech de crédito, o histórico não é folclore. É feature de modelo. Quando você decide crédito PJ acima de R$ 100 mil, a pergunta não é só "essa empresa paga?", mas "essa empresa existe de verdade, opera, tem sócio coerente e não virou casca?". A trajetória de vinte anos alimenta o Operational Health Index PJ e a Timeline PJ com sinais que a fotografia de hoje não revela. O ganho é direto: menos squad lendo certidão à mão, mais decisão consistente.
Para a área de compliance de um adquirente ou marketplace B2B, o Score Compliance via MCP entra sem trocar o sistema. O analista pergunta ao próprio Claude ou ao Salesforce Einstein se um seller tem exposição a PEP, sanção ou mídia adversa, e a resposta chega com o lastro da base. O dado vai até o agente, em vez de o analista ir até o dado. Esse é o sentido prático do comércio business-to-agent que já desponta. Os modelos comerciais acompanham o uso: consulta avulsa, assinatura corporativa, API enterprise e distribuição via MCP, conforme o volume e o ponto de integração do cliente.
Os ICPs prioritários em 2026 são consistentes com a história: fintechs de crédito, bancos médios, adquirentes, marketplaces B2B e áreas de compliance e risco de terceiros. Para mid-banks, o caminho está em mid-banks e crédito PJ; para marketplaces, em validação de vendedor.
Por que isso importa agora:
O custo de ignorar a procedência do dado ficou alto. O Brasil encerrou 2025 com 8,9 milhões de empresas inadimplentes e R$ 213 bilhões em dívidas negativadas, recorde da série histórica (fonte: Serasa Experian, 2025, serasaexperian.com.br). Nesse ambiente, decidir crédito ou onboarding com dado raso é queimar capital.
O setor consolida em paralelo. A Equifax concluiu a compra da Boa Vista Serviços em 2023 por cerca de R$ 3,1 bilhões, ou US$ 640 milhões (fonte: Equifax, 2023, investor.equifax.com). Movimentos desse porte reforçam a mesma tese: dado de risco é ativo estratégico. Quem já tem vinte anos dele não precisa comprar; precisa apenas transformá-lo em decisão.
Uma nota de higiene, para evitar confusão comum em buscas: a Datahub brasileira (datahub.com.br, compliance e risco, grupo Nuvini) não tem qualquer relação com a DataHub/Acryl Data dos Estados Unidos, catálogo open-source de metadados. Marcas distintas, sem vínculo societário.
O próximo passo prático
Se você avalia fornecedores de dado para risco, crédito ou compliance, faça uma pergunta simples na próxima reunião de RFP: desde quando esse fornecedor coleta? A resposta separa quem te entrega a fotografia de hoje de quem te entrega a trajetória. Em decisão de risco, a trajetória quase sempre vence.
Para entender a lógica decisória por trás dos produtos, veja Decision Intelligence aplicada a risco PJ e o guia geral de dados, risco e compliance. Vinte anos de estoque não são um detalhe da biografia da empresa. São a feature.
Leia também no DataHub
Fontes
- NeoFeed — Nuvini faz quarta aquisição e capta R$ 400 milhões (Dataminer) (2021)
- Datacenter Dynamics — Nuvini adquire Dataminer (2021)
- Nvni Group — Filings SEC (EDGAR) (2023)
- Nuvini — Empresa Dataminer (portfólio) (2023)
- Anthropic — Introducing the Model Context Protocol (2024)
- MarketsandMarkets — Decision Intelligence Market (2024)
- MarketsandMarkets — AI Agents Market (2024)
- Serasa Experian — Empresas encerraram 2025 com R$ 213 bilhões em dívidas (2025)
- Equifax — Completes Acquisition of Boa Vista Serviços (2023)
- Receita Federal — Dados Públicos CNPJ (2026)
- Datahub — Site institucional (2026)