Panorama de mercado
A tendência que vai redefinir o mercado de dados de risco PJ até 2027 tem nome: IA agêntica conectada por Model Context Protocol (MCP). A leitura curta para quem decide produto e arquitetura de dados é direta: a plataforma de dados deixa de ser uma fonte que um humano consulta e passa a ser uma ferramenta que um agente aciona. Quem não expõe seu dado de forma agente-consumível some do fluxo de decisão, por mais rica que seja a base. A projeção do Gartner de que 80% das interações de agentes de IA com aplicações SaaS ocorrerão via servidores MCP até 2027, contra menos de 5% em 2025 [fonte: digitalapplied, 2026], transforma essa exposição de experimento em pré-requisito de distribuição.
O que muda quando o consumidor do dado é um agente, não um analista
Por quinze anos o jogo do dado cadastral foi sobre cobertura e qualidade. Quem tinha o CNPJ mais atualizado, o quadro societário mais limpo e a base de PEP mais completa ganhava a venda. Essa disputa não acabou, mas deixou de ser suficiente. A virada de 2026 é sobre o ponto de consumo: a decisão de risco passou a ser tomada dentro do assistente de IA, e o dado precisa chegar exatamente ali.
A IA agêntica se distingue da automação de regra por três traços. Ela planeja em múltiplos passos, usa ferramentas externas de forma adaptativa e opera em ciclos de percepção e ação guiados por objetivo. Em vez de executar um fluxo pré-configurado, o agente decompõe uma instrução de alto nível como "avalie o risco deste fornecedor" em sub-tarefas, decide quando chamar uma API, quando consultar uma base e quando pedir intervenção humana. A consequência para o setor de dados B2B é estrutural: grande parte do valor sempre esteve na orquestração de múltiplas fontes, validações e decisões repetitivas, e é precisamente esse trabalho que o agente assume.
O analista de crédito não abre mais quinze abas. Ele pergunta ao assistente. Quando a verificação de risco vive fora desse fluxo, ela introduz fricção, e fricção em escala significa que a checagem é pulada ou feita pela metade.
O que é Model Context Protocol em uma frase
Model Context Protocol (MCP) é um padrão aberto que define como modelos de linguagem se conectam a ferramentas, recursos e dados externos. A arquitetura é cliente-servidor sobre JSON-RPC 2.0: o servidor expõe ferramentas, recursos e streams, e o cliente, tipicamente um agente movido a LLM, descobre essas capacidades, lê suas descrições estruturadas e invoca chamadas conforme a necessidade. Funciona como uma tomada universal entre a inteligência artificial e os sistemas que guardam o dado de verdade. Em vez de cada empresa construir uma integração proprietária para cada assistente, o MCP estabelece um contrato único que qualquer agente compatível entende.
A consolidação do padrão foi rápida. A Anthropic lançou o MCP em novembro de 2024 [fonte: Anthropic, 2024]; OpenAI, Microsoft e AWS aderiram ao longo de 2025, e em dezembro de 2025 havia mais de 10 mil servidores públicos ativos, com a Anthropic doando o protocolo à Agentic AI Foundation, dentro da Linux Foundation [fonte: digitalapplied, 2026]. Deixou de ser ativo de uma empresa e virou infraestrutura compartilhada do setor.
Por que a janela é 2026-2027
A convergência tecnológica encontra um aperto regulatório que torna a checagem de risco PJ obrigatória, não opcional. A Resolução Conjunta nº 16/2025 (BCB/CMN) regula os modelos de Banking as a Service e exige identificação, qualificação e prevenção à lavagem de dinheiro na cadeia de tomadores do serviço, o que só escala com KYB automatizado [fonte: Dock, 2026]. A Lei nº 14.790, de 29 de dezembro de 2023, regulamentou o mercado de apostas de quota fixa em vigor desde 1º de janeiro de 2025, trazendo exigências de integridade que esse segmento ainda aprende a cumprir [fonte: Planalto, 2023]. E o custo de errar deixou de ser teórico: o COAF recebeu o recorde de 3,1 milhões de comunicações de operações suspeitas em 2025, alta de 20% sobre 2024, e aplicou R$ 96,9 milhões em multas, quase 120% acima do ano anterior [fonte: Conjur, 2026].
Cada nova obrigação multiplica o número de checagens por contrato. O KYB deixou de ser uma consulta de abertura de conta e virou processo contínuo: situação cadastral, quadro societário, beneficiário final, cruzamento com PEP e sanções, monitoramento de mudanças. Fazer isso manualmente, abrindo portais, não escala. Entregar via MCP, para que o próprio agente do analista execute a diligência na conversa, é o que converte obrigação regulatória em fluxo operacional viável.
Aplicação DataHub
MCP não substitui a API, a complementa
Um ponto que confunde quem desenha arquitetura: o MCP não aposenta a API. A API continua sendo o alicerce transacional, com interfaces estáveis, contratuais e performáticas para troca de dados estruturados entre sistemas. O MCP entra como camada de orquestração voltada a agentes, preservando contexto ao longo de interações de múltiplos passos e fornecendo ao modelo descrições ricas sobre parâmetros e semântica de cada ferramenta. Na prática, uma API de consulta de CNPJ continua existindo como endpoint; um servidor MCP a encapsula, descreve suas funções e a torna consumível pelo agente sem que ele precise conhecer a documentação REST original. Por isso a API permanece a entrega principal, e o MCP é o canal que a leva ao ponto onde a decisão acontece.
A DataHub como camada de integração nativa
É nesse plano que a DataHub se posiciona. A base sustenta a relevância: 275 milhões de CPFs, 70 milhões de CNPJs, mais de 600 fontes, 100 milhões de registros de renda presumida, 70 milhões de histórico trabalhista, 40 milhões de atualizações por mês, com mais de 20 anos de operação e 100% de aderência à LGPD. Mas a tese de 2027 não é sobre o tamanho da base, e sim sobre o formato de entrega: tornar esse dado agente-consumível, descrito com semântica previsível, escopo de autorização claro e cada resposta amarrada à fonte e ao carimbo de tempo.
A entrega principal permanece a API, que atende quem precisa de integração profunda em sistema core. Sobre ela, a DataHub desenha o Score Compliance via MCP, uma capacidade em desenvolvimento, ainda não disponível como produto, sujeita a validação técnica, jurídica e comercial. A intenção é reunir, numa resposta única e auditável dentro do assistente que a equipe de risco já opera, sinais de KYC, KYB, PLD, checagem de PEP, listas de sanções e identificação de beneficiário final. O agente orquestra o raciocínio; a DataHub responde com dado de origem auditável. É a diferença entre uma IA que opina e uma IA que comprova.
A qualidade da descrição da ferramenta vira tão crítica quanto a qualidade do dado. Uma descrição vaga leva o agente a chamadas erradas, e em crédito ou compliance isso é classificação de risco equivocada. Catálogos de ferramentas bem projetados, com leitura e escrita separadas e auditoria de cada chamada, são pré-condição, não enfeite.
O risco estratégico de não ser agente-consumível
O histórico recente serve de alerta sobre execução. Relatórios de engenharia de agentes corporativos apontam que cerca de 80% dos projetos não saem do laboratório, em geral por falhas de infraestrutura de dados, pipelines em tempo real e governança [fonte: dossiê tecnológico DataHub, 2026]. Agentes produtivos dependem de acesso a dados limpos, atualizados e governados, e de mecanismos claros de auditoria e fallback humano. Em risco e compliance, onde um erro vira concessão indevida de crédito ou onboarding de cliente de alto risco, a exigência de controle é máxima.
Daí a defensabilidade. A base de dados cadastral é replicável por um concorrente com tempo e capital. A presença dentro do fluxo de trabalho do cliente, não. Quando o servidor MCP de um fornecedor já está conectado ao assistente do banco, ao da fintech e ao do escritório de auditoria, a troca de fornecedor custa caro, porque exige reconectar fluxos, retreinar equipes e reescrever automações. A presença vira hábito, e hábito vira retenção. A discoverability, a facilidade de ser encontrado e chamado pelo agente, vira a vantagem de quem chega primeiro [fonte: leadgen-economy, 2026].
Governança: o que não se delega ao agente
Levar risco PJ para dentro do agente exige disciplina. A autenticação no servidor MCP precisa ser por identidade e escopo, porque nem todo usuário pode consultar beneficiário final. A LGPD continua valendo integralmente, com base legal, minimização e registro de acesso. O risco de injeção de prompt, instruções maliciosas embutidas em dados, é real em qualquer arquitetura de agente, e exige tratar entrada de usuário como não confiável e nunca executar ação irreversível sem confirmação explícita. E há uma fronteira que permanece humana: a aprovação final de um cliente de alto risco. O agente instrui a diligência e comprova o fato; a responsabilidade pela decisão é da pessoa. Bem implementado, o MCP fortalece a trilha de auditoria que ANPD e BACEN esperam, em vez de enfraquecê-la, porque cada chamada fica registrada com origem e horário.
Dados e provas
Síntese das provas de mercado (2024-2026)
Os números a seguir ancoram a tese de adequação da DataHub à virada agêntica, cada um com fonte e ano:
- 80% das interações de agentes de IA com SaaS via servidores MCP até 2027, contra menos de 5% em 2025, segundo projeção do Gartner [fonte: digitalapplied, 2026].
- Mais de 10 mil servidores MCP públicos ativos em dezembro de 2025, com a Anthropic doando o protocolo à Agentic AI Foundation (Linux Foundation) [fonte: digitalapplied, 2026].
- MCP lançado pela Anthropic em novembro de 2024, com adesão de OpenAI, Microsoft e AWS ao longo de 2025 [fonte: Anthropic, 2024].
- 3,1 milhões de comunicações de operações suspeitas ao COAF em 2025, alta de 20% sobre 2024, e R$ 96,9 milhões em multas (quase 120% acima do ano anterior) [fonte: Conjur, 2026].
- Cerca de 80% dos projetos de agentes corporativos não saem do laboratório, em geral por falhas de infraestrutura de dados, pipelines em tempo real e governança [fonte: dossiê tecnológico DataHub, 2026].
A base de dados que sustenta o risco PJ agente-consumível
Do lado da DataHub, o que sustenta a tese é a profundidade da base e seu ritmo de atualização:
- 275 milhões de CPFs e 70 milhões de CNPJs com quadro societário, base para KYC, KYB e identificação de beneficiário final.
- Mais de 600 fontes integradas e mais de 20 anos de operação, com tratamento 100% LGPD.
- 40 milhões de atualizações por mês, além de 100 milhões de registros de renda presumida e 70 milhões de histórico trabalhista.
- Entrega primeiro por API, com o Score Compliance via MCP tratado como capacidade em desenvolvimento, sem preço ou disponibilidade comercial.
O que decidir agora
Se a projeção do Gartner se confirmar e quatro de cada cinco interações de agente com SaaS passarem por MCP até 2027, a pergunta deixa de ser se o risco PJ migra para o agente e passa a ser quando e com qual fornecedor. Para CTOs, heads de produto e de dados, a decisão de 2026 tem três movimentos: mapear onde a diligência é pulada hoje, porque toda checagem que exige sair do fluxo é candidata a ser ignorada sob volume; exigir entrega no fluxo do agente, e não apenas via API; e travar a auditabilidade, garantindo que cada resposta carregue fonte e carimbo de tempo para suportar a fiscalização do COAF e a Resolução Conjunta 16/2025. O dado confiável continua sendo a base. Mas ocupar o ponto de decisão é a vantagem que se constrói uma vez e se defende por anos. Fale com a DataHub sobre tornar seu risco PJ agente-consumível.
Leia também no DataHub
Fontes
- digitalapplied - MCP adoption statistics 2026 (Gartner: 80% das interações de agente via MCP até 2027) (2026)
- Anthropic - Introducing the Model Context Protocol (2024)
- Model Context Protocol - especificação (arquitetura cliente-servidor sobre JSON-RPC 2.0) (2025)
- Comply - primeiro servidor MCP de plataforma de compliance em serviços financeiros (2026)
- leadgen-economy - MCP como middleware empresarial e a discoverability como vantagem (2026)
- Conjur - COAF bate recorde de comunicações suspeitas em 2025 e multas de R$ 96,9 milhões (2026)
- Dock - regulamentação do BaaS e a Resolução Conjunta BCB/CMN 16/2025 (2026)
- Planalto - Lei nº 14.790, de 29 de dezembro de 2023 (apostas de quota fixa) (2023)