A deduplicação de base é o processo que identifica e remove registros duplicados na CDP, mantendo apenas um cadastro único para cada cliente na base centralizada da plataforma — a Unified Customer Dataset.
Esse processo garante que você trabalhe sempre com dados atualizados e organizados, evitando redundâncias nas suas segmentações e campanhas.
De onde vêm esses dados?
A fonte de dados para a deduplicação são as listas cadastradas em sua conta na plataforma.
Todos os registros dessas listas são sincronizados automaticamente para a CDP (Customer Data Platform), onde ocorre o processo de deduplicação e unificação. O resultado final dessa operação é disponibilizado na Unified Customer Dataset, uma lista centralizada, atualizada e apenas leitura.
Quais campos são usados para deduplicação?
A deduplicação considera campos de identificação principais, que variam de acordo com o plano contratado:
- Plano Lite e anteriores:
Deduplicação por E-mail.
- Plano Básico, Essencial, Profissional ou Enterprise:
Deduplicação por E-mail, CPF e/ou Telefone.
Quando a deduplicação acontece?
A deduplicação e sincronização dos dados ocorrem automaticamente, uma vez ao dia. Nesse processo:
- As listas da sua conta são sincronizadas com a CDP.
- A CDP deduplica os registros, considerando os campos de identificação definidos pelo seu plano.
- Os cadastros unificados são disponibilizados na Unified Customer Dataset, com os dados mais recentes para cada pessoa única.
Exemplos práticos de deduplicação
Plano Lite e anteriores (deduplicação por E-mail)
Cenário original:
| Registro | CPF | Telefone | Origem (Lista) | Data de Atualização | |
| A | ana@email.com | 123.456.789-00 | (11) 91234-5678 | Lista Promoções | 10/04/2025 |
| B | ana@email.com | 987.654.321-00 | (11) 99876-5432 | Lista Newsletter | 12/04/2025 |
Resultado:
→ Apenas um registro será mantido na Unified Customer Dataset, considerando o cadastro mais recente com o mesmo E-mail.
→ Os demais são desconsiderados para a base deduplicada, independentemente de CPF ou Telefone.
Base após deduplicação:
| exp_internal_group_id | CPF | Telefone | |
| 0ca90719-4a8f-4648-bd16-9c5c819bf395 | ana@email.com | 987.654.321-00 | (11) 99876-5432 |
Contabilização de pessoas únicas:
Neste caso, a Unified Customer Dataset contabiliza 1 pessoa única, pois existe apenas um e-mail distinto após o processo.
Plano Básico, Essencial, Profissional ou Enterprise (deduplicação por E-mail, CPF e/ou Telefone)
Cenário original:
| Registro | CPF | Telefone | Origem (Lista) | Data de Atualização | |
| A | joao@email.com | 111.222.333-44 | (11) 91234-5678 | Lista Promoções | 09/04/2025 |
| B | joao@email.com | 111.222.333-44 | (11) 99876-5432 | Lista Eventos | 11/04/2025 |
| C | joao@email.com | 555.666.777-88 | (11) 91234-5678 | Lista Newsletter | 12/04/2025 |
Resultado:
- Registros A e B: deduplicados, pois o E-mail e CPF coincidem. O mais recente (Registro B) é mantido.
- Registro C: deduplicado, pois o E-mail e Telefone coincidem com o Registro B. Como o Registro C é mais recente, ele substitui o Registro B.
Base após deduplicação:
| exp_internal_group_id | CPF | Telefone | |
| 24c328e0-0cad-4f27-924a-9dc4efb3125b | joao@email.com | 555.666.777-88 | (11) 91234-5678 |
Contabilização de pessoas únicas:
Aqui, a Unified Customer Dataset contabiliza 1 pessoa única, porque, mesmo com diferentes CPFs e Telefones, as regras de deduplicação (E-mail, CPF e/ou Telefone) encontraram registros que representam o mesmo cliente.
Como são contabilizadas as pessoas únicas?
O total de pessoas únicas na Unified Customer Dataset (proveniente da CDP) corresponde à quantidade de cadastros distintos após o processo de deduplicação, considerando as regras do plano.
Esse número representa os contatos reais disponíveis para suas segmentações, filtros e campanhas a partir da lista Unified Customer Dataset.
E os outros dados (atributos adicionais)?
Além dos campos de identificação, a plataforma mantém os atributos adicionais mais recentes de cada cliente (como Nome, Cidade, Data de Aniversário, entre outros).
Importante: Para sincronizar atributos adicionais com a CDP e a Unified Customer Dataset, esses campos precisam estar presentes em listas sincronizadas. Caso contrário, apenas os campos de identificação são considerados na base unificada.
Resumo rápido:
- Fonte de dados: listas da sua conta na plataforma.
- Sincronização e deduplicação automáticas, 1x ao dia.
- Depende do plano:
- Plano Lite e anteriores: por E-mail.
- Outros planos: por E-mail, CPF e/ou Telefone.
- Mantém os dados mais atualizados.
- Atributos extras precisam estar em listas sincronizadas.
Comentários
0 comentário
Por favor, entre para comentar.