A deduplicação de base Ć© o processo que identifica e remove registros duplicados na CDP, mantendo apenas um cadastro Ćŗnico para cada cliente na base centralizada da plataforma ā a Unified Customer Dataset.
Esse processo garante que você trabalhe sempre com dados atualizados e organizados, evitando redundâncias nas suas segmentações e campanhas.
š De onde vĆŖm esses dados?
A fonte de dados para a deduplicação são as listas cadastradas em sua conta na plataforma.
Todos os registros dessas listas são sincronizados automaticamente para a CDP (Customer Data Platform), onde ocorre o processo de deduplicação e unificação. O resultado final dessa operação é disponibilizado na Unified Customer Dataset, uma lista centralizada, atualizada e apenas leitura.
š Quais campos sĆ£o usados para deduplicação?
A deduplicação considera campos de identificação principais, que variam de acordo com o plano contratado:
- Plano Lite e anteriores:
Deduplicação por E-mail. - Plano BÔsico, Essencial, Profissional ou Enterprise:
Deduplicação por E-mail, CPF e/ou Telefone.
š Quando a deduplicação acontece?
A deduplicação e sincronização dos dados ocorrem automaticamente, uma vez ao dia. Nesse processo:
- As listas da sua conta são sincronizadas com a CDP.
- A CDP deduplica os registros, considerando os campos de identificação definidos pelo seu plano.
- Os cadastros unificados são disponibilizados na Unified Customer Dataset, com os dados mais recentes para cada pessoa única.
š Exemplos prĆ”ticos de deduplicação
š¦ Plano Lite e anteriores (deduplicação por E-mail)
CenƔrio original:
Registro | CPF | Telefone | Origem (Lista) | Data de Atualização | |
A | ana@email.com | 123.456.789-00 | (11) 91234-5678 | Lista PromoƧƵes | 10/04/2025 |
B | ana@email.com | 987.654.321-00 | (11) 99876-5432 | Lista Newsletter | 12/04/2025 |
Resultado:
ā Apenas um registro serĆ” mantido na Unified Customer Dataset, considerando o cadastro mais recente com o mesmo E-mail.
ā Os demais sĆ£o desconsiderados para a base deduplicada, independentemente de CPF ou Telefone.
Base após deduplicação:
exp_internal_group_id | CPF | Telefone | |
0ca90719-4a8f-4648-bd16-9c5c819bf395 | ana@email.com | 987.654.321-00 | (11) 99876-5432 |
š Contabilização de pessoas Ćŗnicas:
Neste caso, a Unified Customer Dataset contabiliza 1 pessoa única, pois existe apenas um e-mail distinto após o processo.
š Plano BĆ”sico, Essencial, Profissional ou Enterprise (deduplicação por E-mail, CPF e/ou Telefone)
CenƔrio original:
Registro | CPF | Telefone | Origem (Lista) | Data de Atualização | |
A | joao@email.com | 111.222.333-44 | (11) 91234-5678 | Lista PromoƧƵes | 09/04/2025 |
B | joao@email.com | 111.222.333-44 | (11) 99876-5432 | Lista Eventos | 11/04/2025 |
C | joao@email.com | 555.666.777-88 | (11) 91234-5678 | Lista Newsletter | 12/04/2025 |
Resultado:
- Registros A e B: deduplicados, pois o E-mail e CPF coincidem. O mais recente (Registro B) Ć© mantido.
- Registro C: deduplicado, pois o E-mail e Telefone coincidem com o Registro B. Como o Registro C Ć© mais recente, ele substitui o Registro B.
Base após deduplicação:
exp_internal_group_id | CPF | Telefone | |
24c328e0-0cad-4f27-924a-9dc4efb3125b | joao@email.com | 555.666.777-88 | (11) 91234-5678 |
š Contabilização de pessoas Ćŗnicas:
Aqui, a Unified Customer Dataset contabiliza 1 pessoa única, porque, mesmo com diferentes CPFs e Telefones, as regras de deduplicação (E-mail, CPF e/ou Telefone) encontraram registros que representam o mesmo cliente.
š Como sĆ£o contabilizadas as pessoas Ćŗnicas?
O total de pessoas únicas na Unified Customer Dataset (proveniente da CDP) corresponde à quantidade de cadastros distintos após o processo de deduplicação, considerando as regras do plano.
Esse nĆŗmero representa os contatos reais disponĆveis para suas segmentaƧƵes, filtros e campanhas a partir da lista Unified Customer Dataset.
š E os outros dados (atributos adicionais)?
Além dos campos de identificação, a plataforma mantém os atributos adicionais mais recentes de cada cliente (como Nome, Cidade, Data de AniversÔrio, entre outros).
ā ļø Importante:
Para sincronizar atributos adicionais com a CDP e a Unified Customer Dataset, esses campos precisam estar presentes em listas sincronizadas. Caso contrÔrio, apenas os campos de identificação são considerados na base unificada.
ā Resumo rĆ”pido:
- š Fonte de dados: listas da sua conta na plataforma.
- š Sincronização e deduplicação automĆ”ticas, 1x ao dia.
- š Depende do plano:
- Plano Lite e anteriores: por E-mail.
- Outros planos: por E-mail, CPF e/ou Telefone.
- š MantĆ©m os dados mais atualizados.
- š Atributos extras precisam estar em listas sincronizadas.
ComentƔrios
0 comentƔrio
Por favor, entre para comentar.