一、业务背景互联网的账号自带备忘机制;
通常在系统研发的过程中,需要不断适配各种业务场景,扩展服务的领域和能力,一般会将构建的产品矩阵划分出多条业务线,以便更好的管理;
由于各个业务线的数据入口和管理策略的不同,这样从不同路径下沉淀的数据,可能因为系统边界问题从而被孤立;如果用户数据被分裂,会因为数据不全面给分析决策带来误导;
比较经典的场景,用户从应用端完成注册之后,通常不会过多提供自身信息,由于业务需要不断丰富用户画像,所以用户数据通常会被调度到独立的管理系统中,通过不同的触点反馈进行信息扩展,比如采集埋点数据,线下接触,营销电话等;
这种情况从操作上是有明显感知的场景,显然用户在应用库中的数据和在管理库是存在很大差异的,在真实的情况中用户可能在不同的应用和场景中会产生重复,必然会导致用户数据难以统一维护;
二、唯一标识用户的行为数据在当下的互联网产品中,是极其具有分析价值的,不同的应用端不管是否处于登录状态,在产品中产生的数据都是有记录的手段,进而在数据层面分析识别;
这些编号最大的特点就是具有唯一性,可以标识用户在不同终端不同状态的操作信息,而当这些数据沉淀到系统时,会根据端口和操作类型进行存储,不同的终端下其数据唯一标识也不相同;
从数据分析的角度上来看,显然不希望用户的行为信息被分裂并且各自孤立,这样对多终端多状态下的用户行为数据进行全域关联,是行之有效的方式,其基本原理涉及到ID的映射技术;
三、Id映射基于上述的业务情况,在产品矩阵中提供用户身份的全局统一标识至关重要,用户实体在不同业务线所产生的行为数据,通过唯一序列号进行识别,这样进行用户分析时看到的画像比较全面;
在当下的互联网产品中,基于手机号创建应用账号的模式已经是常见功能,手机号注册之后,再通过手机号去关联相应的终端ID,从而使各种孤立的数据被链接起来;
其实现的原理并不复杂,首先需要提供一套映射库,当新的手机号被系统识别采集时,在映射库中新建一条数据,手机号和对应的唯一ID,此后其他路径的数据,如果手机号相同则绑定在该ID下面;
四、数据关联在ID映射机制下,虽然各个业务线数据相对孤立,数据之间不会产生直接影响,但是实际上已经被唯一ID串联起来,这样将ID关联的数据进行综合分析,准确性会提高很多;