用户标签数据——用户偏好兴趣类标签,如何计算?

“ 用户偏好类标签 , 是标签应用比较广泛的标签之一 。”
关于标签画像 , 也分享过比较多的内容了 。之前都是集中在外围 , 今天针对标签的具体计算逻辑进行一些分享 。本期分享一下“用户兴趣偏好”标签的计算方法 。
01 什么是兴趣偏好类标签首先 , 什么是兴趣偏好呢?
其实从字面意义上 , 比较容易理解:我们以电商为例 , 就是某个用户对某个对象(这里的对象可以是商品、可以是品类等)是否有喜好 。
官方一点的定义:圈定某兴趣涉及的对象 , 根据消费者与该兴趣对象的互动情况 , 判断消费者对某一兴趣的爱好程度 。
举个例子 , 想看看用户对于“体育运动”类目是不是有偏好 。
有朋友会问 , 这标签计算不是太容易了么 , 直接把这个用户历史上所有的购买记录 , 拿出来 , 分类目统计一下不同类目的成交情况 , 看看体育运动类目的成交多不多 , 不就完了 。
逻辑是没问题 , 但是忽略了很多场景:比如用户天天浏览体育运动相关的类目 , 但成交量不大 , 是不是也说明对该类目有偏好呢?而这种偏好的计算 , 往往比成交的偏好更有营销价值 , 也更全面 。
那如何进行兴趣偏好标签的计算呢?
02 兴趣偏好标签的计算先看计算逻辑总体概览 , 主要分为了三部分:互动行为、互动深度、权重 。我们这里的兴趣偏好 , 以用户偏好哪个一级品类为例 , 进行展开 。

用户标签数据——用户偏好兴趣类标签,如何计算?

文章插图
(1)互动行为
这部分是确定有哪些用户行为要纳入到兴趣标签的计算中 。
通常在电商中 , 使用的比较多的就是:浏览、加购、下单 。有这些行为 , 往往反映出用户对该品类有较强的兴趣 。
另外 , 搜索行为也是很能反映用户偏好的 , 但由于搜索词涉及大量NLP的内容 , 在做标签的计算中 , 比较耗时费力 , 在精度要求没有那么高的时候 , 可以先不考虑搜索行为 。
(2)互动深度
所谓的互动深度 , 指的是用户在每种互动行为下 , 有哪些具体的内容可以衡量用户行为的深度情况 。
不然容易出现这种情况:用户只是对某个类目下的某个商品有超强偏好 , 但是最终计算结果却是该用户对整个类目都有兴趣 。用互动深度 , 能降低异常情况带来的影响 。
我们这里举的例子 , 使用了三个指标来反映用户的行为深度:设计三级类目数、涉及sku数、购买件数 。
(3)权重设置
权重部分很重要 。这是为了将不同行为对最终结果的贡献 , 进行合理差异化 。
也比较容易理解 , 肯定是下单说明用户更感兴趣嘛 , 毕竟能真掏钱的才是真爱 。所以在权重大小上 , 也是下单>加购>浏览 。
关于如何设置权重 , 后面有机会再分享 。
(4)综合得分
最后就是根据行为、深度、以及权重 , 综合计算偏好得分了 。
【用户标签数据——用户偏好兴趣类标签,如何计算?】通常 , 计算之前会对数据进行一些标准化的处理 , 避免量纲对结果的影响 。
基于得分 , 进行阈值的划分 , 可以划分出不同的偏好程度 。