用户标签数据——用户偏好兴趣类标签，如何计算？

“ 用户偏好类标签，是标签应用比较广泛的标签之一。”
关于标签画像，也分享过比较多的内容了。之前都是集中在外围，今天针对标签的具体计算逻辑进行一些分享。本期分享一下“用户兴趣偏好”标签的计算方法。
01 什么是兴趣偏好类标签首先，什么是兴趣偏好呢？
其实从字面意义上，比较容易理解：我们以电商为例，就是某个用户对某个对象（这里的对象可以是商品、可以是品类等）是否有喜好。
官方一点的定义：圈定某兴趣涉及的对象，根据消费者与该兴趣对象的互动情况，判断消费者对某一兴趣的爱好程度。
举个例子，想看看用户对于“体育运动”类目是不是有偏好。
有朋友会问，这标签计算不是太容易了么，直接把这个用户历史上所有的购买记录，拿出来，分类目统计一下不同类目的成交情况，看看体育运动类目的成交多不多，不就完了。
逻辑是没问题，但是忽略了很多场景：比如用户天天浏览体育运动相关的类目，但成交量不大，是不是也说明对该类目有偏好呢？而这种偏好的计算，往往比成交的偏好更有营销价值，也更全面。
那如何进行兴趣偏好标签的计算呢？
02 兴趣偏好标签的计算先看计算逻辑总体概览，主要分为了三部分：互动行为、互动深度、权重。我们这里的兴趣偏好，以用户偏好哪个一级品类为例，进行展开。

文章插图
（1）互动行为
这部分是确定有哪些用户行为要纳入到兴趣标签的计算中。
通常在电商中，使用的比较多的就是：浏览、加购、下单。有这些行为，往往反映出用户对该品类有较强的兴趣。
另外，搜索行为也是很能反映用户偏好的，但由于搜索词涉及大量NLP的内容，在做标签的计算中，比较耗时费力，在精度要求没有那么高的时候，可以先不考虑搜索行为。
（2）互动深度
所谓的互动深度，指的是用户在每种互动行为下，有哪些具体的内容可以衡量用户行为的深度情况。
不然容易出现这种情况：用户只是对某个类目下的某个商品有超强偏好，但是最终计算结果却是该用户对整个类目都有兴趣。用互动深度，能降低异常情况带来的影响。
我们这里举的例子，使用了三个指标来反映用户的行为深度：设计三级类目数、涉及sku数、购买件数。
（3）权重设置
权重部分很重要。这是为了将不同行为对最终结果的贡献，进行合理差异化。
也比较容易理解，肯定是下单说明用户更感兴趣嘛，毕竟能真掏钱的才是真爱。所以在权重大小上，也是下单>加购>浏览。
关于如何设置权重，后面有机会再分享。
（4）综合得分
最后就是根据行为、深度、以及权重，综合计算偏好得分了。
【用户标签数据——用户偏好兴趣类标签，如何计算？】通常，计算之前会对数据进行一些标准化的处理，避免量纲对结果的影响。
基于得分，进行阈值的划分，可以划分出不同的偏好程度。