DAY5 Recommended system cold startup problem
创始人
2024-04-30 20:28:35

推荐系统的冷启动问题

  • 推荐系统冷启动概念

    • ⽤户冷启动:如何为新⽤户做个性化推荐
    • 物品冷启动:如何将新物品推荐给⽤户(协同过滤)
    • 系统冷启动:⽤户冷启动+物品冷启动
    • 本质是推荐系统依赖历史数据,没有历史数据⽆法预测⽤户偏好
  • 用户冷启动

    • 1.收集⽤户特征

      • ⽤户注册信息:性别、年龄、地域

      • 设备信息:定位、⼿机型号、app列表

      • 社交信息、推⼴素材、安装来源

在这里插入图片描述

  • 2 引导用户填写兴趣
    在这里插入图片描述

  • 3 使用其它站点的行为数据, 例如腾讯视频&QQ音乐 今日头条&抖音

  • 4 新老用户推荐策略的差异

    • 新⽤户在冷启动阶段更倾向于热门排⾏榜,⽼⽤户会更加需要长尾推荐
    • Explore Exploit⼒度
    • 使⽤单独的特征和模型预估
  • 举例 性别与电视剧的关系
    在这里插入图片描述
    尽可能收集用户信息,构建用户画像
    根据用户的标签可以做人群聚类 用以有用户的行为做推荐
    更多的使用流行度对剑

  • 物品冷启动

    • 给物品打标签
    • 利用物品的内容信息,将新物品先投放给曾经喜欢过和它内容相似的其他物品的用户。
      在这里插入图片描述
      物品打标签,构建物品画像
      基于内容的推荐
  • 系统冷启动

    • 基于内容的推荐 系统早期
    • 基于内容的推荐逐渐过渡到协同过滤
    • 基于内容的推荐和协同过滤的推荐结果都计算出来 加权求和得到最终推荐结果

如果应用缺少用户行动数据-》基于内容的推荐
随着用户行为积累的越来越多-》协同过滤
基于内容和协同过滤共同工作

基于内容的推荐

  • 给物品打标签(NLP)
    系统自己提取 从业务数据库中提取
    用户填写
    中文分词 利用算法计算词的权重(TF-IDF/Textrank)
  • 利用标签的文字 转化词向量
    word2vec
    词向量表示语义,认为这两个词的语义相近
  • 利用词向量 构建物品的向量
    一个物品有N个关键词,每个关键词对应一个词向量
    Σ 权重*词向量 / N 加权平均
    利用N个关键词的词向量获取物品向量
  • 通过物品向量计算相似度
    皮尔逊相关系统 计算物品向量的相似度

基于内容的推荐 基于物品的协同过滤 区别

在这里插入图片描述

相关内容

热门资讯

苗族的传统节日 贵州苗族节日有... 【岜沙苗族芦笙节】岜沙,苗语叫“分送”,距从江县城7.5公里,是世界上最崇拜树木并以树为神的枪手部落...
北京的名胜古迹 北京最著名的景... 北京从元代开始,逐渐走上帝国首都的道路,先是成为大辽朝五大首都之一的南京城,随着金灭辽,金代从海陵王...
长白山自助游攻略 吉林长白山游... 昨天介绍了西坡的景点详细请看链接:一个人的旅行,据说能看到长白山天池全凭运气,您的运气如何?今日介绍...
应用未安装解决办法 平板应用未... ---IT小技术,每天Get一个小技能!一、前言描述苹果IPad2居然不能安装怎么办?与此IPad不...