产品经理入门迁移学习指南

作者 : 开心源码 本文共1526个字,预计阅读时间需要4分钟 发布时间: 2022-05-14 共154人阅读

春节前ARK的报告,依然把人工智能看作未来大方向。而实际在人工智能落地过程中,数据量是绕不开的话题,假如数据量不够大,人工智能大概率达不到预期的效果。迁移学习是处理算法落地过程中,依赖数据量问题的一种解法,是非常有趣的一种技术。

数据痛点

过去几年从事智能推荐产品工作,有大量企业希望通过算法助力业务增长,而实际上很多企业不缺场景但缺数据量,因而很多需求实际是拒绝了。当拒绝的需求多了,也逐步发现市场上小数据量占大多数。为此在上一份工作经历中,从0-1搭建了一套基于规则的推荐系统,只要要人工配置几步,就能搭建出一套推荐系统,处理了在小数据量下,做推荐的问题。

在人工智能领域有一门技术,可以处理小数据量下推荐的问题,就是迁移学习技术。迁移学习技术的核心逻辑是最大限度利用源域知识,提升目标任务的预测能力。迁移学习应用的核心是找到类似性和不变性。

以滑雪为例,假设一个人素来没有滑过雪,也即滑雪经验数据为0,但这个人之前玩过轮滑,玩轮滑对于速度与方向的控制与滑雪相似,这个人将轮滑经验知识迁移到滑雪中,即可以快速掌握滑雪技巧,而避免摔跤中学习。这就是将轮滑中的经验知识迁移到滑雪中,提升了滑雪学习的效率。

在小数据量或者0-1训练成本较高时,采用迁移学习可以明显提升学习效率和效果。

迁移学习分类

根据领域及任务的类似性,迁移学习可以分为归纳式迁移学习、直推式迁移学习、无监督迁移学习。其中归纳式迁移学习应用最广泛。

归纳式迁移学习目标域数据为有标签样本,根据源域能否有标签可采用不同的方法做训练。如源数据有标签,考虑目标数据也有标签,可以将源数据与目标数据一起联合做训练,相当于有了更大的数据量做训练。假如源数据没有标签,考虑目标数据有标签,可以将源数据作为目标数据的特征做训练,相当于添加了目标数据的特征维度,也能起到肯定价值。

迁移学习应用

迁移学习奠基人杨强教授出版过《迁移学习》一书,其中详细形容了迁移学习在新闻推荐中的应用。

问题的前提是有老客户的阅读数据和客户的app安装列表,问题是此时如何给新客户推最新的新闻文章,新客户和新物品被称为双冷启动推荐。

传统做新客户冷启动策略,通常采用全局热门或者最新内容,这种策略会导致新客户完全受大部分客户影响并不肯定与客户匹配的内容。

在上一份工作经历中,给一家主打下沉市场的用户做资讯推荐,下沉市场客户对于情感与美食内容颇为感兴趣,按照新客户冷启动策略,给新客户推情感与美食就理所当然,而用户身处一二线城市就觉得很不正当,但在当时的技术条件下,除非写规则,也没有更好的办法。

考虑假如能拿到客户安装列表,并应用迁移学习技术,并且假设具备相似应用程序安装行为的客户在新闻领域中可能类似,以上问题就有理解法。

在以上假设下,可以通过客户安装应用的情况,计算出客户之间类似度,并构造出每个的邻域,相当于给每个客户做聚类,并找出该客户最相邻的客户来。再通过计算每个客户邻域客户对于某条新闻偏好情况结合类似度远近,就能计算出该客户对某条新闻的偏好打分。

当新客户请求时,通过计算邻域客户及这些邻域对每条新闻的打分,最终计算出给新客户最终的推荐列表。而对于新内容,可以利用老客户对于新闻类别的偏好,计算出新客户对新内容的偏好分。从而处理双冷启动的问题。

可见迁移学习可以在肯定程度上处理推荐领域数据不足带来的冷启动问题。

迁移学习价值

对于产品经理来讲,理解迁移学习的原理及应用场景基本够用,没有必要非要精通tensorflow和python,通过技术处理实际问题更为关键。

另外机器学习领域通常是对现实世界的高度笼统,能够让我们跳出纷繁复杂的现实世界,以更加本质的视角看世界。迁移学习给了我们迁移的视角,而非肯定0-1积累,现实中也有非常多应用。

说明
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是摆设,本站源码仅提供给会员学习使用!
7. 如遇到加密压缩包,请使用360解压,如遇到无法解压的请联系管理员
开心源码网 » 产品经理入门迁移学习指南

发表回复