通过女票的淘宝历程,大白话讲解大数据各个方向的分工

作者 : 开心源码 本文共2135个字,预计阅读时间需要6分钟 发布时间: 2022-05-13 共197人阅读

1 背景

总跟女票说我是做大数据的,女票也跟她朋友说我是做大数据的,但一问是啥,我跟我女票解释了半天她都没听懂,她也不知道怎样跟她朋友说。最好的处理方法是换女票,当然这是不存在的,想都不会想也不敢想。于是乎说写篇她看完也能知道大数据的文章给她。

下次要是有人问你大数据开发是什么,希望你能把这篇文章分享给他。

2. 开始淘宝

2.1 推荐系统(导购员)

一打开女票的手机淘宝页面,就发现推荐栏叫我女票换包。

推荐商品栏以及热搜和搜索框中的内容,都是根据你定制的。你最近经常搜的物品和浏览的东西都被记录起来,而后被贴上标签。像我女票应该是被贴上「小仙女」、「时尚」、「少女」等标签,下次的女神节,情人节等节日活动的对象就是他们

这个就是大数据中的推荐系统,专门猜你喜欢,相似导购,提高你的购买率。

【大数据开发学习资料领取方式】:加入大数据技术学习交流扣扣群458345782,私信管理员就可免费领取开发工具以及入门学习资料

2.2 大数据平台开发(店里监控布局)

那么数据是怎样被记录的?被记录的又是什么数据?

你的昵称,设施IP,浏览的足迹,每个商品停留的时间,浏览的时间段都是后端要采集的数据。

首先我们搭建一个平台,专门去定制收集数据的手段、采取的策略和存放这些数据的地方,这就是大数据平台的搭建。

相似你在你店里布置了监控探头,录音等设施,而后有其余店员通过这些设施帮你观察消费者的言行举止等等行为。

2.3 实时计算(收银员)

当你在浏览商品的时候,你会发现旁边会有实时的推荐,如下图:

这是由于你在浏览商品的过程中数据不断被收集,而后被投放到上述的推荐系统中。但是那些客户名,商品等信息不肯定都是规则的,有可能是数字,有可能是符号。所以我们这边要有一类程序员,专门负责实时的解决这些数据,把这些数据解决成有规则的,并推送到上述的推荐系统里进行训练,实时给客户推荐商品

这个过程就是大数据的实时计算,它具备时效性,就是不能停,立刻马上做出响应的。把它比喻成收银员就是为了突出实时,别人要结账你得立即做出响应。

2.4 数据仓库(储物间)

数据仓库,顾名思义,存储数据的仓库。在我们少量工厂或者者企业的仓库里,我们通常都会按顺序、分类放好我们的物品,要制定规则,哪些能放,哪些不能放,哪些需要解决之后才能放。

比方说你要放一个柜子,不能直接放下,但你假如把它拆成木板即可以放,等要用的时候通过这些木板去组装就行。

由于数据仓库的存储要遵守数据仓库管理员制定的规则,得将数据按照规格解决好才能进行存放,所以数据仓库一般用于存放不焦急用而且不经常更换的东西,这样比较省事,我们什么时候想用再去取就行。

像我们前面说的实时计算,就没必要把那些数据放到数据仓库,我们需要的是一条流水线的数据管道,实时去推送。但后续的离线计算就截然相反,它需要数据仓库的支撑,便于更好地去计算数据。

2.5 数据分析(店长)

当你从淘宝给你推荐的商品筛选出你喜欢的之后,点击直接购买并付款。淘宝系统会生成一条你订单的数据到数据库里面,上面会有你的收件地址、联络方式、商品信息、数量等。

而这些数据有什么用呢?你可能会想说,留底当凭证啊。对的,不过不止这个作用。

举个例子:马云开会说:我要看一下这十年的内衣销售明细,各个地区的销售情况。这时候有个部门就要去整理出这些报表了,那就是数据分析部门,他们要从海量的数据中去分析这些指标,并整理成报表给马老板看

马老板看了这些数据之后,得出一个结论:「浙江女性胸部全国最小」。而后呢?一定是以后往浙江多进少量小码的内衣,以添加销售量,而后可能再顺带卖点木瓜什么的。

这就是数据分析带来的好处,为我们公司的高层提供决策支持。

2.6 离线计算(会计)

不对啊,十年的数据量,能说查就查吗?数据量得多大啊!没错,不可能说要什么数据立马就能查出来的。最理想的方案就是:当天结束就计算当天的指标,把销售额,地址什么的统计好,而后每星期再统计一下,每个月再统计一下,以此类推。那算十年不就分分钟的事?

对的,那这些事情谁来做呢?当然是我们离线计算工程师。离线计算顾名思义,实时计算的对立方,我们做的是幕后工作。可以将实时计算工程师想象为收银员,每个顾客买单时都得结账并打印发票什么的,不能拖延。离线计算则是会计,每天下班之后看着账单点数,看看今天哪些东西各卖多少。可以慢悠悠地算一个晚上,数据对就行,没人在乎你算了多久。

2.7 数据挖掘(精算师)

那这些解决好的数据不能光存着啊,得挖掘出它的价值。没错,根据这些订单数据,我们能推测出未来商品的一个销售走势,哪个地区需要投放哪些商品,这就是数据挖掘。数据挖掘相当于我们企业的精算师顾问,他会从你已有的数据去分析你之后的走势,给你提供少量有价值可供参考的建议。

我们要给数据挖掘系统投放有价值的数据,它相似我们人脑,输入的数据越有价值和参考性,预测的结果越准,否则只会误导。

3、总结

好了,通过以上步骤,淘宝更懂我女朋友了,它会推送更多符合我女票的胃口的商品,而后下单之后的数据会帮助那些商家投放更多种类的商品到该地区,选择更多了,我女朋友也更喜欢在淘宝购物了。

【大数据开发学习资料领取方式】:加入大数据技术学习交流扣扣群458345782,私信管理员就可免费领取开发工具以及入门学习资料

说明
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是摆设,本站源码仅提供给会员学习使用!
7. 如遇到加密压缩包,请使用360解压,如遇到无法解压的请联系管理员
开心源码网 » 通过女票的淘宝历程,大白话讲解大数据各个方向的分工

发表回复