码迷,mamicode.com
首页 > 其他好文 > 详细

寒冬被裁,看小白如何逆袭拿名厂推荐策略offer(上)

时间:2020-09-10 22:43:44      阅读:29      评论:0      收藏:0      [点我收藏+]

标签:告诉   开放   爬虫   互联网   优缺点   工作职责   offer   服务   特征   

是新朋友吗?记得先点蓝字关注我哦~


18年末19年初的北京寒冷异常,网上说是近十年来最冷的冬天。与此相映的,是互联网行业的情况。但酷寒并不能浇灭每个有梦想的互联网人心中的光亮。
18年初小诺因没有机会做到热爱的核心策略,离开了那家他心爱的搜索大厂和搜索引擎后,去一家生鲜独角兽公司做数据可视化工作。一年后的19年初,小诺所在部门被新来的一帮人替换,所谓一朝天子一朝臣,原来的人都陆续离开了。
小诺呢,一直想往搜索/推荐策略发展,但做策略的起点和要求比较高,小诺没有经验。而数据pm因为现在缺口较大,所以一年经验也有很多机会。他不停的纠结,最后决定数据和策略都准备都投,有机会就去面试。
如果策略的实在进不去,就还做数据先生存再追求理想,毕竟生活是曲折前进的,有时我们需要“曲线救国”。
他读了一些书籍,《数据产品经理修炼手册》《数据产品设计》《数据产品经理》《走进搜索引擎》《推荐系统实践》等,为面试做准备。

hi,大家好,这里是暴躁策略信徒——小诺。
很多朋友跟小诺说:
“我看它的jd(职位描述)上啥都没说明白,我怎么准备面试啊?”
“我要转方向做xx产品经理,可我没经验人家不要我,这可咋整啊?”
“我学校普通,大厂卡我学历,脑袋嗡嗡的……”
今天我们不讲面试的理论,就拿个实际经历来说吧~

本文分十个部分。分别是:
引言(虾扯蛋)
一、岗位分析和试前准备
二、埋点设计数据采集
三、数据仓库数据存储
四、数据指标体系
五、标签和特征属性
六、推荐策略和算法
七、AB测试实验设计和策略效果
八、运营分析和迭代
结语

引言

首先,咳咳咳……老规矩,先扯会淡……
有天晚上小诺接到了远在大连读书的表弟小敏的电话,接起电话,他说“哥,你能帮帮我吗?(b站装机猿原味,不懂请自行百度)”
小诺“不帮!”
小敏“哥,是这么回事。我下午和同学去参加一个金融公司的面试,遇到一个我们学校的妹子,她先面试完事走的。我面试完一查那公司。
才发现这公司半年前因为ffjz被政府通告了。我得找到那妹子告诉她,怕她被骗了。你能帮帮我吗?”
小诺“不能,找不到,我洗澡去了。”
小敏“哥,大神,大佬,BAT的希望!帮帮我呗。”
小诺“咳咳,你那是想帮她吗,我都不好意思点破你!来说说你知道她什么信息。”

小敏“我听到面试官叫她王二丫。”
小诺“你有全校名单没,我记得你是学工部学生助理吧。”
小敏“有的有的,最近6届的都有,但只有班级姓名,没有联系方式。”
小诺“没关系,学校本科大四专科大三才能找工作,所以你在15,16级的名单里面搜索她名字的拼音。看看有没有重名。”
小敏“好的!哥,我看了,没有重名。”
小诺“很好,看看她是什么专业班级的。”
小敏“日语软件15002。”

小诺“咱们学校的班级都有用qq群,你用这个做关键词前面加学校简称搜索一下,看能不能找到,日语软件四个字可以取两个字搜索。”
小敏“哥!我搜到了!好激动。”
小诺“先别高兴,他们班级群外人肯定加不上。”
小敏“还真是,哥你料事如神。”
小诺“快别拍马屁了,你找他们群主,加一下,加的时候说你是同校什么专业的xxx。”
小敏“好的!加上了呢!”
小诺“你把事情简单和对方说一下,问她班里是不是有王二丫,再请她帮忙转告。”
小敏“妥了!谢我英俊潇洒,风流倜傥,多才多艺……的哥!”
小诺“滚吧滚吧……”

一、岗位分析和试前准备

那么上面的故事和下面的面试准备有啥关系呢,我们接着往下看。

有一天,小诺看到一个做新闻资讯的半传统十八线知名互联网新媒体公司,在招“画像和推荐策略产品经理”。以下是岗位描述。
工作职责
1.负责内部数据平台的产品建设,需求梳理,迭代推进和口径梳理;
2.负责新闻客户端用户分类画像体系研究和搭建,优化内容标签和个性化推荐策略;
3.基于数据分析和数据逻辑,驱动产品和业务发展。

注意:以下看到的均是做策略之前且是面试前的准备,也就是说在完全没有实践经验前,通过知识储备去分析的准备。虽然后期发现有很多和实际有些出入的地方,但我并为再优化,为的是让读者了解如何为跨入一个新的产品方向做准备。

通过这个jd我们可以知道需要具备哪些方面的知识。列举一下:
数据方面:数据埋点和采集,数据仓库和存储,数据指标体系设计,数据可视化,数据分析和运营。
画像和推荐:用户分类体系设计,用户画像,推荐策略和算法。
产品经理:基本素养。

大概需要以上这些方面的知识,我们不会全都去负责,但是各方面的知识都要懂,毕竟要看到森林也要看到树木。
面对如此多的方面我们应该如何去准备,需要我们先了解这个岗位要做的产品的目标。这个产品是一个新闻app客户端。它有新闻,视频,广场,我这四大模块。可以浏览或者听新闻,视频,直播,fm,小说,文章,还具有很浅的社交功能。
这个岗位的主要职责是构建和优化用户和内容标签体系,同时优化个性化推荐策略。
我们整理下需要学习的知识:
技术图片
其实到这里我们发现,针对面试的分析准备,就和引言的故事一样,从已知的信息出发,一点点分析,一点点准备,串成链路。

作为一个小白,不懂就学,所以我们要对上面涉及到的所有知识进行学习,但第二天就要面试,一天时间掌握大量知识不太现实。我们产品最擅长的就是定需求的优先级,那么根据岗位的核心要求,我们先了解画像推荐和策略的知识,再看数据的知识。
因为热爱搜索和推荐,在此之前小诺看了很多文章和书籍,已经有了一些知识储备,只是没有去考虑过在一个新闻app上如何实践,所以他需要的是把储备的知识链路打通。按照上面列的链条去把每一环搞明白。

很多小白产品经理,总和小诺说:我看了一周的书,觉得收获不大,看了一个月三个月书了,发现知识还是连不起来,我是不是不适合做产品。其实不是这样的,知识积累是一个长期的过程,小诺深深的记得,刚开始做产品的时候,每天通勤时间4小时,小诺会在地铁上看书,但是半年了发现知识还是不成体系,但还是继续坚持,直到一年后才慢慢有了思路,才能系统的去思考一个问题。

二、埋点设计数据采集

埋点方式
一般来说,数据来源有产品上埋点获得的用户数据如uv和pv;有业务系统统计的数据如交易数据;有爬虫从其他第三方平台或网站爬取的数据;有手持终端获得的数据等。
这里需要做的是在app上设计埋点方案,当下埋点一般有三种方式:代码埋点,可视化埋点,全埋点。每一种都有优缺点,代码埋点比较灵活但费人工,全埋点需要较大的存储成本但较全面。同时埋点也分为前端埋点和后端埋点,后端埋点指的是获取在app上操作之外的数据,比如通过链接下载的数量。
key-value方式
了解得知此app目前用的是代码埋点。在设计埋点方案时,获取的指标要明确,层级要分明独立。比如我从梁老师《数据产品经理修炼手册》中学习的这种现下流行的埋点方式:key-value。可以按照功能-页面-位置-操作的层级关系去确定。
同时需要通过埋点获得的指标数据应当是为目标服务的,即目的要明确,要结合业务逻辑、运营体系去设计埋点方案。最后埋点方案应该考虑复用性,避免应后期也许变动引起方案变化高强度增加研发的工作量。
一般一个埋点方案可以包含以下题头:功能,用户行为,事件类型,事件id,key,value,描述,备注。
事件类型分为:曝光事件,点击事件,页面事件。
比如做ab测试时有A和B两个活动页面,每个页面进去都有军事和历史两个分类,我们要统计两个分类的点击事件。这里为了提高复用性可以采用树状结构,即事件id是“活动按钮”,二叉树分为“页面”和“入口”,“页面”的二叉树分为“A页面”和“B页面”,“入口”的二叉树分为“历史”和“军事”,这样即使后期增减活动,也只需要增加或者删除其中一部分分支。
指标定义
这里我们要明确需要统计的数据,会涉及到如何定义指标。
定义指标时含义要准确,比如统计独立用户数时,是否包含访客,如果包含,因为访客没有登录,我们统计的就会是独立设备数。
再比如页面访问次数,如果同一个页面刷新一次是否该统计。再比如下单金额要统计优惠前还是优惠后。
如此精确就像是我们要统计的是”今天12点之后从树上掉下来的方形的黄颜色的带叶子的大苹果”。

三、数据仓库数据存储

我们采集的数据可能会存在数据缺失,数据冗余等问题,需要经过数据清洗。比如缺失数据要考量是否可以补,冗余数据是否可以删。还有数据的归一化、离散化、无量纲处理等,这里不做详细介绍,具体的可以百度查看相关文章。
因为我们要从源头保证数据质量,数据来了我们要放到数据仓库里,数据仓库会集成来自不同数据源的数据,且是面向主题的,比如根据公司业务线进行划分。
这里我们简单说一下架构:
最底下是采集存储层:会有数据采集、容错、解析引擎。数据会分成结构化、半结构化、非结构化的数据。这里还要用到集群协调,分布式存储,高并发响应。
再上去是数据计算层:分ods,bds,ids,分别是原始数据,基础数据,指标数据。这里我们也要做对数据抽取,转换,加载,包括了数据清洗。
再上去是数据模型层:这里有许多分析模型,算法模型,还有标签库。
再上去是数据服务层:这里可以是可视化平台,可以包括指标数据,用户画像,标签集合,数据报表等。
再上面是数据访问层:比如开放接口,数据库查询。

四、数据指标体系

指标组成
我觉得指标是一个能够定量反映事实的标准。
一般指标由维度、定义和度量单位组成。维度就像是从不同角度划分对象的定语,比如苹果从颜色维度可以分红黄绿,从形状维度可以分方圆,从体积维度可以分大中小。度量单位就是一个指标的单位,比如“元”“个”“斤”。举个例子:自营(维度)销售额(定义)万元(度量单位)。
需求了解
在搭建指标体系前我们需要先了解需求,了解业务。比如你的需求方是公司的营销部门,他们需要看到会员用户的一些指标,发现会员用户的特点和现状,通过数据来指导业务,针对性的做一些营销活动或者拜访回访。
那么我们需要了解会员机制,是需要消费够一定金额,或者连续多少天下单才能成为会员,亦或是其他方式?成为会员后会不会在什么情况下失去会员身份?
再考虑能够反映会员用户情况的指标有哪些,比如会员用户比例及变化,会员用户消费情况和普通用户的比较,具体的指标需要我们和业务部门去共同商定。
体系搭建
对于指标体系的搭建,工作中需要根据公司业务情况分类,比如分成下单,仓储,配送,客服,营销等分类。
同时在每个分类中,也应按照高优,区间,低优将指标分列。高优指标即指标数值越高越好;低优指标数值越低越好;区间的分固定和浮动,浮动的比如存储温度,在0-2摄氏度就是安全范围,过高或者过低就需要预警;固定的需要固定在一个数值。
对指标按照业务线或者其他方式分类有助于按照模块构建指标体系,对指标按照高低目标分类有利于之后的可视化设计以及数值预警。

五、标签和特征属性

那么什么是标签呢,我理解的标签是为了定义出对象的特点,用一个个标签让对象的骨肉更加清晰,从而读懂它。
一般对于用户画像会从6个方面来进行,基本信息,兴趣爱好,行为特点,消费信息,社交网络,心理特征。
标签分类
标签在数仓中从下到上分为数据源,事实标签,模型标签,高级标签。
事实标签也可以说是指标标签,比如用户浏览时长,各时段在线用户数等。
模型标签比如用户属性,兴趣爱好,内容偏好,活跃度等。
高级标签比如用户分级,流失模型标签。
标签结构
我们为用户或者内容打标签是为了对其分类,以便更好的了解这个集合中对象的特点,从而针对性的做精细化的运营。也可为信息流推荐打好基础。
标签体系分为结构化,半结构化,非结构化三种。
结构化的标签一二三级层级和所属分明;
半结构化的层级结构比较分明;
非结构化的标签体系诸如广告推广时设定的关键词。
标签规则
标签的命名应该短小易懂,具有代表性,并且无歧义。
标签的体系设计应该做到标签和标签相互独立,并且完全穷尽。
同时标签粒度也要有所把握,粒度太粗无法区分用户,粒度太细集合样本较少、太过于个性同时标签体系也会太过庞大。
对于此新闻app,在首页它有几种搜索途径:有搜索框输入关键词主动搜索;有军事科技历史娱乐社会等的分类垂直搜索;有信息流个性化推荐;还有订阅形式的推送。
我认为它的标签体系可以设立为“分类——主题——关键词”的三级(多级)模式,同时关键词可能要相对独立。
分类指的是“历史,军事,娱乐,社会,科技”等等这些;主题的话比如历史分古代史近代史,也分中国史外国史;关键词的话比如用户爱看的是关于历史-近代史-张学良的文章。

结语

今天小诺先讲到这里,感谢大家关注!
下期我们会讲到大家最喜欢的:推荐策略和算法,ab测试和效果评测,运营分析迭代。
下期的引言还会带来我曾在搜狗一面遇到的逻辑推理题。

最后我想说,都说互联网遇到了寒冬。如果你是有多年经验的老产品,请你像看到过去的自己那样帮助新人。如果你是四处碰壁的新产品,请你在历经坎坷时也别忘记最初的梦想。

这里是:
一个数据人的自留地。
一个有温度的产品社区。

技术图片
一个数据人的自留地是一个助力数据人成长的大家庭,帮助对数据感兴趣的伙伴们明确学习方向、精准提升技能。
扫码关注我,带你探索数据的神奇奥秘

寒冬被裁,看小白如何逆袭拿名厂推荐策略offer(上)

标签:告诉   开放   爬虫   互联网   优缺点   工作职责   offer   服务   特征   

原文地址:https://blog.51cto.com/14915210/2525766

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!