标签:
以下是我自己翻译的, 错误难免,请见谅。
英文原文,地址https://econsultancy.com/blog/65275-how-to-use-machine-learning-to-enhance-your-marketing-campaigns/
机器学习看上去和市场人员没啥关系, 这玩意貌似只是那些程序狗,计算机呆子做的事情,
但其实任何人都可以通过机器学习提升他们的数字广告营销活动的效果, 本文是一篇介绍性文章,可以帮助你对这个领域一探究竟。
机器学习是一个迷人的话题, 无论你是否读过 《在一位年轻妇女说出她怀孕的事实之前, 美国零售商就定位此客户并推荐其与怀孕有关的产品》 这篇文章, 或者你已经在亚马逊里见识过类似推荐行为。 看起来,计算机好像可以做很多神奇的事儿,很让人激动。
假如,你正在做一个很容易理解的生意 -- 在线珠宝商店。 而且你的主要市场策略是在线广告。
你的挑战是创建一个在线活动来导入流量, 但是你希望确保导入流量的质量---你希望那些真正的购买者点击了广告, 尤其是那些大宗买家。
而且, 你知道你的大多数收入都来自于消费100美元以上的顾客, 所以,你需要找到更多的这样的大客户。
你设计了一系列的广告来吸引那些大买家, 在广告里仔细地融合了产品照片, 品牌logo。
然后, 活动上线几天后, 你看了一下分析报告, 发现不是很有用。
市场分析可以告诉你哪个活动带来了最高的平均收入, 或者是大买家的人数, 但是你不仅仅想知道这么点信息。
你还想知道落地页上的哪些元素能吸引大买家, 继而你就可以放更多的这样的元素, 砍掉别的元素。这就是你机器学习旅程的开始。
机器学习是一个大主题, 里面有许多方法和应用, 但典型的应用是: 用来发现我们看不到的模型,然后用模型解决问题。
换句话说, 你利用计算机的无偏见和强大计算能力来发现我们这些有偏见的,计算缓慢的人类不能发现的东西。 然后提出新的规则让事情做的更好。
例如: 关于上面那个找到怀孕目标人群的故事,零售商想要给马上做父母的夫妇们一些必要的商品的折扣,并且试图把这些人变成终身的忠诚用户。
但他们首先必须能找到这样的潜在顾客, 于是他们就雇佣了一个机器学习专家来帮助识别怀孕顾客的购买习惯。 一但弄明白这个事儿, 他们就能通过使用与怀孕有关的产品优惠来定位和找到这些顾客。
很明显, 专家首先要找到的是已经有孩子的顾客, 然后分析这些顾客在生孩子以前的购买习惯。
然后专家用了一个机器学习算法检测顾客生孩子之前的购买模式, 当有顾客发生类似的购买时, 就向市场团队出发一个提醒。
然后,市场团队要确保这些潜在的顾客收到一个提供了特殊优惠的直邮,根据这些特殊优惠,他们可以跟踪查看是否这些特殊优惠定位到了潜在的家庭顾客。
作为一个市场人员, 你如何使用机器学习专家的方法? 从何处入手呢?
好吧, 你要做的第一件事情,是忘掉“机器”, 专心“学习”. 你可以先试着找到一些规则, 然后再考虑如何把规则自动化执行。
我们已经有一套标准的步骤来帮你找到规则, 按照这些标准步骤来开发规则并不难。 但是你必须一开始就完全理解这些步骤。所以请记住你要做的市场任务,然后仔细阅读这些步骤
首先,你必须把真实世界里的问题映射到一张电子表格里。在这个表里的每一列是你活动的各个维度, 或者是活动的各种特征。 比如:平台, 照片,文案。 每一个行是数据点, 引导购买的每个广告的特征是啥? 顾客看到的照片是啥, 客户阅读的文案是啥? 客户是从哪个平台点击进来的。
对于我们的珠宝广告, 我用下面的一些特征来描述那些引导用户购买的广告。
广告投放在哪个平台上? | Google, Facebook |
宣传照片的特征是啥? | 女人,产品,公司logo |
广告文案突出了什么? | 问题,你,产品,价格 |
有没有 ‘行动号召CTA‘ (例如: 点击这里)? | Yes, No |
当然了, 还有很多别的可能会被用到的特征, 例如: 购买时间,访问的页面, 等等。 但是上面的这些对于了解机器学习来讲已经够用了, 而且简单易懂。
然后,你需要有一个清晰的,期望的结果, 和一个清晰的, 坏的结果。 用这种办法,我们可以训练计算机找出最好的引导用户购买的方案。
对于本文的例子, 一个好的结果是100美元以上的购买, 坏的结果是100美元以下的购买。
注意, 这个测试里不包括那些没有购买的用户点击行为。 尽管,这也应该是一个值得去做的有效性测试。 但现在咱们就只看大额购买VS小额购买的情况, 所以我们只看那些有购买行为的顾客数据。
因此对于这个例子, 结果很简单:如果顾客购买了超过100美元, 结果就是TRUE, 如果没有超过100美元,结果就是FALSE。
我们可以用美元金额作为结果, 但是我们没有用, 原因在下面解释。
第三步, 是搜集特征数据。
但是,要是你没有正确的数据呢? 啊哈, 这就是为什么你需要一开始就了解整个流程的原因。
可能机器学习里最让人沮丧的事情就是, 你找到了一组特征和对应的结果以后, 却发现你没有数据。
有好几次, 我做报告展示不同的广告效果时,却发现, 我忘记在Google Analytics里给那些广告打标签了, (结果就没有期望数据产生出来)。
但是既然我们做事前就看到了这些步骤, 我们应该可以保证数据里记录了所需要的特征。
我们给广告里的每个链接都加上埋点(标签),来保证顾客点击的时候, 记录了相应的平台(platform), 文案(copy),照片(phone),按钮(CTA)
然后,我们把特征数据搜集到下面的这个电子表格里
好吧, 这个有点难度了. 你就算只读过一点点机器学习程序或者算法, 你也会感到迷茫无助, 这里有太多太多的不同的算法了。
这么多算法的原因是每个机器学习算法都有自己特定的使用场景, 可以产生非常复杂的模型帮助你预测未来。
我没资格, 也不够权威谈论这个话题。 所以我建议你们听从专家意见, 他是 Ben Lorica, the chief data scientist at O‘Reilly media.
好的特征,可以让一个简单的模型击败一个复杂的模型
所以,我认为,你得熟悉和了解几个模型,选择特征, 准备数据集,帮助你更加有效地解决你的问题, 不要抱怨你不知道使用哪些机器学习方法。
为了简化问题, 我选择决策树, 这个模型可以从机器学习的视角,清晰地告诉你有用的东西。
一个重要的方法是把你的数据集分成两部分,一组是训练数据集, 另一组是测试数据集合。典型地, 训练数据集合比测试数据集合大很多。我们用400个样本给机器学习, 100个样本用来测试。
我们要确定的问题是, 通过训练集合建立起来的机器学习模型能不能在测试集合上有实际效果?
或者说, 机器是否已经被训练的可以用来做预测了, 还是说,机器只对训练集里的数据有效, 对于测试集数据毫无用处。
对于本文的例子, 原文作者使用了决策树软件C5.0 free demo version here. (我建议用R语言, 或者spark MLIB)
这个软件用起来很容易。 你需要做的只是一个特征模板,和一些用来做测试和训练的CSV文件。然后你点击运行, 程序就可以做剩下的事情了。
很快400个训练集合100个测试集就处理完了。软件生成了一个输出文件。 稍微解释一下, 你就能明白输出内容了,
这个输出结果告诉我们
正如你看到的, 第一个TRUE规则很清晰容易理解, 但是后面的规则比较不容易想到, 很容易被漏掉。
现在看一下决策树模型的评价。 和测试数据
结果看起来有点复杂,其实很容易理解。它讲的是用训练出来的决策树模型跑训练集合数据的时候有7%的错误,用来跑测试集合数据的时候, 错误率只增加到了13%。
所以看起来我们找到了一个有效的算法用来预测哪些广告能成功吸引大买家。
顺便讲一下, 这也是为啥我没有给算法提供订单的美元的金额。而是围绕100美元把结果分成了TRUE和FALSE。
如果我给出了购买金额, 那么算法算法会判断哪一个美元金额产生了最多的期望的结果
也许金额是100美元, 但是结果更有可能是20美元或者85美元, 或者别的对我们没什么意义的数字。
所以, 你得决定你想要什么, 而不是让算法猜你想要什么!这非常重要。
现在我们明白了,我们必须删除问题文案和产品文案, 但是当照片是产品时候, 文案一定要包含价格,只有这样才能获取更多的大额买家。
然后,当然了, 接下来几天再跑一些测试, 看看我们是否仍然能得到相同的结果。
一个真正的机器学习市场营销系统能够自动的运行规则, 不断用新数据进行学习, 自动改进决策树模型, 改进结果。
这就是机器学习有意思的地方, 你最终可以得到了一个可以自动演化,自动发展的系统。
但这种全自动化的机器学习系统比较难做出来, 不过重要的是,你应该已经明白了, 这种系统是很有可能做出来的。
很可能, 用不了多长时间,机器学习专家就能抢走所有的市场营销的工作岗位, 对市场营销人员而言,你们得知道这种新技术,了解这种可能性。
从这个简单例子里, 你明白了准备工作对于市场营销机器学习程序的重要性, 继而你可以按照以上的步骤做出一个计算机辅助的市场自动化系统。
尽管这个简单的机器学习例子没有最终帮你定位你的顾客, 但它帮助你了解了什么样的市场活动是有效的, 什么样的活动是没用的。
标签:
原文地址:http://www.cnblogs.com/realzjx/p/5821484.html