计算广告——广告定向实践

时间：2016-07-13 17:30:45 阅读：134 评论：0 收藏：0 [点我收藏+]

标签：

计算广告学涉及到很多的不同的学科知识，包括大规模搜索，文本分析，机器学习，信息检索以及经济学等等。在计算广告中，其核心问题是在给定的环境下，找到用户和广告之间的最佳匹配，在斯坦福大学的计算广告学中如下的定义：

Computational advertising = A principled way to find the “best match” between a user in a context and a suitable ad.

对于一条指定的广告，为了寻找用户与广告之间的最佳匹配，需要从大量的候选用户，挑选出对本条广告感兴趣的用户，这就牵涉到广告定向的相关技术。

一、广告定向的分类

这部分的内容主要参照参考文献1。

人群属性定向(Demographic Targeting)：主要指基于用户基本属性，包括年龄，性别等定向。如将化妆品类的广告投放给女性用户。
行为定向(Behavioral Targeting)：指的是基于用户的历史行为数据挖掘用户的兴趣，如微博中用户对博文的转，评，赞等数据。
地理位置的定向(Geo Targeting)：指的是利用移动设备记录用户的地理位置，投放相应的广告，如餐厅广告的投放。
相似用户的定向(Look-Alike Targeting)：指的是利用已经找出的一些人，找到与其相似的用户进行定向。

还有很多的定向技术，在本文中，结合具体的广告形态，重点介绍一下行为定向以及相似用户的定向。

二、基于用户行为的广告定向

2.1、广告实践的背景

对于信息流类的广告产品，也称为原生广告，即广告的展示样式与自然内容基本上一致，这一点通常也称为“表现原生”。基于信息流的广告产品有很多，如微信的朋友圈，微博，QQ空间，今日头条等等。下面展示了微信的朋友圈，微博以及QQ空间的信息流广告：

微信的朋友圈
微博
QQ空间

2.2、基于用户行为的广告定向

对于索引的生成，这里简单介绍离线的数据挖掘+在线索引的方法，整体架构包括离线数据挖掘部分以及在线索引部分，具体架构如下图所示：

技术分享

对于上述的社交类的信息流中的广告，其用户的行为主要包括转发，评论，点赞，收藏以及点击短链，且每一种行为的强度也是不一样的，转发的强度是最高的，代表的用户的兴趣是刻画的最清晰的一种行为。基于用户的行为的广告定向大致有如下的几种形式：

2.2.1、基于互动内容的行为定向

基于互动内容的行为定向是指利用一些机器学习或者文本处理的方法提取出用户互动的文本中的核心词，以核心词作为用户的标签，当有新的广告时，提取出广告中的核心词，与用户的标签进行匹配，大致的架构如下图所示：

技术分享

2.2.2、基于与广告主互动的行为定向

基于与广告主互动的行为定向是指将广告主的广告投放给与其发布的信息（广告或者非广告）有过互动的一些用户，这些与广告主有过互动的用户在一定程度上对广告主发布的信息有着不同的兴趣。

注意：这里的用户有一部分是该广告主的粉丝或者好友，要排除这一部分的用户。

基本的过程是提取出与广告主在一定时间内互动过的用户，当该广告主发布新的广告时将广告投放给这些潜在的用户，基本的架构如下图所示：

技术分享

2.2.3、基于话题的行为定向

在社交网络中，通过##标记可以将一部分文本标记为话题。话题代表了该信息的大致主题，提取出用户在一段时间内互动过的博文中的话题，作为该用户的兴趣标签，当新的广告中同样包含话题时，提取出广告中包含的话题，通过广告中的话题与用户的兴趣标签进行匹配，选择出该广告的受众，将广告投放给这部分用户，大致的架构如下图所示：

技术分享