点击上方,选择星标或置顶,每天给你送干货!
深度学习自然语言处理原创出品
签约作者:奋斗喵
1、在线广告综述
在线广告,指的是在线媒体上投放的广告。与传统广告不同的是,在线广告在其十几年的发展过程中,已经形成了以人群为投放目标、以产品为导向的技术型投放模式。
图1 在线广告综述
1.1 免费模式与互联网核心资产
互联网产品的网站、应用等软件产品,往往以免费的形式服务用户;另外一些互联网也在以直接利润微薄甚至亏损的情况下,出售手机、电视等硬件产品。这种称为免费模式。
免费模式的本质是将那些能够规模化、个性化传播信息的商品,以边际成本的价格出售。(边际成本:指的是每一单位新增生产的产品(或者购买的产品)带来的总成本的增量。)
在免费产品在信息的传播过程中,获得3项可变现的核心资产,即流量、数据和影响力。
(1) 流量。有人使用你的产品,你就可以在产品本身外夹带一些付费内容,如:广告。这就将流量变成收入。
(2) 数据。别人在使用你的产品时会留下一些行为和属性,如:搜过某个关键词,浏览过某个商品,填写过自己的性别等等。基于这些信息,可以调整投放付费内容的策略以提高效率。
(3) 影响力。影响力指的是你的产品或内容获得了高于普通水准的关注与信任。当然,投放的付费内容也就获得了更好的关注效果,而这些对于提高转化率同样是至关重要的。因此,具备影响力的产品或内容在投放广告时可以获得品牌溢价。(品牌溢价:如同样的服装,同样的西服,没有品牌的西服和皮尔·卡丹去比较,你可能情愿多花几千块钱买皮尔·卡丹,而事实上穿在身上跟没品牌的也差不多,但是这里边有一个情感价值在这里面,这就是消费者的消费心理决定的。由于有了这样的消费心理,所以你必须把你这个品牌塑造成在消费者心目中高于其它品牌的形象,有了这个形象以后,品牌的溢价就变成了很自然的事情。这就是品牌溢价)
将这三项资产通过商业化产品的形式转变成收入的过程,即商业化过程,与用户使用免费产品的过程是分离的,因此成为后向变现。
1.2 大数据与广告的关系
近年来,大数据思维和技术渐成显学。它在工业界最显著的特点是区别于以往数据处理系统的低成本、分布式计算架构。从数据来源、处理方式和应用方向这三个角度来看,分别有:
(1) 行为数据:传统的数据处理任务往往面对的是交易数据。所谓交易数据指的是商业数据处理的规模往往并不大,但是对一致性和实时性的要求非常高,如:电信运营商的话费充值、通话记录,银行的存取款、利息等。与此相对,商业活动中产生的非必须记录的数据就是行为数据,如:电信运营商采集到的用户位置、银行的窗口排队以及网站的用户访问日志等,都属于行为数据。
(2) 全量加工:如果数据很大,并且问题无法通过采样来降低处理的复杂程度,那就必须利用一些专门为海量数据处理而设计的计算和存储技术来实现。
(3) 自动化应用:使用数据的应用有两种类型。一种是洞察应用,即对数据进行统计分析后得到整体的结果报表,再由决策者根据结果进行投票。如:企业的财务报表。商业智能是典型的的洞察应用。另一种是自动化应用,即将数据处理的结果直接送给业务进行自动决策的引擎。计算广告正是典型的自动化应用,从用户行为数据收集,到受众定向,再到线上根据用户标签的自动决策,整个过程都是自动进行的,人的作用只是建立流程和调整策略。
从行为数据、全量加工和自动化应用这3个关键点来看,在线广告中的计算问题是非常典型的大数据应用。
1.3 广告的定义与目的
(1) 广告的定义
在William F.Arens 在《当代广告学》中给出的定义为:
广告是由已确定的出资人通过各种媒介进行的有关产品(商品、服务和观点)的,通常是有偿的、有组织的、综合的、劝服性的非人员的信息传播活动。
首先,这一定义中指出了两个主动参与方,即 出资人 和 媒体。或者称 需求方 和 供给方。前者是广告主、代表广告主利益的代理商或其他形态的采买方;后者可以是媒体,也可以是其他形态的变现平台。
另外,广告还有一个被动的参与方,即受众。出资人、媒体和受众这三者的利益博弈关系是广告活动的主线。
(2) 广告的本质目的
广告的根本目的是广告主通过媒体达到低成本的用户接触。也就是说,按照某种市场意图接触相应的人群,进而影响其中的潜在用户,使他们选择某产品的概率增加,或者对产品性价比的苛刻要求降低,这才是广告的根本目的。
广告的 “低成本” 是与那些由市场或销售人员完成的劝服活动成本相对而言的。要确定成本是否真的较低,需要用到投入产出比(Return on Investment, ROI) 这一评价指标,即某次广告的总产出和总投入的比例。
1.4 在线广告表现形式
常见的广告形式有:
(1) 横幅广告:嵌入在页面中的图片或者动态素材,占据到一定大小的版面。
(2) 文字链广告:链接到广告主落地页的文字,是搜索广告的主流形式,在展示广告中也被广泛采用。
(3) 富媒体广告:利用视觉冲击力较强的表现形式,向用户侵入式地投放广告素材。富媒体广告常见的形式有弹窗、对联、全屏等。它比较适合在高质量的媒体做品牌性质较强的广告投放。
(4) 视频广告:广告为一段视频,信息的传播量和冲击力都大大提高。有关视频广告的效果评价,除了点击率外,还可以有用户观看时长等更直接的用户印象的指标。
(5) 还有其他的形式如:交互式广告、社交广告、移动广告、邮件营销广告、激励广告、团购、游戏联运等等。
上述这些广告产品和范广告产品往往在一家公司内部同时出现。最合理的分配方式是通过它们之间的竞价来决策。
2、计算广告基础
图2 计算广告基础
2.1 广告有效性原理
为了探讨用技术手段优化广告效果,我们先看看广告从用户接触开始是如何产生最终效果的。我们用一个三段式信息传播模型来解剖广告由物理上产生到最终产生转化行为的全过程,有效性模型如下所示:
图3 广告有效性模型
广告的信息接收过程分为三个大阶段,即选择(selection)、解释(interpretation)与态度(attitude),或者进一步分为六个子阶段,即曝光(exposure)、关注(attention)、理解(comprehension)、接受(acceptence)、保持(retention)与决策(decision)。
(1) 曝光阶段。这一阶段指的是广告物理上展现出来的效果。实际的广告实践中,会有 “位置为王” 的说法。如:纽约广场的广告牌。在互联网广告中,位置的影响有时会更加显著。因此,如何从算法上消除由此带来的点击率的偏差是一个重要的实际问题。
(2) 关注阶段。这一阶段指的是受众从物理上接触到广告,到意识上关注到它的过程。对广告而言,曝光并不意味着关注。
如何提高关注阶段的效率呢?首先,尽量不要打断用户的任务。这一点是上下文定向的原理基础,也是讨论原生广告产品的出发点之一。当用户明确辨识出某个固定的广告位,并且不再认为它与当前网页的任务有关联时,他会下意识地屏蔽其内容;其次,明确传达用户推送此广告的原因,这一点是受众定向广告创意优化的重要方向;最后,内容符合用户的兴趣或需求,这是行为定向的原理基础。
(3) 理解阶段。用户关注到了广告的内容并不意味着他一定能理解广告传达的信息。
如何提高理解阶段的效率呢?首先,广告内容要在用户能理解的具体兴趣范围内,这说明真正精准的受众定向有多么必要;其次,要注意设定与关注程度相匹配的理解门槛。如:对于互联网广告,我们应该集中强调一个主要诉求以吸引用户的注意力。
(4) 接受阶段。受众理解了广告传达的信息,并不表示他认可这些信息。如果表达的信息不适当,甚至有可能有三分之一的广告展示起到负面效果。
广告的上下文环境对广告的接受程度有着很大影响,同一个广告出现在某游戏社区上和门户网站首页上,用户会倾向于认为后者更具说服力,这也是优质媒体的品牌价值。在定向广告越来越普遍的今天,如何让合适的广告出现在合适的媒体上,即广告安全的问题,越来越引发关注。
(5) 保持阶段。对于追求长时间效果的品牌广告商,当然希望广告传达的信息给用户留下鲜明的记忆,以长时间影响他的选择。品牌广告商在创意设计上花了大量的精力提高这一阶段的效果。
(6) 决策阶段。成功广告的最终作用是带来用户的转化行为,虽然这一阶段已经离开广告的业务行为,但好的广告还是能够为转化率的提高做好铺垫。如:对于电商或团购业务,在创意上强调哪些信息以打动那些价格敏感的消费者,是有相当学问的。
定性的说,越靠前的阶段,其效果对点击率的影响越大;而越靠后的阶段,其效果对转化率的影响越大。
2.2 互联网广告的技术特点
不少在线广告有着不同于传统广告的特点。其中有些特点对我们正确理解在线广告市场,探究合适的效果优化方案,有着重要的指导意义。
(1) 技术和计算导向。数字媒体的特点使在线广告可以进行精细的受众定向,而技术又使得广告决策和交易朝着计算驱动的方向发展。在数字媒体上进行受众定向,其成本可以控制得非常低,这直接催生了在线广告的计算革命。除了受众定向,由于在线广告存在着独特的竞价交易方式,因而广告效果精确的预估和优化能力尤为重要。
(2) 效果的可衡量性。在不同的产品或时代,点击率绝对值的比较并没有那么重要,(如:从1998年到今天,横幅展示广告的平均点击率从10%降到0.1%,但是广告的效果并没有下降。) 而在一个特定时期不同广告和算法表现出来的差异,才是更有意义的。从这一点看。可衡量性任然可以认为是在线广告的一个重要特点。
(3) 创意和投放方式的标准化。在互联网广告中,需求方关心的是人群而非广告位,创意的尺寸的统一化与一些关键接口的标准化非常关键。
(4) 媒体概念的多样化。随着互联网的发展,赋予了更多交互功能的互联网媒体与线下媒体有了本质的区别。根据功能的不同,这些媒体与转化行为的距离也不同。越接近转化的媒体上的广告,其带来的流量就可以达到越高的ROI(投入产出比),同时离 “引导潜在用户” 这样的广告目的也就越远。因此,在从需求方看在线广告时,应该注重各种性质媒体的配合关系,并从整合营销的角度去审视和优化整体效果。
(5) 数据驱动的投放策略。广泛收集用户的行为数据和广告反馈数据,利用云计算的基础设施对用户打上合适的标签,同样根据数据在多个广告竞争同一次展示时作出决策,再将投放的结果统计数据反馈给广告操作人员以调整投放策略。
2.3 计算广告的核心问题
计算广告的核心问题是,是为一系列用户与上下文的组合找到最合适的广告投放策略以优化整体广告活动的利润。
上面的计算广告核心挑战可以用一个最优化问题来表达:
这里
表示从第 1 次到第
次之间的某一次广告展示。我们优化的目标就是在这
次展示上的总收入(
)与总成本(
)的差,即总体利润。对于某个具体的广告主K,有时存在预算的限制,有时存在投放量的保证,这就构成了上式的约束,即需求方约束。
当总体预算一定时,即
是一个常数时,很容易验证上式与
也是一致。则上面的优化问题可以写成:
其中的
这三个变量分别代表广告、用户与上下文,即广告活动的三个参与主体,显然,广告展示的收入与成本这三个因素都有关。在约束中,每次约束产生的成本
除了与
有关,还有具体某个广告主k有关。(这里假设整体的收入或成本可以被分解到每次展示上。)
(1) 广告收入的分解
在一次广告展示产生后,有可能产生哪些后续行为?
首先,产生的是点击行为,广告点击与点击展现的比率称为点击率(CTR); 点击行为成功后,将会打开广告主的落地页。落地页成功打开次数与点击系数的比例称为到达率,这是在广告主网站上发生的;如果用户从落地页开始,进一步完成下单等操作,则称为转化,转化次数与到达次数的比例称为转化率(CVR)。按照媒体网站和广告主网站上的行为对收入
进行分解:
其中
表示点击率,
表示点击价值,即单次点击为广告主带来的收益。前者描述的是发生媒体上的行为,后者描述的是广告主的行为。把这两部分的乘积定量地表示了某次展示的
。
一般指的是估计的千次展示收益,如果是千次的展示收入,用
; 如果讨论的是千次展示成本,用
。
(2) 结算方式与
估计的关系
由于广告市场协作关系复杂,并非每个广告产品都可以对
分解后的两个变量(
和
)作出合理的估计。根据
的分解决定由哪部分来估计是广告市场各种计费模式产生的根本原因,也是广告市场中商业逻辑与产品架构衔接的关键一环。
1、 CPT结算(Cost per Time)。这是将某个广告位以独占方式交给某广告主,并按独占的时间段来收取费用的方式。
2、 CPM结算(Cost per Mile)。即按照千次(mile)展示计算,这种方式是供给方与需求方约定好千次展示的计算标准。这是衡量广告效果的一种基本形式(不管是传统媒体还是网络媒体)。为广告每展现给一千个人所需花费的成本。按CPM计费模式的广告,只看展现量,按展现量收费,不管点击、下载、注册什么的。一般情况下,网络广告中,视频贴片、门户banner等非常优质的广告位通常采用CPM收费模式。
图4 视频广告前贴片
其中广告主是如何知道广告展现了多少次了呢?在网络媒体广告中,一般由两种方法获得数据:一、是所投放的媒介提供数据,或者媒体为广告主开一个后台账户,广告主可以在数据后台中看到广告投放期展现了多少次,数据来源为该媒广告页面的点击量(PV),产生一个点击,默认算展现一次广告;二、因为被投放广告的媒介处于利益相关方中,为了获得比较客观公正的数据,广告主一般采用第三方监测机构的数据。即由第三方监测机构在投放的广告中放置监测代码,来监测广告的展现、点击等数据。第三方监测机构收集到投放的数据,整理后提供给广告主,次数据为广告主、代理商、媒介三方承认的数据。
3、 CPC结算(Cost per Click)。即按点击结算。为多数效果类广告采用。在CPC结算方式下,点击率的估计是由供给方完成的。点击价值的估计由需求方完成,并通过出价的方式向市场通知自己的估价。
其中供给方通过手机大量用户行为数据,可以相对准确地估计点击率;而转化效果是广告主站内的行为,当然他们自己的数据分析体系也就能更准确地对其作出评估。典型的按点击收费的模式就是搜索引擎的竞价排名,如谷歌、百度、360、搜狗的竞价排名。在CPC的收费模式下,不管广告展现了多少次,只要不产生点击,广告主是不用付费的。只有产生了点击,广告主才按点击数量进行付费。
图5 谷歌广告
4、 CPS(Cost per Sale) / CPA(Cost per Action) / ROI结算。即按销售订单、转化行为或投入产出比来结算。在这种结算方式下,供给方或中间市场除了估计点击率,还要对点击价值作出估计,这样才能合理地决定流量分配。
5、oCPM(optimized CPM)结算。即广告平台仍然按照CPM结算费用,但会根据转化率进行优化。实践中,oCPM往往是向某个广告主提供CPM结算之前的一种过渡方式。对于新广告主,由于无法确定其转化率,直接采用CPA结算对平台来说风险较高,采用oCPM结算,可以鼓励广告主将自己的转化数据对接给广告平台,积累到一定转化量,从数据上判断CPA结算可行后,平台即向其开放CPA结算方式。
综合来看,对于效果广告,CPC结算最好;而对于品牌广告,可以考虑CPM结算方式;而CPS/CPA/ROI结算,只有在一定特定环境下才比较合理;oCPM则是数据能力较强的广告平台向CPA方式的过渡。
品牌广告(往往被人们称为“注意力经济”),旨在唤起消费者的注意及兴趣,树立企业或者产品的品牌形象,这需要大量资金的投入,广告的反复播放,以帮助消费者形成记忆。效果广告(可以称为“欲望经济”),针对的是最接近消费者购买行为的探索阶段(产生欲望),其表现形式与品牌广告完全不同,比如资金投入不再是大多数中小企业遥不可及的天文数字,广告效果成为可衡量,因此广告主也无需关心传统品牌广告系统中复杂的过程管理。效果广告中可衡量的行为可以是点击、下载、注册、电话、在线咨询,或者购买等,基本上可以归纳到CPA(Cost Per Action)的范畴。
作者:奋斗喵
喵星人,性格独立,充满好奇。尤其对机器学习领域相关事务和篮球游戏方面。目前就读于华中科技大学研究生三年级。感兴趣领域有NLP、推荐系统、计算广告等领域。希望未来的自己能成为一个高手高高手。
CSDN:https://blog.csdn.net/ganggesimida
3、面试算法题之剑指offer2:二维数组中的查找
3.1 题目描述
代码语言:javascript复制在一个二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。 请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。 样例: 输入数组: [ [1,2,8,9], [2,4,9,12], [4,7,10,13], [6,8,11,15] ] 如果输入查找数值为7,则返回true, 如果输入查找数值为5,则返回false。
思路:二分法,从右上角开始二分,小了往下走,大了往左走。直到找到输出true,找不到输出false。时间复杂度:O(N)
class Solution(object):
def searchArray(self, array, target):
"""
:type array: List[List[int]]
:type target: int
:rtype: bool
"""
if len(array) == 0 or len(array[0]) == 0:
return False
x = 0
y = len(array[0]) - 1
while(x < len(array) and y >= 0):
if array[x][y] == target:
return True
if array[x][y] > target:
y -= 1
else:
x = 1
return False
4、参考资料
(1)《计算广告-刘鹏》
(2)《剑指offer》
(3) 广告计费模式:https://www.zhihu.com/question/20416888
(4)品牌溢价:https://baike.baidu.com/item/品牌溢价