尼尔森网联(尼尔森网联张弘)不要告诉别人
3月初,尼尔森网联(Nielsen • CCData)高级副总裁兼首席技术官张弘在浙江省云计算大数据产业推进大会上发表了精彩的演讲,详细介绍了尼尔森网联如何打造中国数字媒体的大数据闭环。
3月初,尼尔森网联(Nielsen • CCData)高级副总裁兼首席技术官张弘在浙江省云计算大数据产业推进大会上发表了精彩的演讲,详细介绍了尼尔森网联如何打造中国数字媒体的大数据闭环。
人物名片张弘,现任尼尔森网联(Nielsen • CCData)高级副总裁兼首席技术官,兼任工信部、国家新闻出版广电总局主持设立的多个国家级科研项目专家组成员,及数据研究领域国家标准委专家委员张弘先生自2006年起即开始涉足数字媒体、互联网跨屏、广播和数字音频等领域的媒体监测和研究,同时其本人也是中国最早致力于家庭大屏领域研究的先行者之一。
在媒体大数据监测和测量仪研究领域,其主导、参与的的国内外发明及专利近50项,并在国际权威学术刊物中发表多篇媒体研究领域论文以下为演讲实录
众所周知,尼尔森是目前全球范围内最大的市场研究公司,其业务覆盖了全球70%数字广告监测,全球40%电视收视监测,以及85%的广告花费,另外会有超过400亿条的线上和线下的交易数据在中国,尼尔森通过拥有的商超数据、电子商务平台数据、媒介数据等,实现从更多的视角来发现媒体和消费之间的关联。
我今天不会展开去讲过于空洞的框架,就用实例,展示一下我们在媒体研究领域,怎么样去给大数据服务数字营销的任务就是DSP、DMP要更好的对我的目标客户产生广告的触达;而我们的任务,就是检查他们的绩效,有没有做到这一点?那么怎么去检查呢?。
个人媒体解决方案先看一下这个例子,现在的互联网,包括移动互联网和PC互联网,在过去监测的时候,PC和手机有多少次触达、多少曝光、多少点击率,大家都经常听到这样的名词;但是有一个问题,移动互联网的繁荣,让每一个人拥有了多个设备,一个人有了2个手机、1个Ipad,还有1台PC,这样的话,他在接受互联网监测时候,会面临两个问题,第一是,我不知道这4个设备,是否属于同一个人,如果不属于,那么它其实是相当于4次的曝光,实际是一个人,应该只有1次有效的触达。
第二个就是说,他背后的人到底是谁?这是一个难题所以我们可以看到,我们知道PC的曝光5千万、移动互联网1千万,但是中间有重叠率,加起来肯定比3500万要小
我们在去年年初推出一个产品叫DAR,这个产品在美国运营了2年多的时间,叫OCR,在美国是和Facebook和Twitter这样的公司合作,在中国我们是跟腾讯合作我们怎么去解决这两个问题呢?你在PC或手机上登录的时候,你的QQ号和微信号是同一个,当我们用广告监测的时候,我们会在在接收到数据后做一个二次定向,并打开他们的cookie,这样就知道这个手机和这个PC是同一个QQ号,以此推及是否是同一个人,从而解决去重的问题。
第二,基于大量的数据积累,策划媒体的属性,策划的人群占到中国互联网的70%到80%,所以它的用户标签的丰富性是非常强的通过这两个角度,我们既可以划分去重,又可以达到用户真实的一个深化水平标签大数据的重点应该在哪里?我们一看到大数据,往往会说大很重要。
我们认为大数据最重要的是数据质量,数据的可关联性很重要,而算法和实际应用、数据体量,是相对靠后的,因为你如果没有好的质量和可关联性,你的数据是一个孤岛,它形成的结论和结果,往往会产生大数据大误差但是如果可关联,那又会产生隐私的问题;这个在美国的个人隐私法中比较强调,中国现在的立法也越来越完善。
其实我们解决这个问题,也可以给大家提供借鉴和思考,在这个关联过程中,我不会去了解一个用户具体是谁,他的QQ号是多少?也不会有人知道知道我这个广告的ID到底对应的是哪个广告哪个品牌这个隐私涉及两方面,一方面是对个人的隐私,另外一方面是对企业主的隐私。
我们有一个标准是达到多少量,或者是隔一天才能够把全部的用户花费比例的数反馈回来,然后来实现商业应用但是具体的我们不会去知道,某一个用户具体的情况,这个叫大数据的关联,关而不联
达到这个量级,我们和合作伙伴共同拥有大概6.8亿的用户在合作的机房中,我们会有专业的服务器机组,专门处理这些数据,所以由我们来决定哪些用户打什么样的标签,大概是4.5亿到5亿的用户是活性比较强的过去我们只是在互联网做一个平行的调查,大概200万就是很多的量级了;实际上在广告监测中,这200万和我这一次广告触达的用户,可能根本就不是一波人,只是平行样本,所以这不是很靠谱。
现在我们的技术条件和数据交互的基础存在,所以我们现在可以有4.5亿这样的互联网群体那么给我们带来最直接的效益是什么?我们也知道,现在电商的营销广告或者一些企业广告越来越下沉,因为消费者在一线二线的城市的市场基本比较饱和了,现在都在消费下沉,到三四线城市去了。
但是如果只基于200万用户的样本去做的话,可以看到它的样本误差率可以达到13.6%,如果你的决策如果基于这样的数据来做的话,你的努力很可能被误差吞噬了但是如果你是在4.5亿这样的规模的话,统计学误差只到0.65。
目前这个产品,已经有超过600广告活动,更多的是6大行业,还有13个广告代理,现在总的监测量超过700亿,包括移动端和互联网端的。
这个产品是全球化的,对于全球客户,在做全球绩效的时候,可以很好的用同一个技术标准去做,也是最近宝洁提出来MRC的要求,就是可见性原理互联网的媒体,它虽然在投放上可以得到很大量的触达,但是往往也有些假流量产生了一些非真实的人看到广告,所以MRC的标准用户,一定是可见的,然后广告有时间长短,我们这一套体系,完全符合这一标准。
在美国或其他国家是和Facebook合作,在中国我们和腾讯去构建这样的标准数字家庭媒体解决方案
刚才讲到的是移动端,我们知道移动互联网是PC、手机等个人媒体的触达;但是现在面临一个问题是,智能电视或电视是一个分享媒体,电视开了之后可能是一家人在看,我们要去知道现在是几个人,然后才能够知道,这个人被触达的这个电视广告,同时他又被其它媒体触达的另外几个广告是同一个广告。
在过去我们做收视率的时候,都是很传统的方法,可能5个人的数据,就会影响到1%的收视数据我们现在在中国,收视率这一块有800多万的机顶盒的数据量,所以这个数据更靠谱些
今天我们在谈云计算,我们只是在这个基础之上应用了数据资源和关联数据,在做大数据方面做了深度的应用,相关的技术在国内和美国也有相关的专利,这也是比较新的一个尝试。
但是很好的解决了一个什么问题呢?因为智能终端底层的数据,依然是可以更高的,数据媒体监测全部都打通了,因为现在可以和MAC地址匹配到30%,它的规模样本很大所以最重要的一个问题就是,过去的媒体监测,说要跨屏,其实“跨屏”跨的是人。
大屏是把它分解到人,最后从人的纬度去解决,然后关联到不同的媒体去做监测
最后实现4屏的跨屏结合,目前这个产品已经在上线在运行。
这是现在的一些数据,这是全国智能电视覆盖网的统计数据。
这是他的使用习惯。
我们可以细分到一些习惯和特征的大数据挖掘和分析刚才我们讲到的,从用户外围的使用或行为的角度去看,实际上我们会发现一些内在和潜在的因素,原因是很难从大数据分析看到大数据可以很好的解决相关性,但是解释因果问题比较困难。
另外我们发现在经济下行之后还有另外一种现象,就是酱油和安全套去年年底我们发现中国整个经济下行的情况下,这两个产品卖得非常好,日本也发现同样的现象,为什么呢?其实在经济下行的时候,大家对经济预期降低,然后在家里做饭的概率高了,所以酱油用得多了,对生孩子的成本和对未来产生的顾虑和担忧,所以安全套的销量提高了。
从人的大脑角度,你的营销做得再好,你的广告做得再好,但是你的广告片本身如果做得不好,让用户产生反感,那结果可能适得其反。
我们在8年前,跟加州大学建立了实验室去共同做这一块的研究,但是在过去的一二年时间我们取得了比较大的成功。全球在过去5年,脑电波方面的研究成果,已经超过了过去5000年。
一个人在看到你的广告,或者内容或者平面或者一个产品的时候,他的第一反应是什么?然后会有30几个触点去测到他的情感程度、记忆度、关注度,关注度不是越高越好,因为有的时候关注度高,是因为他看不懂所以我们在电脑、PC、手机上,不同大小屏幕的平台上去播同一个广告,去测这些目标客户的时候,会发现在不同屏幕上,同样的创意结果也会不一样。
我们刚才讲的,从行为角度、数据角度来看,这个测量是从人体的角度,每个小时产生的数量大概是1T/人,所以通过这样的研究,我们就可以发现一些更深层次的因果关系,来补充大数据方面的相关性之后,可以从因果角度来讲。
免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186