导言:永洪首先提供了MPP列式数据仓库,同样硬件下,不亚于Spar编写的分布式统计程序效率。然后是透明的BI数据处理语言,而且同时支持SQL的语法。还有内制的数据工作流功能,包括简单的操作就可以与OLAP的数据系统对接,或是数据归集。如果说我们坐在终端,只需要一筛选就可以拿出这样的数据的时候,才可能是人人是分析师的时候——艾瑞咨询高级产品总监 肖嘉敏
首先恭喜永洪获得C轮融资,刚才听到何总的演讲,永洪的愿景是“释放数据价值,人人都是数据分析师”,听到何总的分享,我又喜又忧:何总的愿景是人人都成为分析师,而我就是分析师,可能那时候我要下台了。何总还分享在数据分析和数据挖掘、大数据领域的窘迫和问题,比如说之前的OLAP分析,这些窘迫对我来说的话,我深有体会,而且我也碰到过,都是让数据分析师做这件事是又累又赃,又全是坑的活。
我之前在阿里B2B的时候,我们BI部门有一个非常大的数据提取系统,叫做DW的数据库。你可以理解它是一个文件系统,深不可测,几乎所有二十几个分析师要求提取分析数据的东西里面都有。但是运营人员包括客服不会用,所有的东西还是要找到BI人工帮助他们提取,或者发需求来做。所以这是一个非常大的问题。
第二个窘迫叫做静态报表。做过咨询的同学可能会有一些经验,咨询动不动就给客户提供一个200页的PPT,以前可能大家都是默默的听,而现在的客户,我估计他首先让你提出几个点来讲,有什么效果出来怎么落地。所以这也是一个大的问题。
第三个问题,比如说IT部门。我一直标榜做数据,因为我自己是做数据,做分析人员,所以知道做数据和做IT的人员的沟通成本非常高。这些都是我做数据分析时遇到的问题,也是刚才何总讲的问题,正好可以解决一大批数据师遇到的问题。
企业大数据精细化运营之道,主要有三部分,首先第一部分,我们怎么选择永洪。第二部分,我们平常的项目当中是怎么用永洪的。最后一部分是永洪的优势。
一、我们是怎么选择永洪的
首先,数据能力。数据能力是现代企业的核心需求,我们碰到现在的这些企业基本上都会去讲这些问题,比如说他们要全方位的数据采集,员工要自服务数据分析的环境。以前我们所有的数据都是在数据库里面,我们提取就可以了,但是现在很多的数据源来自各种地方。其中监听、解读、快速反应客户在多渠道的反馈就是一个重要途径,这个例子就是特斯拉。特斯拉大家都有了解它的系列,他们是直接从设备层面就拿到数据分析,理论上是不需要经过IT部门和数据部门,所以说这个数据分析过程是一个真正的实时分析。像我们数据分析师做的分析,很多时候是一个离线分析,就是数据已经过了很久的进行分析和预测。
然后是数据技术,数据技术是前所未有的复杂应用,大家讲到大数据更多的是讲的大数据分析。其实除了大数据分析,我们还有很多的大数据商业,包括大数据应用,能够最终做到的是希望拿到多维的数据进行交叉分析,做完交叉分析和多维分析可以得到整个事情的全析。所以对于IT部门来说,大数据是充满了很多“坑”文化的黑科技。
艾瑞也成立了大数据部门,什么时候成立的?我们用了永洪之后,我们还有自己本身在数据处理过程中的很多问题,包括准确性达不到要求。所以我们专门成立了大数据部门来处理这类问题,当然有很多问题是新出来的。对于业务主管来说,大数据就是这几张统计报表,这也比较有体会,为什么?因为我们经常在做数据分析和数据挖掘的时候,尤其一些高层对我们的理解是你做数据分析,那么你就给我一些统计图表,这是以前的一些观念。而现在是我希望你给我一个实时分析系统,我不需要一个数据,我需要一个自定义的拖拉、交互、应用,可以看到实时可变化的数据。
二、我们平常的项目当中是怎么用永洪的
企业如何使用大数据提升竞争力?1.有价值。2.无毒害。3.易实现。企业使用大数据的时候,首先考虑的问题是投入产出比,我的投入有没有产出,大概什么时候可以产出(高层考虑)。那么对业务部门、执行部门来说的话,他会考虑到产出的增益,就是我投了多少价值会得到多少效果,需要多少人执行,需要多少台服务器,就是项目做完以后是不是这些问题都可以解决,出现新问题的时候有没有办法扩展解决。这是企业使用大数据提升竞争力的重要考量。
1.有价值
第一个有价值的是管理分析决策应用场景。以前我们的传统仓库无非是人和财,包括CRM、SCM、ERP、OLTP等,还有数据分析流程,首先你要拿到数据,你要获取数据,然后数据导入、收集,现在中小企业碰到很大的问题就是这样。就是我的数据怎么首先获取到?我的数据在哪里?有时候数据就暴露在网上,你要从上面收集过来,或者是用户的行为数据有没有检测到,包括调研数据等等类似的数据。获取数据之后我们要进行清洗,其实清洗非常复杂,而且方式方法也特别多,误差、归集、异常值等东西都是在传统的数据仓库里面不一定可以完全解决的。清洗之后会做数据的归位集成,然后预测模型或者是整理成一个数据标准,最后我可能要做一个模型、报告或者是一个数据应用。模型报告方面,我还要做预测等应用场景,然后给运营人员使用。其实这是传统的数据仓库。
那么混合型的大数据仓库时,我们现在碰到很多产品的思路都是这样,首先把所有的数据整理到这个地方去,我们需要做很多的分类,我可以把它全部整合在一起,之后可能我的IT可以全面监控所有的节点,包括市场中的分析,包括数据的存储方式都跟以前有所不同,包括现在分析人员的提取方式也有不同,最后我们在这个大平台上来实时的获取它,应用它。
第二个有价值的是广告营销及电商支持应用场景。我们讲大数据时,经常被人质疑的一点是你怎么变现?首先是广告营销。大家经常听到EC-ERP、EC-CRM系统。其实我们可以做到很多营销手段,包括销售渠道的监控和营销供应商KPI监控等等。那么电商大数据也是如此,国内的电商公司的数据管理和数据运用做的相对比较好,对于艾瑞这种公司,我们做的其中一点更多的是竞争监控。
我们在第三方竞争网站分析当中做的一些具体领域,也应用了永洪系统。没有用永洪系统之前,我们也尝试在做,只是我们提供的速度更慢。之前我们会提供一个报告给他,而现在我们会提供一个帐号给他,通过这个帐号直接查看你的竞争对手,可以看到用户的搜索分析,包括竞争对手在站内的分析,包括他什么样的人最喜欢在淘宝用什么排序方式来查看,有的人可能喜欢用价格排序,有的人喜欢用销量排序,可能也有人用其他的方式来筛选。包括最后的转化分析的漏斗分析,有多少人进来了,有多少人搜索了,有多少人转化购买了,甚至购买了之后放弃掉了等等都是电商领域做的竞争分析监控,包括他们自己做的客服分析,以及用户产品画像等等。
第三个有价值是产品增值创新应用场景。首先讲一下智能+,大家都知道互联网+,并对它很了解。比如说智能+可能会提供一个高杠杆的功能然后会有一个功能软拓展,最后达到产品溢价。比如说我给一个电饭煲加一个安卓系统,我可能会做这种很多类似的软件拓展,比如说特斯拉本来是一个制造业的汽车,但是我给它加很多东西,可能它就是一个高杠杆的功能,最后达到产品的溢价。还有内容+,大家都用过很多的电视盒子,本来是看电视直播的,现在我给它一个系统(装应用),利用互联网网络可以看电视直播,也可以看网络上的内容,比如说乐视、小米,他们是一些内容的软扩展,其实它打的是一些附庸的市场,最后得到了生态影响力。还有载体+、关系+就是做的社交圈。所有的互联网+,最终的目的是立足于原来有关产品,附加信息增值服务,以不可能的价格提供不可能的产品或服务。
2、无毒害
我们经常见客户的时候会质疑一点,我凭什么把我的数据放在你的系统中?我们还会经常碰到一个问题,我们有时候可能会说我们会用云服务器。还是一样的质疑会问你凭什么把我的数据放在阿里云上?放在亚马逊云上?这些都是数据信息的安全,而这些问题以前其实不会出现,为什么?以前大家不会上网这么多,我的行为记录也不会经常被记录。以前大家不会这么多的使用手机,以前大家买东西的时候是去超市排队,而现在更多的东西,我的家庭住址,我在网上买的什么东西,全方位的东西都记录下来了,所以数据信息安全的问题越来越严重。
比如说企业内部的安全性具体需求,我举两个例子。第一,我以前在阿里B2B的时候碰到一个问题,我们经常会说一个问题,就是阿里B2B的商户信息有可能比中国商业部的还全。为什么?因为一个小的公司,他可能还没在商业部注册,但是已经在阿里上展示了。里面会有商户的联系人、联系方式,这些东西泄露出去对他来说也是一个致命的打击。
另外一个例子,我们做华为项目的时候,华为对海外的联系人的方式也是一样的,他们之前比较少量的时候有可能放在电脑上或者是其他共享网盘里,比如说一个员工离职,可能这些数据就会被带走。华为的做法,它所有的数据,所有的电脑都是虚拟化的,也就是企业现行方案里面,你用一个显示器就可以了,你发的邮件可能三年之内的邮件都可以追溯。我们进去的时候,它担心的一点就是怕你拍照。其他东西基本上都在它自己的这套系统里面,你是永远带不出去的。
对于外部合作的安全性,广告领域用的最多。我们经常做的事情是单个企业方,我的数据可能在某一个垂直领域会很详细,很深入,但是我需要做一些事情时,更多希望跟其他的数据做一些碰撞和关联,那么关联的时候,我们经常会听到很多名词,比如说用手机号、社交号、邮箱号、超级ID、ID数等都是用户唯一标识,这些唯一标识如果跟别人做关联和碰撞,经常会出现这种安全性的问题。可能现性的企业解决方案就是做脱离处理,还有我不是特别了解的一些技术方案。
还有我总要用别人的产品,那么可能会有接入性的需求,这些都是无毒害的东西。
3.易实现
一站式的大数据应用。刚才前面讲的这些有价值或者是毒害的东西,假如说我很多的问题可以用一个办法解决,在一站式大数据的时候,可能前面的问题都可以迎刃而解。首先你要有一个数据仓库,这个产品需要提供数据仓库,包括结构化或者非结构化的应用,你还需要一个操作语言,怎么把它融合起来结构化的提取出来需要一种操作语言。然后你还要有一些逻辑应用的工作流来达到可视化BI的这种应用。最后你还要有安全接入的体系,你是不是有自己一站式的帐号体系。
最后,永洪产品的一些优势。
我先解释一下,我带的这个部门做的什么事情?我们以前是做数据分析和数据挖掘,并且我们很早以前也在做大数据这个东西。永洪主要是我们郝总带的大数据团队用的,我们的分工是怎样的?我们经常会有特别多的定制化的需求,客户来了一个需求,就要解决什么问题。以前我们直接上门装系统的时候,速度还是有一些慢。因为客户在描述他们需求的时候也不是特别的明确,我们自己需要去开发去尝试有什么问题。后来我们测试了一个环节,我们会把方案汇总起来,是不是考虑结合其他的产品,例如用永洪,比如说跟华为。但是在华为第二期的时候,它把数据发散了,我们还是觉得用永洪可以更好的解决客户的需求。
永洪首先提供了MPP列式数据仓库,同样硬件下,不亚于Spar编写的分布式统计程序效率。然后是透明的BI数据处理语言,而且同时支持SQL的语法。还有内制的数据工作流功能,包括简单的操作就可以与OLAP的数据系统对接,或是数据归集。如果说我们坐在终端,只需要一筛选就可以拿出这样的数据的时候,才可能是人人是分析师的时候。并且它还可以精确到数据字段帐号安全体系,隔离不同部门敏感数据。
以上都是我们在使用永洪产品的一些经验分享,我的分享就到这里,谢谢大家。
了解更多精彩内容,欢迎查看“2016永洪科技上海大数据峰会”专题报道:http://www.yonghongtech.com/plus/list.php?tid=60
网友评论