作者 | 邬学宁、汪科科等
编辑 | 张慧芳
题图 | 站酷海洛
10月26日,第一财经旗下DT财经发起的数据社群——数据侠联手复旦大学大数据研究院人文社科数据研究所,共同举办以“大数据商业应用解析与未来展望”为主题的公开课。
课上,复旦大学人文社会科学数据研究所科学数据中心主任殷沈琴(主持人)、复旦大学大数据研究院副院长薛向阳教授、复旦大数据研究院人文社会科学数据研究所常务副所长张计龙教授、SAP硅谷创新中心首席科学家邬学宁以及中国电信大数据产品经理汪科科参与了圆桌讨论,针对大数据商业化的现状、存在的问题以及未来发展方向,分别从学术界和商界角度进行了一次精彩的讨论。本文整理自活动圆桌论坛,下面DT君将带领大家了解下大数据的商业化之路。
IDC研究表明,全球大数据的产业规模到2025年会达到1200亿美元以上。另外,国内诸如信通院的研究也预测,到2020年国内的大数据产业规模会突破万亿。在这样的背景下,大数据的经济价值炙手可热,如何将大数据商业化也成为业界不断被提及的话题。
(图片说明: 大数据全球与中国市场规模数据,因不同机构的不同统计口径,数据差距较大)
▍大数据商业化现状及挑战
圆桌论坛的开篇,主持人殷沈琴就对另外四位嘉宾提问道:大数据商业化的现状如何?当下存在的阻碍又有哪些?
邬学宁:数据是新的石油资源
“数据和石油有很多共性,但是又有本质上的不同,石油是不可再生的资源,而数据是可以反复利用的资源。”SAP硅谷创新中心首席科学家邬学宁在讲到数据的本质时说到。
邬学宁提到,人类在历史上做科学研究经历过四个范式,从实验测量开始,经过数据分析以及数值模拟,直到2008年,人类开始进入数据科学研究领域,也就是现在常说的“第四范式”。
他认为,大数据最早应用于科学研究,是用于医学研究,随着时代发展进而进入商业世界,到了现在,大数据的应用简直无处不在。
课上,邬学宁举了他实战中一些有趣的项目:通过POS机交易数据分析,不懂新零售逻辑的人员也可以告诉百货员工该放什么产品,或者什么产品能带动另外一款产品的销量,比如车厘子能带动山东桃子的销量;加拿大的一个石油公司在海上设置的设备失效率较高,且等失效后进行新设备运输和更换的成本较大,大数据背景下,人员可以通过预测性算法,获取下个月设备失效的概率,在运送补给时将更换设备提前进行运输,极大地节省成本;再比如通过获取巴塞罗那智慧城市中垃圾桶的传感器数据,从而及时感知垃圾桶是否已装满,然后提前派垃圾车进行清理……
邬学宁说,像这样通过数据分析来帮助城市或者人节省成本、减少浪费的例子还有很多,这些应用也再次验证数据商业化的魅力。
薛向阳:需合法利用大数据
复旦大学大数据研究院副院长薛向阳教授在大数据研究上颇有建树,他首先对大数据的现状做了阐述并肯定大数据对于商业的价值。他提到,如今大数据发展极快,无论是学习、教学还是研究范式都离不开大数据,但是纵观发展,他认为技术是把双刃剑。
近日Facebook数据泄露问题日渐严重,不法分子出售隐私数据现象频出。2018年5月25日,欧洲联盟出台《通用数据保护条例》(General Data Protection Regulation,简称GDPR),被称为史上最严个人隐私信息保护法;国内部分互联网企业也因此无奈从欧洲撤退,数据隐私被法律正式带上舞台。
(图片来源:视觉中国)
针对这种情况,薛向阳教授认为,一定要冷静对待大数据,需从技术、法律等多方面降低新技术产生的负面效应。
张计龙:大数据时代对研究思维产生了根本性变化
传统研究和数据科学研究最大的不同是,传统研究先提出假设性结论,然后不断通过调研、采集数据等验证假设,而数据科学研究则是通过数据分析获得最终结论,复旦大数据研究院人文社会科学数据研究所常务副所长张计龙教授在提到数据科学研究时说到。于他自身来说,数据科学研究从根本上改变了学习人文社科方向的他的思维模式。
整体来说,大数据在中国的发展仍处于起步阶段,目前也面临着较多挑战,张计龙教授也从以下几个方面做了分析:
技术问题
技术挑战是最大的挑战,张计龙教授说到。无论是做研究、分析数据的存储传输、可视化分析亦或是数据脱敏等,技术是实现数据分析的前提。他提出,数据分析是交叉性学科,需要综合性地解决数据应用问题。
应用落地问题
“大数据的‘大’是高大上的,你能拥有它但不一定能处理它。”
张计龙教授以自己为例,“我是学人文社科的,假如我不需要学习计算机就能很容易上手,又或者是中文系的老师不用亲自学计算机,写大数据就能运用它”,这对于学术界或者是商界都是非常大的便利。他认为大数据的应用落地是目前比较困难的挑战。
数据环境保护问题
和前文薛向阳教授提出的数据保护一样,张计龙教授也认为数据安全利用和隐私保护是目前大数据商业化的一大挑战,“我们必须重视这个问题,需要保护数据的整体环境。”
值得一提的是,国家层面对数据管理及保护非常重视。今年4月份,国务院办公厅印发《科学数据管理办法》,进一步加强和规范科学数据管理,保障科学数据安全,提高开放共享水平,更好地为国家科技创新、经济社会发展和国家安全提供支撑。
数据人才问题
据清华数据统计,目前市场上大数据人才的缺口达到180万,即使近两年有35所高校开设数据科学和大数据专业,张计龙教授依然认为,数据人才还是处于比较紧缺的现状。因此,张计龙教授呼吁大学生应进行综合性学习,多多参与进来。
汪科科:数据市场冷热不均,未发挥真正作用
作为拥有海量数据的电信运营商角色,中国电信大数据产品经理汪科科直观地从变现角度为大家分析了数据的现状。他认为,目前数据市场冷热不均,数据变现也开始“踩刹车”。海量数据从数据交易所或者交易中心被拿出来后并没有专业的流程和机构去合理利用,这是一个螺旋式上升的的过程。
汪科科提到目前贵阳、上海、浙江都成立了大数据局,各地政府陆续将数据管理纳入政府管理,很多政府基层也提出用数据的方式治理城市。这就表明外部环境和对大数据的需求已经日渐成熟,尤其是目前在广告精准营销上的运用较为频繁和熟练,但由于部分人运用不合理,导致黑市数据泛滥,影响大众正常生活,这是大数据现阶段遇到的一个大问题。
(图片来源:视觉中国)
其次,汪科科也提到了数据人才缺失的问题,建议高校同学应多参加诸如SODA大赛之类的数据比赛,实践出真知,将所学知识应用到实际中才是最重要的。
▍大数据商业化未来发展方向
邬学宁:未来需解决数据所有权问题
针对大数据的发展现状和问题,主持人殷沈琴向嘉宾提出了关于大数据商业化未来发展方向问题。
隐私保护是未来重要发展方向,但是改变大众和企业认知也尤为重要。邬学宁提到国内大部分人对数据隐私的看法时说到,很多中国用户认为用数据换取一些便利的事情是理所当然的,数据隐私意识不强,因此在未来,改变大众认知非常重要。另外,企业层面容易形成数据孤岛,这与大数据的发展是相悖的,只有高维度的数据结合在一起才能保证大数据良性发展。
针对容易出现的数据孤岛,邬学宁也给出了自己的看法——区块链。目前中国用户的数据正在变成大公司的护城河,而用户本身拿不到钱,他认为,利用区块链技术通过智能合约解决数据所有权问题是目前最行之有效的方法。
张计龙:数据人才需要理论和实践相结合
扩张数据人才数量是大数据商业化未来发展方向的另一大重点。张计龙将这类人才称为“学霸”,他强调数据科学必须要理论和实践相结合,因此高校人才经常参加相关性数据大赛是最直观的理论知识应用方式。
汪科科:大数据产业需健康发展,遏制“转基因”因素
大数据目前已经不处于热点词行列,大数据更像是一片土壤中成长的树,近两年比较火的AI更像是树上结的果。汪科科认可“科技发展过快,容易产生对社会不利的因子”这句话,他认为大数据未来必须是按照正常路径健康发展的,而不是在“树”茁壮的过程中加些“催化剂”。另外,汪科科建议高校的学生需要能够理解应用,也要能开发出一些挖掘类的大数据基础软件。
圆桌最后,殷沈琴老师表示了对汪科科看法的认同,她认为这是具有前瞻性的看法,我们在运用大数据时需要关注人类的命运走向。
注:以上所有内容根据数据侠复旦公开课主题圆桌讨论整理,仅代表圆桌嘉宾观点。
期待更多数据侠干货分享、话题讨论、福利发放?在公众号DT数据侠(ID:DTdatahero)后台回复“数据社群”,可申请加入DT数据社群。
▍数据侠门派
殷沈琴,复旦大学人文社会科学数据研究所科学数据中心主任、上海人口数据实验室副主任。
邬学宁,SAP硅谷创新中心首席科学家,复旦大学人工智能客座讲师,数据科学50人成员;致力于机器学习与人工智能算法研究,在全球零售、金融、制造、医疗、智慧城市等不同行业拥有丰富的利用大数据进行产品与商业模式创新的经验,著有《SAP企业机器学习》。
薛向阳教授,复旦大数据研究院副院长。研究领域包括:多媒体内容分析、检索与过滤、视频监控、机器学习等,先后承担国家地方科研课题 28 项,作为负责人的课题 23 项,其中包括 2004 年上海市科委重大科技攻关课题 1 项和国家自然科学基金重点基金 1 项;在国内外重要学术会议和期刊上发表论文 70 余篇,半数以上被 SCI 、EI 检索。
张计龙教授,复旦大数据研究院人文社会科学数据研究所常务副所长,2008年起任图书馆副馆长,2002年至2008年期间担任复旦大学信息办信息中心副主任,研究领域为信息化校园、IT项目管理、数据库与知识库、数字图书馆、科学数据管理。
汪科科,2016年SODA大赛冠军团队队长,目前就职于上海电信大数据运营中心,担任中国电信大数据产品经理。
▍加入数据侠
“数据侠计划”是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。了解数据侠计划详情请回复“数据侠计划”,申请入群请添加DT君微信(dtcaijing003)并备注“数据社群”,投稿、合作请联系datahero@dtcj.com。
网友评论