数据是人工智能底层逻辑中不可或缺的支撑要素,其重要性不言而喻。在主要的AI落地场景中,无论是自动驾驶还是智能客服,都需要海量的真实数据不断对算法进行优化,进而让系统的智能化程度逐渐提高。
除了数据,人工智能的背后也少不了算力和算法的支撑。如果非要给这三者排序,百度智能云数据众包资深产品运营师李明认为,应该是数据、算力和算法。
数据、算力和算法三要素缺一不可
数据:人工智能的根基是训练,AI也是如此。只有经过大量的训练,神经网络才能总结出规律,应用到新的样本上。如果现实中出现了训练集中从未有过的场景,则网络会基本处于瞎猜状态,正确率可想而知。因此,对于AI而言,大量的准确的数据十分重要,而且需要覆盖各种可能的场景,才能得到一个表现良好的模型。
算力:AI实际需要运行在硬件上,也需要学习推理,这些都需要算力的支撑。
算法:某种程度上看,算法的获取门槛并非很高。比如公开的研究成果、开源的网络代码、各种AutoML框架算法等等。
人工智能在应用场景的落地,需要进行场景数据采集,数据标注处理,促进算法优化和算法应用落地。数据、算法、算力驱动的人工智能,在各种应用场景落地使用,才能更好的赋能百态,促进各领域数字化,智能化转型升级。
百度智能云数据众包为各行各业智能化转型提供数据动能
人工智能行业架构分为四层:从下到上分别是基础层,技术层,平台层和应用层。其中基础层即海量数据、算法和算力。人工智能需要做到“感知、思考、决策”,那么就需要足够多、足够好的原始数据对计算机进行训练。“足够多”代表数据的数量要大,“足够好”代表数据的质量要佳,多元丰富的数据才能应对各种训练人工智能的要求。
随着新基建提速,人工智能行业步入快速发展时期,应用加速落地过程中,市场对海量基础数据的需求日益增强,主要有三个驱动因素:
整体AI行业的高速发展
AI应用落地时对数据的强依赖
无人驾驶等新兴AI应用场景的兴起
到2025年人工智能基础数据的整体市场需求将超过百亿元人民币,新基建浪潮下,百度智能云数据众包已经成长为国内最大的AI数据服务提供者,目前已全面覆盖智能驾驶、手机、互联网、AI开发者四大领域的头部客户。据艾瑞咨询《2019年中国人工智能基础数据服务行业研究报告》显示,百度数据众包业务市场占有率和营收规模稳居业界第一,新基建在进一步刺激人工智能行业快速发展的同时,也必将为百度智能云数据众包业务的高速增长创造新的发展机遇。
百度智能云数据众包——业界领先的一站式AI数据服务平台
目前在海量人工智能基础数据获取时,往往会遇到海量数据的综合采标和快速交付,数据安全、和数据质量等海量基础数据获取和使用时各种挑战。
数据安全方面:百度智能云数据众包实现了数据安全和数据合规的全流程管控,从数据合规、客户合规、用户合规、隐私合规四个方面,以及数据获取、数据加工、数据流出三个数据流转阶段,对数据隐私和安全进行保障;数据合规,即明确数据的法务合规范围和数据的确权;客户合规,明确客户(需求方)数据接入规范;用户合规,明确渠道/用户的资质以及使用规范;隐私合规,完善隐私数据授权链。通过对数据进行敏感度划分,并明确各渠道资源的安全资质等级,并以此为强依据进行渠道资源调配,并辅以声场过程监控管理,以此确保数据生产环节的数据安全。
采标能力方面:百度智能云数据众包建立起了业界第一的海量人工智能基础数据采标能力。通过自建山西标注基地,拥有了超过2000名的全职采标人员;构建了遍布全国乃至全球22个国家渠道代理资源池,拥有超过5万名线下采标人员;超过2000万名的众包互联网用户,随时响应客户的各类海量基础数据采标需求。除了资源能力的建设积累外,百度智能云数据众包也非常注重研发和技术投入,通过不断的技术创新和积累,百度智能云数据众包所支持的采标能力已经能满足市场上95%需求场景。资源+技术的采标能力建设模式,是的百度智能云数据众包在资源和采标工具建设上处于业界领先水平。
数据质量建设方面:百度智能云数据众包,建立起了一套标准化、工业化的生产流程和过程管理体系。在规范数据生产流程同时,标注生产环节以自动识别算法辅助标注效率和标注质量提升。
百度智能云数据众包已经成长为采标能力业界第一、流程标准化工具智能化、全流程管控确保数据安全的一站式AI数据服务平台。
百度智能云数据众包帮助了123家企业进行线上复工复产
新冠疫情期间,百度智能云数据众包依托业界领先的数据标注云服务平台,采用云分包模式,标注云平台+云端分包+远程办公协同(百度如流)方式,帮助123家数据标注企业3300余人复工投产,实现线上作业,远程办公投产,确保这些中小企业开工复产,促进了中小企业员工疫情期间正常就业。
此外,我们在山西太原的标注基地,已经帮助2000多人实现了本地就业,预计在未来5年内,通过基地的龙头示范作用,吸引数据标注相关产业汇聚山西,将为山西创造5万个就业岗位,为后疫情时代的稳就业、保就业提供强有力支持。
网友评论