美文网首页
TempoAI详解—企业数据挖掘成功之道(工具篇)

TempoAI详解—企业数据挖掘成功之道(工具篇)

作者: Tempodata | 来源:发表于2019-05-17 17:02 被阅读0次

    企业在大数据时代下如何与时俱进地把握商机、实现更快速的发展?关键在于企业如理利用已有的数据,挖掘数据价值,让数据说话,真正为企业业务决策提供科学依据。

    企业如何挖掘数据价值

    今天给大家介绍一款神奇的数据分析工具--TempoAI。TempoAI是一款面向企业的一体化分析软件产品,助力企业通过数据分析挖掘企业内部新的业绩增长点,在新一轮竞争中抢占先机。TempoAI完整覆盖数据接入、模型构建、流程洞察、成果部署等数据价值发现全过程,同时辅以图形化、拖拽式的建模体验,让用户无需编写代码,即可实现对数据的全方位深度分析和模型构建。实现数据的关联分析、未来趋势预测等多种分析,帮助用户发现数据中隐藏的关系及规律,为企业提供数据分析与应用解决方案。

    TempoAI的前世今生

    TempoAI是美林数据自主研发的一款大数据分析平台,其前身是2010年就已上市并取得巨大商业成功的Pluto数据挖掘平台。TempoAI在Pluto基础上以最新的大数据技术为基础,并依据企业数据挖掘落地的需求,不断迭代更新,已更新至3.0版本。近10年时间已经为制造、金融、能源、教育、零售等行业客户提供了数据管理、分析展现、深度挖掘的数据运营方案,帮助企业实现内部业务信息系统数据化,数据价值化的全面升级。

    TempoAI的功能

    TempoAI支持对海量数据进行模型构建、模型评估、模型利用及模型成果管理及应用,包括流程发布及结合业务调用流程。主要包括三大功能模块:建模、洞察、部署。

    建模

    整个建模流程设计基于拖拽式布局、连线式流程编排和指导式流程配置,用户可以通过简单拖拽、配置的方式快速完成挖掘分析流程构建,丰富的数据处理、算法及图形支持,让用户能够灵活的运用多种处理手段对数据进行预处理、同时采用多种算法以选出最优算法及参数设置,结合使用丰富的图表分析功能以满足建模需求,挖掘数据隐藏价值。

    洞察

    用户可以在洞察模块全方位观察建模过程及模型结果,通过洞察信息能够为有效改进建模提供依据,提升模型有效性和模型精度。用户对于挖掘流程中的任意节点,包括数据接入、数据处理、模型建立评估等,在平台的洞察中均可以实现交互。丰富详实的洞察内容,帮助用户轻松获取隐藏在业务数据中的规律和模式。

    部署

    TempoAI部署模块将设计、验证后的流程投入生成使用,通过发布挖掘流程,将设计后的流程转移到生产环境,待后续投入生产。TempoAI提供多种方式应用发布的流程,包含调度、异步服务、同步服务、流服务等。调度:平台提供任务调度器,可配置调度任务,将的一个或多个流程在指定的日期范围内按一定的频率定期执行,完成建模或预测任务。用户可将已发布流程构建一个服务,根据流程数据源的不同,分为同步服务、异步服务和流服务。同步服务:支持第三方系统通过Thrift/Rest调用流程,实时返回预测结果。异步服务:支持第三方系统通过Rest调用流程,按照指定频率定期执行,完成模型构建或数据预测,预测结果输入到指定数据库。流服务:开启服务,当Kafka的队列中有消息时,即可执行流程,完成对于流式数据的实时处理。

    TempoAI到底强在哪里?

    1.丰富的数据源支持

    支持Oracle、Mysql、SqlServer等主流关系数据库,Impala 、Sparksql、presto等大数据引擎,Hdfs、Hive、Hbase等hadoop数据源,GP、GBase 等MPP 数据库,支持以API接口和脚本方式接入外部数据,支持kafka流式数据,Csv、Excel、Txt文本文件等作为挖掘分析的数据源。支持数据访问权限配置,确保企业数据安全。

    2.极简的建模过程

    整个建模流程设计基于拖拽式布局、连线式流程编排和指导式流程配置,用户可以通过简单拖拽、配置的方式快速完成挖掘分析流程构建,丰富的数据处理、算法及图形支持,让用户能够灵活的运用多种处理手段对数据进行预处理、同时算法的多样性也为用户建模提供了更多的选择,结合自动学习功能帮助用户自动推荐最优的算法和参数配置,以满足高效建模需求。

    3.丰富的分析算法

    集成了大量的机器学习算法,支持聚类、分类、回归、关联规则、时间序列、综合评价、协同过滤等多种类型算法,满足绝大多数的业务分析场景;支持分布式算法,可对海量数据进行快速挖掘分析;同时内置了美林公司独创十余种算法,如视觉聚类、L1/2稀疏迭代回归/分类等;支持自然语言处理算法,实现对海量文本数据的处理与分析;支持深度学习算法及框架,为用户分析高维海量数据提供更加强大的算法引擎;支持多种集成学习方式,帮助用户提升单个算法的模型准确度。

    4.智能化的算法选择

    平台内置自动择参、自动分类、自动回归、自动聚类、自动时间序列等多种自学习功能,帮助用户自动选择最优算法和参数,一方面降低了用户对算法和参数选择的经验成本,另一方面极大的节省用户的建模时间成本,提升建模效率。

    5.文本挖掘功能

    TempoAI集成了分词、信息抽取、文本过滤、主旨话题分析、关键词提取、观点情感分析、垃圾违禁信息检测、文本摘要、词频统计、主题模型合并等中文文本挖掘算法,让用户能够对中文文本数据进行挖掘分析,发现数据价值,从而实现业务价值。

    6.高效的模型应用

    挖掘后生成的模型,不是仅仅止步于模型,全面支撑模型的部署与利用,用户在完成挖掘流程发布后,可生成数据服务,供第三方系统应用。平台提供两种方式接入生产环境:调度任务和接口服务两种方式。调度任务:用户可以将流程嵌入到一个定时任务中,按照指定频率定期执行流程,完成实时模型构建或数据预测;接口服务:用户将流程发布为RESTful服务接口,供第三方系统实时调用完成模型训练或数据预测。

    7.完善的断点缓存机制

    平台提供节点的断点缓存机制,包括开启缓存、关闭缓存、清除缓存、从缓存处执行、执行到当前节点、从下一个节点开始执行等功能,为用户在设计端优化建模流程,提供高效便捷的手段,显著提升了用户的建模效率。

    8.模型管理闭环

    TempoAI支持对构建的挖掘模型进行评估,同时提供行业内标准的模型评价指标,给出最优模型,同时能够在建模过程中,对模型进行输出、读取、利用,模型库支持输出模型的分类检索、版本管理、模型描述、模型查看、删除等,形成模型管理的闭环。

    9.灵活的扩展机制

    支持用户编制SQL\R\Python\Java\Scala脚本实现个性化的算法脚本。自定义算法功能允许用户通过R\Python\Java\Scala基于平台规范封装自主算法并发布形成平台节点,方便用户灵活扩展平台算法节点功能,增强平台的业务适应能力,充分满足企业级用户的个性化需求。能够灵活的融入企业现有业务系统,基于分析成果快速构建专业数据智能应用,无缝整合第三方系统。

    TempoAI有免费为其用户开放微课堂视频课程,介绍一些算法和分析方案,还是很不错的可以关注公众号Asktempo了解详情!还可以免费申请试用,大家不妨尝试试用一下!一定会有收获的哦!试用链接:http://www.asktempo.com/Tempodata/try.html

    相关文章

      网友评论

          本文标题:TempoAI详解—企业数据挖掘成功之道(工具篇)

          本文链接:https://www.haomeiwen.com/subject/bzjnaqtx.html