美文网首页数据-R语言-图表-决策-Linux-Python
SAS到R财务数据迁移:教训和示例

SAS到R财务数据迁移:教训和示例

作者: Liam_ml | 来源:发表于2018-11-18 19:28 被阅读10次

    近年来,R在金融服务等行业中越来越受到数据专业人士的欢迎,例如在执行搜索公司Burtch Works的调查中所示。在这篇博文中,我们分享了将SAS迁移到R以获得金融服务工作负载的一些关键考虑因素。更具体地说,我们将关注迁移的数据操作方面。

    SAS和R之间最重要的区别之一是如何处理数据。以计算两个变量之和的过程为例,由下面的SAS和R代码显示。


    image.png

    SAS使用Data Step中的隐含循环逐行处理数据。下图显示了如何对包含3行的数据集执行操作。它首先计算第1行的总和,将第1行的结果写入输出表,然后对第2行进行计算,并重复此直到数据集的结尾。假设数据已经按变量“x”排序,SAS还记录第1行是x = 10的第一次出现,第2行是“第一次”出现x = 10的最后一次。并且“最后”。声明,分别。这在仅应在输出数据集中保留第一个或最后一个匹配项的情况下非常有用。

    image.png

    另一方面,R通过同时处理所有行来应用列级别的函数,如下图所示。由于R按列处理数据,因此它没有SAS“第一”的相应功能。或“最后”。

    image.png
    由于SAS和R之间的差异,将SAS程序转换为R的最佳方法之一是首先了解SAS程序块正在做什么,然后在R中重写代码。为了说明这一点,我们总结了几个场景并发布了他们作为3个Jupyter笔记本进入Cortana Intelligence Gallery,以便您可以在Azure Machine Learning Studio中测试R代码。这些笔记本涵盖了金融行业的一些常见业务场景,例如按帐户计算拖欠和按帐户计算总费用。在这些示例中演示了一些重要的技术概念,例如SAS“保留”,“第一”和“最后”语句以及R的apply()和sapply()函数。

    相关文章

      网友评论

        本文标题:SAS到R财务数据迁移:教训和示例

        本文链接:https://www.haomeiwen.com/subject/pungfqtx.html