美文网首页首页推荐程序员
BI之SSIS入门、最新版Visual Studio调试技巧以及

BI之SSIS入门、最新版Visual Studio调试技巧以及

作者: 耕云种月_ | 来源:发表于2018-04-25 14:58 被阅读0次

    简介

    最近公司业务需要用到BI SSIS来处理商业智能和大数据,网上大多数是以前版本介绍,没有最新版,响应公司需要,现现学现卖总结一下入门及调试技巧,随便附加常用技术栈。SSIS是什么?“SSIS是Microsoft SQL Server Integration Services的简称,是生成高性能数据集成解决方案(包括数据仓库的提取、转换和加载 (ETL) 包)的平台。
    ”SQL Server Integration Services (SSIS) 提供一系列支持业务应用程序开发的内置任务、容器、转换和数据适配器。您无需编写一行代码,就可以创建 SSIS 解决方案来使用 ETL 和商业智能解决复杂的业务问题,管理 SQL Server 数据库以及在 SQL Server 实例之间复制 SQL Server 对象。

    1.1 入门

    新建,微软Visual Studio 最近版本新建就不用多说了,如图;


    image.png

    2 ,SSIS控件

    2.1,Variables

    (1) 参数设置,在Package设计页面空白处“右键”选择Variables,点击 image.png

    添加参数

    image.png (2)Expression设置,点击 image.png

    配置带函数的参数,选择所需要的参数直接拖动即可

    image.png

    2.2,设置数据连接

    (1)在Connection Managers窗口中“右键”创建各种Connection


    image.png

    (2)配置带参数的数据连接,选中创建的Connection后选择Properties窗口中

    Expressions配置连接参数,参数配置同上

    image.png

    2.3,Sequence Container

    容器控件,用来将相似的tasks分组,一般用来将所有维度表和事实表处理分开

    image.png

    2.4,Execute SQL Task

    image.png

    执行SQL任务

    image.png

    (1)选中控件,选择Edit

    image.png

    SQL Statement栏中配置ConnectionType(数据库类型),Connection(数据库),SQLSourceType

    SQLSourceType有三种类型:

    • Direct input ,直接在SQLStatement中输入SQL语句,若需要参数请用“?”代替

    • File connection,File类型连接

    • Variable,从我们配置的Variables中选择

    (2)配置SQL语句中需要的参数“?”,选中Parameter Mapping

    image.png

    2.5,Script Task

    image.png

    执行C#代码脚本任务,并返回成功或失败,

    (1)选中,右键Edit


    image.png

    选择ReadOnlyVariables,配置需要传入C#代码的参数

    image.png (2)编辑C#代码, image.png

    进入代码编辑界面

    2.6,Data Flow Task

    image.png

    数据流任务控件,在其编辑中可放入对数据操作的SSIS控件,

    2.7,Excel Source Plus

    image.png

    将Excel数据源导入数据库,在其Edit界面编辑需要导入的Excel数据源,点击[图片上传失败...(image-2c445-1524627024788)]

    添加新的数据源


    image.png

    2.8,Conditional Split

    image.png

    可以根据设置的条件函数处理数据,如对数据进行过滤、合并。在其Edit界面,

    • Order条件执行顺序,可上下调节

    • Output Name 输出名

    • Condition配置数据处理条件

    image.png

    2.9,OLE DB Source

    image.png

    OLEDB类型数据源,在其Edit界面配置数据源

    image.png New添加新数据库,Data access mode选择数据源获取方式,直接选取或者从Variables参数中选取,或者通过SQL语句获取,若SQL语句需要参数点击 image.png

    配置


    image.png

    2.10,Derived Column

    image.png

    向要导入的数据库表中派生列,其Edit界面

    image.png
    • Derived Column Name 派生新列的字段名

    • Derived Column 派生列的方式

    • Expression 新列字段值的表达式

    2.11,Lookup Plus

    image.png

    将其他数据库表中的字段值插入数据中,其Edit界面

    image.png

    Input Column 数据中要插入数据的字段名

    Reference 需要引用的数据,双击后进入其Edit界面

    image.png

    首先编辑其需要引用数据的数据库,选择数据库Table/View作为数据源或者通过SQL语句查询数据,Key Column为两表关联字段,Value Column为要插入的数据字段

    2.12,Data Conversion

    image.png

    数据转换,将数据类型转换为MSSQL的数据类型,在其Edit界面选择需要转换的字段即可

    image.png

    2.13,Row Count – Source

    image.png

    数据统计,统计处理的数据量,需要在Variables中定义Int32数据类型的参数来接受统计值

    image.png

    2.14,OLE DB Destination

    image.png

    OLE DB目标,数据导入的目标,其Edit界面

    image.png 配置好需要导入数据的数据库与数据表,若出现 image.png

    错误,请点击Mapping仔细检查数据字段匹配是否正确

    image.png

    3.0调试

    3.1 第一种调试方法

    image.png

    如图,再箭头上直接右键 选中Enable Data Viewer,这样运行到这里会停止,并且能看到详细数据情况如下图,点击继续往下走。


    image.png

    3.2 第二种调试方法

    image.png

    如图,在package执行时,会出现一个progress显示执行的进度

    3.3第三种调试方法

    image.png image.png

    选中Execute SQL Task,点击右键,选中Edit Breakpoint来设置断点,进行调试。运行到这里会断点

    3.4第四种调试方法

    image.png

    package 事件调试,可以在事件选中指定事件,当错误出现时,发送runtime的错误信息或将错误信息写入文档,方便捉错误信息。

    4.0 其他

    注意,下面部分来自网上

    Control Flow 控制流程

    Containers 容器

    Core Task 核心任务

    Other Task 其他任务

    Data Flow 数据流程

    Transforms 传输

    Sources 数据源

    Destination 目标

    相关文章

      网友评论

        本文标题:BI之SSIS入门、最新版Visual Studio调试技巧以及

        本文链接:https://www.haomeiwen.com/subject/vgvelftx.html