美文网首页Power Query
Power Query 系列 (13) - 自定义函数

Power Query 系列 (13) - 自定义函数

作者: Stone0823 | 来源:发表于2019-10-20 19:10 被阅读0次

    本篇博客介绍 Power Query 自定义函数的技巧,在 PQ 中计算个税。

    以工资类所得应交个税为例,最新的个税起征点为 5000 并按下表的级次进行缴税(假设没有其它扣除项)。


    image

    对照税率表,我们先看看手工如何计算。比如 xxx 的薪资为 8900,没有其它扣除,那么应缴纳的个税为:

    1:  应纳税所得额 = 8900 - 5000 = 3900
    2: 3900 对应级数为 1,应纳税额 = 3900 * 10% - 210 = 180
    

    接下来介绍在 PQ 中如何通过自定义函数来计算。有下面两个表:税率表(TaxRate)he员工薪资表(salaries),要计算张三和李四应交个税金额。假设我们用自定义函数的方式。本文将给出三种方法。

    将 Excel 工作表中的两个数据源通过 Ctrl + T 转换成表,加载到 PQ 中。


    image

    函数的语法

    PQ 函数的语法示例:

    (x, y) => x + y
    

    方法1:在高级编辑器中手写代码。新建一个空查询,改名为 GetIncomeTax,进入高级查询,在高级查询中输入下面的代码:

    (taxable) =>
        if taxable <=0 then 0
        else if taxable <= 3000 then taxable * 0.03
        else if taxable <= 12000 then taxable * 0.1 - 210
        else if taxable <= 25000 then taxable * 0.2 - 1410
        else if taxable <= 35000 then taxable * 0.25 - 2660
        else if taxable <= 55000 then taxable * 0.3 - 4410
        else if taxable <= 80000 then taxable *0.35 - 7160
        else taxable * 0.45 - 15160
    

    点击完成按钮,回到查询编辑器界面,这个函数就完成了。以上代码跟其他编程语言差不多,思路比较直观。可以通过上面代码熟悉 M语言 if then else 的语法。

    函数调用

    选中 salaries 查询,右键,点击【复制】,将 salaries 查询表复制一个名为 IncomeTaxMethod1 的新查询,添加一个自定义列, 计算应纳税所得额 (用 Taxable 表示):

    image
    再增加一个计算列,调用自定义函数 GetIncomeTax 计算个税 :
    image
    image
    点击完成按钮回到查询编辑器界面,第一种方法定义函数和调用函数完成。 image

    对应的 M 语言脚本:

    let
        源 = Excel.CurrentWorkbook(){[Name="salaries"]}[Content],
        ChangedTypes = Table.TransformColumnTypes(源,{{"Name", type text}, {"Salary", Int64.Type}}),
        
        AddedTaxableCol = Table.AddColumn(
            ChangedTypes, 
            "Taxable", 
            each [Salary] - 5000),
            
        Result = Table.AddColumn(
            AddedTaxableCol, "IncomeTax", each GetIncomeTax([Taxable]))
    in
        Result
    

    查询转函数

    方法2:方法 2 的个税计算方法来自于我见过的 Excel 中最简洁的计算公式:

    =ROUND(MAX((B4-5000)*{3;10;20;25;30;35;45}%-{0;210;1410;2660;4410;7160;15160},0),2)
    

    公式中只有一个参数,但这个公式有点晦涩,先解释一下。这个公式用到了 Excel 的数组。第一个数组是税率, 为方便表述称为 taxrate_array,第二个数组是速算扣除数,为表述方便称为 deduction_array:

    taxrate_array: {3;10;20;25;30;35;45}
    deduction_array: {0;210;1410;2660;4410;7160;15160}
    

    所以,

    (D2-5000)*{3;10;20;25;30;35;45}%-{0;210;1410;2660;4410;7160;15160}
    

    表示是将 (salary-5000)后的值 (taxable)与 taxrate_array 数组的每一个元素进行计算,再减去 deduction_array 数组的对应值,结果组成一个新数组。然后再从这个结果数组中取最大值,四舍五入保留两位小数。用伪代码表述更加清晰:

    taxable = salary - 5000
    incomeTax = {taxable*0.03-0; taxable*0.1-210; taxable*0.2-1410; ...}
    incomeTax = Max({incomeTax})
    IncomeTax = Round(IncomeTax, 2)
    

    这个算法是怎么想出来的我们不去管它,主要讲解在 PQ 中用同样算法实现的步骤。

    选中 TaxrateTable 查询,右键,点击【引用】菜单,得到一个新的查询,将查询改名为 GetTax。后面基于这个查询编写计算个税的函数。

    image

    根据刚才的 Excel 公式,上图中 Level 字段、TaxableFrom 字段和 TaxableTo 字段是无关字段,可以删除。可以用 Table.RemoveColumn 函数删除,也可以使用 Table.SelectColumns 函数保留需要的列。本次使用Table.SelectColumns 函数。在高级编辑器或公式栏中操作都可以:

    SelectedCols = Table.SelectColumns(Source, {"Rate", "Deduction"})
    
    image

    这样选择了相关的两列,查询编辑器界面如下:

    image

    函数需要参数,比如计算个税需要应纳税所得额。为了方便,我先用一个特定值,后面再替换。进入高级编辑器,目前的代码如下:

    let
        Source = TaxRatesTable,
        SelectedCols = Table.SelectColumns(Source, {"Rate", "Deduction"})
    in
        SelectedCols
    

    比如用刚才的应纳税所得额 3900,将代码变更为:

    let
        taxable = 3900,
        Source = TaxRatesTable,
        SelectedCols = Table.SelectColumns(Source, {"Rate", "Deduction"})
    in
        SelectedCols
    

    注意下图我的变更是插入了一个变量:


    image

    然后增加一个自定义列 Trial (表示试算):

    image

    此时查询编辑器界面如下:

    image

    对应的 M 语言代码如下:

    let
        taxable = 3900,
        Source = TaxRatesTable,
        SelectedCols = Table.SelectColumns(Source, {"Rate", "Deduction"}),
        Trials = Table.AddColumn(
            SelectedCols, 
            "Trial", 
            each taxable * [Rate] - [Deduction])
    in
        Trials
    
    image

    接下来取出 Trial 列的最大值。我们知道 Table 每列都是 List 类型的数据,所以可以增加一个步骤,命名为 MaxOfTrial,在公式栏输入:

    = List.Max(Trials[Trial])
    

    再套用 Number.Round 函数:

    = Number.Round(List.Max(Trials[Trial]),2)
    

    此时查询编辑器的界面如下:

    image

    对应的 M 语言代码如下:

    let
        taxable = 3900,
        Source = TaxRatesTable,
        SelectedCols = Table.SelectColumns(Source, {"Rate", "Deduction"}),
        
        Trials = Table.AddColumn(
            SelectedCols, 
            "Trial", 
            each taxable * [Rate] - [Deduction]),
            
        MaxOfTrial = Number.Round(List.Max(Trials[Trial]),2)
    in
        MaxOfTrial
    

    接下来是见证奇迹的时刻,在高级编辑器中将代码变更为:

    (taxable as number ) as number =>
        let
            Source = TaxRatesTable,
            SelectedCols = Table.SelectColumns(Source, {"Rate", "Deduction"}),
            
            Trials = Table.AddColumn(
                SelectedCols, 
                "Trial", 
                each taxable * [Rate] - [Deduction]),
            MaxOfTrial = Number.Round(List.Max(Trials[Trial]),2)
        in
            MaxOfTrial
    

    回到查询编辑器界面,PQ 将查询变成了函数。经过本步骤,第二种方法定义函数完成。请体会和掌握如何将查询转换成函数,这种方式可以将编写函数的步骤分解,并且能看到每一个步骤的计算结果,从而降低了手写代码的难度。

    image

    函数的调用比较简单,略去不提。

    个税计算方法 3: 对于应纳税所得额来说,需要在 TaxRatesTable 中找到对应行,从而确定税率和速算扣除数。仍以 3900 的应纳税所得额为例,对应下图的级次确定税率和速算扣除数:

    image
    在 PQ 中,从另外一个 Table 中找出一行,使用构造结构化列的方法。这种方法具有普遍意义,能够处理两个表没有相等值,从而不能用合并查询的场景。

    选中 salaries 查询表,右键菜单【引用】,新建一个名为 IncomeTaxMethod3 的查询。添加一个自定义列。这一列每个单元格都包含完整的 TaxRatesTable 查询表数据。

    image
    回到查询编辑器界面,我们看到,TaxInfo 每一个单元格都包含 TaxRateTable 的所有数据,我们需要对 sub-table 的数据进行筛选。 image

    这种操作技巧在本系列第 11 篇有详细介绍,本篇就不再赘述。在高级编辑器中,将代码变更。变更前代码:

    let
        Source = salaries,
        AddedTaxData = Table.AddColumn(Source, "TaxInfo", each TaxRatesTable)
    in
        AddedTaxData
    

    变更后代码后:

        Source = salaries,
        AddedTaxData = Table.AddColumn(
            Source, 
            "TaxInfo", 
            each Table.SelectRows(
                    TaxRatesTable, 
                    (row)=>row[TaxableFrom]<=[Salary] - 5000
            )
        )
    in
        AddedTaxData
    
    

    通过 Table.SelectRows 将税率级次高的数据排除掉。比如 8900 - 5000 = 3900,则只需先下面两行:

    image
    接下来调用 Table.Last 函数获取最后一行,得到一个 record 类型的数据:
    let
        Source = salaries,
        AddedTaxData = Table.AddColumn(
            Source, 
            "TaxInfo", 
            each Table.Last(
                Table.SelectRows(
                    TaxRatesTable, 
                    (row)=>row[TaxableFrom]<=[Salary] - 5000
            ))
        )
    in
        AddedTaxData
    

    这时 TaxInfo 变成了 record,对 TaxInfo 列进行展开操作,保留 Rate 和 Deduction:

    image

    查询编辑器的界面如下:

    image

    最后添加一个计算列,计算出各自的个税:

    image

    这种结构化列的方法,同样可以先做出查询,然后转换成函数。操作过程类似,就不重复说明了。给出获取 TaxRateTable 相应行的函数代码:

    (taxable as number) =>
        let
            Source = Table.SelectColumns(TaxRatesTable, {"TaxableFrom", "Rate", "Deduction"}),
            SelectedRow = Table.Last(
                Table.SelectRows(
                    Source,  (row)=>row[TaxableFrom] <= taxable   
                )) 
        in
            SelectedRow
    

    示例数据已经放到 github - Income Tax Calculation 上,方便大家学习。

    相关文章

      网友评论

        本文标题:Power Query 系列 (13) - 自定义函数

        本文链接:https://www.haomeiwen.com/subject/hvuamctx.html