美文网首页PowerQuery
【转载】PowerQuery中Text.Remove()函数的应

【转载】PowerQuery中Text.Remove()函数的应

作者: PowerQuery | 来源:发表于2017-01-06 10:10 被阅读219次

    这里看到作者列了用Text.Remove()函数的几个应用场景,简直太妙,忍不住转来整理如下:
    去除英文大小写字母
    Text.Remove([原始信息],{"A".."z"})

    去除英文字符
    Text.Remove([原始信息],{" ".."~"})

    去除数字
    Text.Remove([原始信息],{"0".."9"})

    去除中文
    Text.Remove([原始信息],{"一".."龥"})

    总结
    这里的关键是Text.Remove()函数的第二个参数,“removeChars”可以是一个list,而我们知道,list其实可以通过构造序列来生成一个有序list。而原作者举的这些例子, 说明PowerQuery是支持Unicode序列的。如果对Unicode序列非常熟悉的话,可以实现更多情形的特定字符移除。
    那么作为文科生,怎么快速去找到Unicode的编码序列表呢?到微软的Office Word中去找。以Word2016为例,切换到“插入”标签,最右边找到“符号”,点击,选中“其他符号”。

    这时就出来Unicode的编码表了,可以选择“子集”,然后右边的滚动条可以滚动以查看序列。以下图为例,如果要构造一个当前可视范围的list,则这个list可以写为{"$".."]"}。代入Text.Remove()函数,则下图中所有的字符都将被移除。

    需要注意的是:使用这种方法去除不需要的字符,处理速度相当慢。当数据量很大的时候,不建议采用此种办法。

    相关文章

      网友评论

        本文标题:【转载】PowerQuery中Text.Remove()函数的应

        本文链接:https://www.haomeiwen.com/subject/uzptbttx.html