欢迎大家来到IT世界,在知识的湖畔探索吧!
很多时候我们需要统计单个字符或某种字符出现的次数,那么在PowerQuery中怎么实现呢?
01统计字符串中单一字符出现的次数
有小伙伴提了一个问题:“PowerQuery是否有直接统计字符串中指定字符个数的函数”,我翻了下PowerQuery参考,并没有找到这样的一个函数。
那有没有法子用PowerQuery来实现统计字符串中特定字符的出现个数呢?我目前知道的有两种方法(假设要统计字符串【1-2-3-9】中【-】出现的次数):
= List.Count(Text.PositionOf(“1-2-3-9″,”-“,Occurrence.All))
= Text.Length(“1-2-3-9”)-Text.Length(Text.Replace(“1-2-3-9″,”-“,””))
两种方法殊途同归,不过我觉得方法一更“优雅”一些。
那还会不会有第三种方法呢?
更进一步,我们可以在这个例子的基础上进行延伸和拓展。
02统计字符串中出现的数字个数
统计字符串【1-2-3-9】中【数字】出现的次数:
= List.Count(Text.PositionOfAny(“1-2-3-9”,{“0”..”9″},Occurrence.All))
但是如果要统计字符串【李四5676中华234大家庭】中数字出现的次数,则结果就不对:
= List.Count(Text.PositionOfAny(“李四5676中华234大家庭”,{“0”..”9″},Occurrence.All))
上面统计的结果是7,但是我们想要的结果是2。原因在于上面的代码是把【5676】这一个数字作为四个数字统计了四次,实际上我们需要的是把【5676】作为一个整体统计一次。
那要如何才能得到正确结果呢?这时就必须借助于自定义函数,比如下面这个:
(str as text)=>let
源 = Text.PositionOfAny(str,{“0”..”9″},Occurrence.All),
转换为表 = Table.FromList(源, Splitter.SplitByNothing(), null, null, ExtraValues.Error),
已添加索引 = Table.AddIndexColumn(转换为表, “索引”, 0, 1),
已添加自定义 = Table.AddColumn(已添加索引, “自定义”, each
try
if 已添加索引[Column1]{[索引]}+1=已添加索引[Column1]{[索引]+1}
then “drop”
else “keep”
otherwise “end”),
筛选的行 = Table.SelectRows(已添加自定义, each ([自定义] <> “drop”)),
自定义1 = Table.RowCount(筛选的行)
in
自定义1
在字符串上调用这个自定义函数就能统计出正确的数字结果。比如字符串【李四5676中华234大家庭】中的数字是2。
所以,只有统计单个数字出现的次数,才能用List.Count()结合Text.PositionOfAny()函数的方法。
如果要统计多个单数字构成的数值的出现次数,则必须用自定义函数曲线实现。
03统计字符串中汉字出现的个数
统计字符串【李四5676中华大家庭】中【汉字】出现的次数:
= List.Count(Text.PositionOfAny(“李四5676中华大家庭”,{“一”..”龥”},Occurrence.All))
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://itzsg.com/73714.html