算法 - 统计数字 - 易

作者: stchang | 来源:发表于2017-09-18 10:43 被阅读0次

算法 - 统计数字 - 易
每日算法之统计数字
二十七、ElasticSearch聚合分析中的算法讲解
47_深入聚合数据分析_易并行聚合算法，三角选择原则，近似聚合算
统计分析基本知识
简单排序（选择排序、起泡排序和插入排序）使用详解
关于iOS中AES加密和base64编码的理解
K近邻算法你掌握了吗？来测试一下就知道了！
统计数字
统计数字

算法 - 统计数字 - 易

给定数字 n (1<= n <= 1e9) ，计算1-n的每个数字，分别使用了多少次0-9,并且汇总

例如：

n = 11

结果：

数字：0 1 2 3 4 5 6 7 8 9

次数：1 4 1 1 1 1 1 1 1 1

建议

给你的代码不要复制粘贴，看完这个文档，理解了其中原理，按着代码打一遍，如果时间充足，使用c/c++将这个思路实现一下。看看执行时间。

关键思路

遍历每一个页码

将页码的每一位提取出来

对当前位数进行记录

分析

首先语法性的东西，比如读取文件，写文件之类的不说了，注意，读取文件的字符应该要转化为int。并且要求是1-1e9 之间

第二个，将页码的每一位都提取出来，这里我提供两个思路。

将当前页码转化为字符串，对字符串的每一个字符进行遍历。并转化为int整型。

for (int current = 1 ;current <= page ;current ++)
{
    // 将当前页码转化为字符串
    String istr = current + "";
    for (int j = 0 ; j < istr.length() ;j ++)
    {
        // 对每个位进行遍历，并转化为数字
        char c = istr.charAt(j);
        int index = Integer.parseInt(c+"");

        result[index] ++  ;
    }  
}

对页码整数分解出每一位。这里有两个方向的提取.

从低位 - 高位方向提取

// first num
int n1 = number % 10 ; 
// second num
int n2 = number / 10 % 10;
...

例子：
12345 % 10 = 5

12345 / 10 % 10 = 1234 % 10 = 4

注意：这样分解有一些问题，就是需要知道当前整数是是几位。否则将不会知道提取位到哪里停止

// 12345 提取第6位
12345 / 100000 % 10 = 0 

这个 0 也会被记录到result[0] 中，会出现错误。

这里有没有好方法？思考一下

从高位 - 低位方向提取

这个方式就有了一个很好的方法，来解决上述还要求数字位数的麻烦。我们从高位开始提取，提取到第一个大于0的数字时，开始记录。
这就需要一个标志位来做开关，告诉程序什么时候开始记录。

for(int current = 1 ;current<=page ;current ++)
{
    // 标记位 ： 是否开始记录位数字
    boolean flag = false ;
    for (int i = 9 ; i > 0 ;i --)
    {
        // Math.pow(x,y) 求x的y次方,返回的是double类型
        // java中类型转换比较复杂.这方面需要你留意
        // i 表示的是提取当前页码的第几位,比如i = 9 的时候
        // index = current / 1e8 % 10

        int zeronum = (new Double(Math.pow(10,i-1))).intValue(); 
        int index = current / zeronum % 10; 

        // 如果当前位 = 0 并且flag 是false 就不做处理
        if(index == 0 && flag == false)
        {
            continue ;
        }
        // 一旦当前为不为0 ,立即设置flag，以便低位0能够被正确的记录
        flag = true ;
        result[index] ++ ;
    }
}

最后，统计。构造一个10位数组，索引 0-9 的值对应着 0-9 出现的次数。
```
for (int k = 0 ;k < 10 ; k ++)
{
    System.out.println(result[k]);
}
```

思考

以上两种方法是我临时想到的两个方法。这里面的精髓就是对整数位数分解的思想，基本没什么营养。你也可以查阅一下资料，看是不是有更好的方法来分解整数。

第一种方法确实简单，思路清晰，一般实际使用的也是这种方法，效率高。程序设计中，简单的就是最好的。

第二种方法，看似比较复杂，并且效率比较低，但是也不是一无是处，这种求位运算中，从低位到高位，和从高位到低位，两种方式的简易程度是不一样的。

时间复杂度的问题，时间复杂度是个模糊概念，现阶段数据结构中考虑时间复杂度是看你循环的套数。两种方法中外部循环是n，内部循环设置为m，但是m<=9 , 所以时间复杂度是O(n*m) m<=9

但是通过程序来进行实际操作会发现，第一种方法的效率远远高于第二种。

当设置 page = 1234567 时可以看出两个程序所得到的结果以及运行时间

第一种方式比第二种方式效率高出了近10倍。

the result of the firstWay:
713306 1058985 758985 718985 713985 713385 713315 713307 713306 713306
the result of the secondWay:
713306 1058985 758985 718985 713985 713385 713315 713307 713306 713306
the time cusuming of the firstWay :89ms
the time cusuming of the secondWay :756ms

至于为什么，给你三个思路。

在java中，Math.pow()函数是一个很耗费时间的函数
第二种方式中，每一个页码不管长度是多少，都要循环9次。而第一种方式中，可以轻而易举的得到页码的长度，故而每一个页码循环的次数是页码长度。
新建的Double 对象转化int整型耗时较长。

针对不同的编程语言，上述的行为都不太一样。对于c++ / c语言，上述代码会执行的快一些，这也解释了一个知识点：编译语言比解释语言要快。

c/c++代码不写了，你自己实践一下。

网友评论

本文标题：算法 - 统计数字 - 易

本文链接：https://www.haomeiwen.com/subject/qvivsxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

算法 - 统计数字 - 易