美文网首页
取出一篇英文文章出现最多的单词

取出一篇英文文章出现最多的单词

作者: KeDaiBiaO1 | 来源:发表于2017-09-25 16:50 被阅读0次

    前段时间面试遇见一个面试题,虽然思路大体对了,但是细节上做的很不好。所以把这个代码敲一遍运行成功并在细节地方解析一下
    如有错误,请各位同学指正
    代码如下:

    public static void readArticle() throws IOException{
            BufferedReader br = new BufferedReader(new FileReader("F:\\test.txt")); 
            StringBuffer sb = new StringBuffer("");
            String str = "";
            while((str = br.readLine()) != null){
                sb.append(str + " ");
            }
            Pattern p = Pattern.compile("[A-Zaa-z]+");
            Matcher m = p.matcher(sb.toString());
            Map<String, Integer> map = new HashMap<>();
            while(m.find()){
                String group = m.group();
                Integer count = map.get(group);
                if(map.containsKey(group)){
                    map.put(group, count + 1);
                }else{
                    map.put(group, 1);
                }
            }
            //
            
            List<Map.Entry<String, Integer>> list = new ArrayList<>(map.entrySet());
            Set<Entry<String, Integer>> entry = map.entrySet();
            Collections.sort(list, new Comparator<Entry<String, Integer>>(){
                //Comparator 是一个接口不能直接实例化  这个是匿名的实例化对象
                @Override
                public int compare(Entry<String, Integer> o1, Entry<String, Integer> o2) {
                    return o1.getValue().compareTo(o2.getValue());
                }
            });
            for(int i = 0;i < list.size();i++){  
                  System.out.println("key="+list.get(i).getKey()+" value="+list.get(i).getValue());  
            }  
    //      System.out.println(list.get(list.size() - 1));
            br.close();
        }
        public static void main(String[] args) throws IOException {
            readArticle();
        }
    

    比较关键的地方就是:
    1、读取一片文章,面试的话最好是从txt文件中读取(不要直接定义一个String)
    1> 读取的话,可能会在读取文件时候犯错 如下:

    //正确
    while((str = br.readLine()) != null){
                sb.append(str + " ");
    }
    //错误
    while(br.readLine() != null){
      String str = br.readLine();
      sb.append(str + " ");
    }
    

    2> 加上" " 是换行的时候 没有空格 这样就会一行的最后一个和下一行第一个拼接在一起
    2、正则表达式匹配单词
    3、Collections.sort
    map是无序的 ,所以要先转成list Map.entrySet()
    Comparator <T>是一个带有泛型的接口,可以写一个实现该接口的类,或者匿名的对象(compare、compareTo方法返回3个值-1 0 1)
    经过排序后list中最后一个元素就是map的entry

    相关文章

      网友评论

          本文标题:取出一篇英文文章出现最多的单词

          本文链接:https://www.haomeiwen.com/subject/cmddextx.html