美文网首页
取出一篇英文文章出现最多的单词

取出一篇英文文章出现最多的单词

作者: KeDaiBiaO1 | 来源:发表于2017-09-25 16:50 被阅读0次

前段时间面试遇见一个面试题,虽然思路大体对了,但是细节上做的很不好。所以把这个代码敲一遍运行成功并在细节地方解析一下
如有错误,请各位同学指正
代码如下:

public static void readArticle() throws IOException{
        BufferedReader br = new BufferedReader(new FileReader("F:\\test.txt")); 
        StringBuffer sb = new StringBuffer("");
        String str = "";
        while((str = br.readLine()) != null){
            sb.append(str + " ");
        }
        Pattern p = Pattern.compile("[A-Zaa-z]+");
        Matcher m = p.matcher(sb.toString());
        Map<String, Integer> map = new HashMap<>();
        while(m.find()){
            String group = m.group();
            Integer count = map.get(group);
            if(map.containsKey(group)){
                map.put(group, count + 1);
            }else{
                map.put(group, 1);
            }
        }
        //
        
        List<Map.Entry<String, Integer>> list = new ArrayList<>(map.entrySet());
        Set<Entry<String, Integer>> entry = map.entrySet();
        Collections.sort(list, new Comparator<Entry<String, Integer>>(){
            //Comparator 是一个接口不能直接实例化  这个是匿名的实例化对象
            @Override
            public int compare(Entry<String, Integer> o1, Entry<String, Integer> o2) {
                return o1.getValue().compareTo(o2.getValue());
            }
        });
        for(int i = 0;i < list.size();i++){  
              System.out.println("key="+list.get(i).getKey()+" value="+list.get(i).getValue());  
        }  
//      System.out.println(list.get(list.size() - 1));
        br.close();
    }
    public static void main(String[] args) throws IOException {
        readArticle();
    }

比较关键的地方就是:
1、读取一片文章,面试的话最好是从txt文件中读取(不要直接定义一个String)
1> 读取的话,可能会在读取文件时候犯错 如下:

//正确
while((str = br.readLine()) != null){
            sb.append(str + " ");
}
//错误
while(br.readLine() != null){
  String str = br.readLine();
  sb.append(str + " ");
}

2> 加上" " 是换行的时候 没有空格 这样就会一行的最后一个和下一行第一个拼接在一起
2、正则表达式匹配单词
3、Collections.sort
map是无序的 ,所以要先转成list Map.entrySet()
Comparator <T>是一个带有泛型的接口,可以写一个实现该接口的类,或者匿名的对象(compare、compareTo方法返回3个值-1 0 1)
经过排序后list中最后一个元素就是map的entry

相关文章

网友评论

      本文标题:取出一篇英文文章出现最多的单词

      本文链接:https://www.haomeiwen.com/subject/cmddextx.html