1.安装tesseract-ocr并下载对应版本的中文库
链接:https://pan.baidu.com/s/1u8sA9K7eC5Zzknyls4ScnQ
提取码:jzik
chi_sim.traineddata放在Tesseract-OCR\tessdata目录
2.代码
CnOcr识别中文
keyboard监听键盘组合键
ImageGrab获取剪切板图片
pyperclip把识别的文本复制到剪切板
import pyperclip as pyperclip
from cnocr import CnOcr
from PIL import ImageGrab
import keyboard
# 监听键盘组合键 ctrl+shift+c
if keyboard.wait(hotkey='ctrl+shift+c') == None:
print("开始识别...")
# 获取剪切板文件并保存到临时目录
im = ImageGrab.grabclipboard();
im.save(r'c:/tmp/1.png')
ocr = CnOcr()
# 识别
res = ocr.ocr('c:/tmp/1.png')
content = ''
# 逐行拼接识别的文本
for row in res:
content += ''.join(row) + "\n"
print(content)
pyperclip.copy(content)
print("文本已复制到剪切板")
3.测试
![](https://img.haomeiwen.com/i5880229/5d05bcf4d2c12e75.png)
测试结果:
开始识别...
很高兴有机会向大家介绍新版《艾伦·图灵传》。从1983年本书第
一次发表,到今天,艾伦·图灵提出的通用计算机已经发展成了国际互联
网,他当年的梦想已经照进了我们的现实生活。所以,对于21世纪的读
者们来说,与20世纪末的读者相比,应该更能与他的故事产生共鸣。
我在旧版的札记中曾经写道,随着新的进步,图灵的意义将越来越重
要。我希望读者们能够感受到,现在的发展已经使我的预言越来越显得正
确了。举例来说,近年来将神经网络与主流计算机结合起来的想法,与图
灵当年提出的观点是一致的。再比如说,图灵在年轻时就曾经探索过量子
力学与智能的关系,如今,量子计算机出现了,这是多么有趣呀。
现在,在诸如计算机程序设计这些专业学科中,不断地涌现出各种各
样的新观点,但这些都没有改变我之前所描述的—图灵在1945年时,
将逻辑运算付诸实践,奠定了计算机科学的基础。关于图灵在第二次世界
大战中破解密码的工作,在1983年之后又有了一些新的信息,这要感谢
冷战的结束以及密码学的高速发展。布莱彻利公园纪念馆已得到了妥善的
重建,图灵当年亲手打印的谜机分析报告以及其他相关文件,也被美国于
1996年公之于世。虽然我们现在仍然没法搞清楚这个故事的全部,因为
从这些文件中,还是看不出来他设计的图灵炸弹机究竟在多大程度上受到
了波兰炸弹机的启发,但是我们可以从中看出,图灵早在1939年末就开
始对德国的海军通信开刀了,进行了大量至关重要的工作。现在我们也更
加清楚地知道,图灵当年是在别人的蔑视和鄱夷下,开始进行这项工作
的,而且在人们意识到他对同盟国在大西洋战场上的胜利所起的关键性作
用之前,他遭受了非常多的挫折和打击。此外,这些文件还公开了图灵在
1942~1943年间曾对美国进行的高级访问,然而对于他在战后扮演了什
么样的角色,却丝毫没有透露。
文本已复制到剪切板
4.问题
当截取的内容并非密集文本时,或者有其他干扰(如pycharm的波浪线)时,识别率比较差,但基本可以满足个人需求
如何打成系统服务,并自定义快捷键
网友评论