当前位置: 首页 > news >正文

沈阳世纪兴网站制作三 网站开发使用软件环境

沈阳世纪兴网站制作,三 网站开发使用软件环境,wordpress密码重设链接无效,建设银行网站用户登录滑稽研究所python识别图片文字哈喽#xff0c;大家好呀#xff0c;我是滑稽君。大家在写论文时可能经常碰到无法复制文字的文章。明明找到了需要的内容却无法直接复制使用#xff0c;这让我们十分苦恼。那么本期滑稽君就告诉大家如何使用python识别图片中的文字。滑稽君整理… 滑稽研究所python识别图片文字哈喽大家好呀我是滑稽君。大家在写论文时可能经常碰到无法复制文字的文章。明明找到了需要的内容却无法直接复制使用这让我们十分苦恼。那么本期滑稽君就告诉大家如何使用python识别图片中的文字。滑稽君整理了网上使用率最高的两种方法。一是pytesseractTessseract-OCR进行图片识别。二是调用百度文字识别提供的API进行图片文字的处理。下面我将告诉大家这两种方法一些容易跳坑的地方。视频讲解❂ pytesseractTessseract-OCR第一种方法需要注意的地方是一些第三方库的下载我们需要用到pytesseract库和pillow库这两个库我们都可以在cmd中直接pip下载需要注意的是我们还需额外下载一个文件——tesseract-ocr。下载这个文件之后我们直接安装注意不要修改他的默认路径(大神忽略)。一些小伙伴可能需要配置一下环境路径滑稽君安装之后它自动帮我添加了大家注意一下即可。下载链接https://pan.baidu.com/s/1OL0g1MBzeijD23JN0UGC0Q这个工具默认支持英文我们需要下载支持中文的包然后放在这个目录下。C:\Program Files (x86)\Tesseract-OCR\tessdata  里面已经有了支持英文的包是eng开头的我们放入的支持中文的包是chi_sim开头的意思是中文简体。接着我们需要在这个目录下找到图片中的最后一个文件打开文件(用记事本即可)找到如图所示位置后进行如下修改。这个路径一般是通用的这也是一开始为什么不修改默认路径的原因。当我们准备工作都完成后代码部分就比较简单了。源代码import pytesseractfrom PIL import Image pytesseract.pytesseract.tesseract_cmd rC:\Program Files (x86)\Tesseract-OCR\tesseract.exetext pytesseract.image_to_string(Image.open(C:\\Users\\86157\\pysw.png),langeng)#识别英文参数为 langeng 中文为langchi_sim 如果参数不对识别就会乱码。# 创建一个txt文件文件名为mytxtfile,并向文件写入msgdef text_create(name, msg): desktop_path C:\\Users\\86157\\Desktop\\ # 新创建的txt文件的存放路径 full_path desktop_path name .txt # 也可以创建一个.doc的word文档 file open(full_path, w) file.write(msg) #msg也就是下面的Hello world!    file.close()    text_create(saveworld,text)❂ 调用百度文字识别提供的API这个方法主要是使用百度文字识别提供的API接口来完成对图片文字的识别。需要用到baidu-api这个第三方库cmd中可以直接pip安装。我们需要去百度云免费申请一个百度云文字识别api的接口获得你自己的APP_IDAPI_KEYSECRET_KEY。源代码#-*- coding: UTF-8 -*-#前提是python已安装aip库--》pip install baidu-aip import osfrom aip import AipOcrimport jsonAPP_ID #你的APP_IDAPI_KEY #你的API_KEYSECRET_KEY #你的SECRET_KEYaipOcr AipOcr(APP_ID, API_KEY, SECRET_KEY)os.chdir() #你需要转换的图片目录大家自行替换。dirs os.listdir()def get_file_content(filePath): with open(filePath, rb) as fp: return fp.read()options {}options[language_type] CHN_ENGoptions[detect_direction] trueoptions[detect_language] trueoptions[probability] true print(开始处理共str(len(dirs))张图片。)flag0T 0 #统计处理图片成功的数量for filePath in dirs: if filePath.split(.)[-1]txt:continue flag1 print(正在处理第str(flag)张图片) try: result aipOcr.basicGeneral(get_file_content(filePath), options) except BaseException as e: print(e) else: try: with open(filePath.split(.)[0].txt,w,encodingutf-8) as f: for i in result[words_result]: f.write(i[words]\n) T 1 except BaseException as e : print(e) else: print(处理完成)print({}全部处理完成{}.format(*30,*30))print(处理成功的图片有{}张,处理失败的图片有{}张.format(T,len(dirs)-T))效果图方法一左边为滑稽君自制的图片右边为识别之后转txt的效果。可以看到中文识别正确率还说一点低的。英文识别的效果倒是还可以没有出现错误的情况这里就不展示了。方法二左边为滑稽君自制的图片右边为识别之后转txt的效果。可以看到第一种方法对图片中文字的识别准确率较第二种要差很多特别是在中文的识别上。因此大家日常使用的话还是推荐第二种方法还有就是下载安装文件和配置环境变量对小白来说不是那么友好。第一种方法识别图片中文字如果图片里有中英混杂的情况就只能识别一种语言。而调用百度文字API的方法可以英文、中文、数字混合在一张图里识别并且准确率高。前者可以单机识别后者则是要求网络的。本期素材来源https://blog.csdn.net/zhangshaohua1603/article/details/79722399https://blog.csdn.net/L141210113/article/details/88835914?utm_mediumdistribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.comparedepth_1-utm_sourcedistribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.compare❂ END两种方法都为大家整理完毕了有什么问题欢迎私信滑稽君。
http://www.huolong8.cn/news/113873/

相关文章:

  • 搭建网站流程山东做网站费用
  • 地方门户网站有前景吗设计工作网站
  • 想做一个公司的网站去哪可以做专业团队高清图片
  • 做影视网站违法不wordpress获取特定分类文章数
  • 重庆网站建设挑夹夹虫wordpress单页留言板
  • 网站推广的看法百度竞价推广托管
  • 网站开发有什么好的介绍建设厅和应急管理厅焊工证区别
  • 拼多多电商网站建设网页翻译网站
  • 可以做伦铜的网站深圳的建站公司
  • 域名备案和网站备案的区别网站为什么做重定向
  • 宿城区住房和城乡建设局网站wordpress中文字体库
  • 搜索引擎在哪里获取网站怎么做视频平台网站吗
  • 手机版网站有必要吗做科技公司的网站公司
  • 越秀区建设局网站wordpress 拖拉验证
  • 手机网站跟PC端网站有啥区别文库类网站建设建议及经验
  • 网站推广软文是什么制作营销网站模板下载
  • 做网站做推广有效果吗平泉市住房和城乡建设局网站
  • 外冈网站建设网站开发技术发展
  • 中国做国外的网站网站模板 带数据库
  • 太原优化网站武冈网站建设多少钱
  • 怎么装字体到wordpress网站打开速度慢 如何优化
  • 网站建设背景怎么写设计方案格式模板
  • 小网站代码网络营销是什么时候出现的
  • 一 通过网站推广品牌个人站长网站
  • 专门做母婴的网站深圳的设计网站大全
  • 建设旅游网站的价值建设部网站注销一级建造师
  • 海南什么公司的网站中小企业网络营销
  • 免费网站推广ymdir齐家装饰公司官网
  • 装修网站排名前十cdr 做网站页面
  • 惠州做网站公司哪家好wordpress反应好慢