• linkedu视频
  • 平面设计
  • 电脑入门
  • 操作系统
  • 办公应用
  • 电脑硬件
  • 动画设计
  • 3D设计
  • 网页设计
  • CAD设计
  • 影音处理
  • 数据库
  • 程序设计
  • 认证考试
  • 信息管理
  • 信息安全
菜单
linkedu.com
  • 网页制作
  • 数据库
  • 程序设计
  • 操作系统
  • CMS教程
  • 游戏攻略
  • 脚本语言
  • 平面设计
  • 软件教程
  • 网络安全
  • 电脑知识
  • 服务器
  • 视频教程
  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号
您的位置:首页 > 程序设计 >ASP.NET > 图片识别工具Tesseract初探

图片识别工具Tesseract初探

作者: 字体:[增加 减小] 来源:互联网 时间:2017-05-11

通过本文主要向大家介绍了tesseract识别中文,tesseract,tesseract ocr,tesseract ocr下载,tesseract ocr官网等相关知识,希望对您有所帮助,也希望大家支持linkedu.com www.linkedu.com

一、框架介绍

Tesseract 是一款图片识别工具,可以抓取图片中的文字,可以支持多种语言(默认是英语),需要下载开源文件可以在github上下载,如果知识应用不想太多深究直接在google code里边搜索下载即可。

二、Tesseract内容 

Doc:说明文档 

Tessdata:存放各种文字库(chi_sim.traineddata:中文 等) 

Tessseract.exe 即可以启动文件开始调用Tesseract 可以通过cmd方式调用,先cd到对应的目录,然后 输入 tesseract.exe 图片名 导出文件名(如:tesseract.exe 1.jpg 1) 就可以把和tesseract同目录的 1.jpg文件识别结果存放在 1.txt文件中。当然如果需要支持中文,需要在tessdata中添加 chi_sim.traineddata 文件,

然后 调用例子:tesseract.exe 1.jpg 1 -L chi_sim 制定是根据什么文字库进行识别。 当然图片地址可以引用全路径、输出结果也可以全路径如果只是想把Tesseract做为一个工具做文字解析,并不追求太高成功率使用者,这样即可满足需要了,直接通过CMD调用exe进行执行。有需要玩的小伙伴可以直接下载附件 Tesseract_简单使用.rar文件

三、.Net项目高级使用

如果.Net项目需要使用 DLL方式引用进行研发,可以下载Tesseract_DLL引用包。

X86和X64是针对Tesseract关联引用DLL,根据程序所在系统位数进行自适应配置。

liblept168.dll 这个文件会在windows server 2003中发布IIS情况下无法加载错误信息: Failed to find library "liblept168.dll" for platform x86. 如果发布在更高版本系统中即可正常使用Tesseract.DLL即是要添加到对应的项目中的。以下是测试tesseract.dll 代码: 

 using (var engine = new TesseractEngine(Server.MapPath(@"~/tessdata"), "eng", EngineMode.Default))
         {
           // have to load Pix via a bitmap since Pix doesn't support loading a stream.
           using (var image = new System.Drawing.Bitmap(imageFile.PostedFile.InputStream))
           {
             using (var pix = PixConverter.ToPix(image))
             {
               using (var page = engine.Process(pix))
               {
                 meanConfidenceLabel.InnerText = String.Format("{0:P}", page.GetMeanConfidence());
                 resultText.InnerText = page.GetText();
               }
             }
           }
         }

</div>

TesseractEngine:构造函数参数注意事项=》第一个是字库路径必须使用tessdata结尾,第二个如果需要使用chi_sim即中文

以上所述就是本文的全部内容了,希望大家能够喜欢。

</div>
分享到:QQ空间新浪微博腾讯微博微信百度贴吧QQ好友复制网址打印

您可能想查找下面的文章:

  • 图片识别工具Tesseract初探

相关文章

  • 2017-05-11asp.net 验证码生成和刷新及验证
  • 2017-05-11ASP.NET 2.0中的数据操作之八:使用两个DropDownList过滤的主/从报表
  • 2017-05-11ASP.NET中各个后缀名的含义介绍
  • 2018-08-20Centos7+Docker+Jenkins+ASP.NET Core 2.0自动化发布与部署的实现
  • 2017-05-11asp.net各种cookie代码和解析实例
  • 2017-05-11asp.net javascript 文件无刷新上传实例代码第1/2页
  • 2017-05-11白刃之战:PHP vs. ASP.NET(节选)-架构比较
  • 2017-05-11asp.net 判断数组是否存在某个值的方法
  • 2017-05-11ASP.NET Session会导致的性能问题
  • 2018-08-20ASP.NET 谨用 async/await

文章分类

  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号

最近更新的内容

    • asp.net 模拟提交有文件上传的表单(通过http模拟上传文件)
    • 解析ABP框架中的事务处理和工作单元
    • asp.net字符串处理类代码
    • asp.net性能优化之使用Redis缓存(入门)
    • Asp.net SignalR 应用并实现群聊功能 开源代码
    • asp.net下Oracle,SQL Server,Access万能数据库通用类
    • 动态改变ASP.net页面标题和动态指定页面样式表的方法
    • asp.net fileupload控件上传文件与多文件上传
    • 在asp.NET 中使用SMTP发送邮件的实现代码
    • asp.net中调用Office来制作3D统计图的实例代码

关于我们 - 联系我们 - 免责声明 - 网站地图

©2020-2025 All Rights Reserved. linkedu.com 版权所有