C#使用Tesseract进行Ocr识别的方法实现

当前位置：网站建设 > 技术支持

资料来源：网络整理时间：2023/2/14 1:09:46 共计：3664 浏览

1.Nuget搜索Tesseract

2.项目安装Tesseract

3.引用命名空间

4.上Github下载别人的训练库

5.选择图片进行识别

1.Nuget搜索Tesseract

2.项目安装Tesseract

3.引用命名空间

using Tesseract;

自媒体培训

4.上Github下载别人的训练库

https://github.com/tesseract-ocr/tessdata 这里下载中文的chi_sim.traineddata，放到了D盘根目录

5.选择图片进行识别

我把图片命名为image.jpg放在了D盘根目录

//图片文件路径

string imageFileName = @"D:\image.png";

//创建位图对象

Bitmap image = new Bitmap(imageFileName);

//Tesseract.Page

Page page = new TesseractEngine(@"D:\", "chi_sim", EngineMode.Default).Process(PixConverter.ToPix(image));

//释放程序对图片的占用

image.Dispose();

//打印识别率

Console.WriteLine(String.Format("{0:P}", page.GetMeanConfidence()));

//打印识别文本 //替换'/n'为'(空)'//替换'(空格)'为'(空)'

Console.WriteLine(page.GetText().Replace("\n", "").Replace(" ", ""));

识别率为百分之84，识别文字为立白liby

到此这篇关于C#使用Tesseract进行Ocr识别的方法实现的文章就介绍到这了,更多相关C# Ocr识别内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

版权说明：
本网站凡注明“广州京杭原创”的皆为本站原创文章，如需转载请注明出处！
本网转载皆注明出处，遵循行业规范，如发现作品内容版权或其它问题的，请与我们联系处理！
欢迎扫描右侧微信二维码与我们联系。