Aspose.OCR for C++

探索Aspose.OCR for C++,强大的文字识别工具,支持多语言和多种格式,轻松集成到您的C++项目中。

为什么选择 Aspose.OCR for C++?

在本地应用程序、Web 服务或云端创建并识别任何布局和复杂程度的机器可读表单。我们的解决方案适用于各种规模的项目——从简单的调查和测验到期末考试和选举。点击下方项目,了解更多关于我们的功能和优势。

插图 OCR

照片OCR

以扫描级精度从智能手机照片中提取文本。

可搜索的 PDF

URL识别

批量识别

任何字体和样式

实时代码示例

体验简单:只需三行 C++ 代码即可将图像转换为文本!

将文件拖放到此处或单击浏览*

* 通过上传您的文件或使用服务,您同意我们的使用条款隐私政策

将图像转换为文本

发现更多示例 > 
  string file = "source.png";   AsposeOCRInput source;   source.url = file.c_str();   vector<AsposeOCRInput> content = {source};    RecognitionSettings settings;   settings.language_alphabet = language::eng;    size_t size = 0;   wchar_t* buffer = asposeocr_serialize_result(result, size);   wcout << wstring(buffer) << endl;    asposeocr_free_result(result);


C++ 的力量无处不在

Aspose.OCR for C++ 可在任何平台上无缝运行。

微软 WindowsLinuxMacOSGitHub微软 Azure亚马逊网络服务Docker

支持的文件格式

Aspose.OCR for C++ 可以处理任何 扫描仪或相机获取的文件。识别结果可以保存、导入数据库或进行实时分析。

图片

  • JPEG
  • 巴布亚新几内亚
  • TIFF
  • 骨形态发生蛋白

批量OCR

  • 多页 PDF
  • 拉链
  • 文件夹

识别结果

  • 文本
  • PDF
  • 微软 Word
  • 微软 Excel
  • RTF
  • JSON
  • XML

安装

Aspose.OCR C++ 库以 NuGet 包或 可下载文件的形式发布, 且依赖关系极少。轻松将 其安装 到您的项目中,即可识别多种支持语言的文本,并以多种格式保存识别结果。

申请试用许可证 以启动功能齐全、不受限制的 OCR 应用程序的开发。

全面提升 C++ 的威力

我们的库完全支持 C++11 及更高版本,使您的应用程序能够在任何平台上无缝运行 - 桌面 Windows、Windows Server、macOS、Linux 和云。

130多种识别语言

我们的 C++ OCR API 可以识别多种语言和流行的书写脚本,包括混合语言:

将语言检测留给库或自行定义语言以增强识别性能和可靠性。

  • 扩展拉丁字母:英语、西班牙语、法语、印尼语、葡萄牙语、德语、越南语、土耳其语、意大利语、波兰语等 80 多种语言;
  • 西里尔字母:俄语、乌克兰语、哈萨克语、塞尔维亚语、白俄罗斯语、保加利亚语;
  • 阿拉伯语、波斯语、乌尔都语;
  • 中文和天城文文字,包括印地语、马拉地语、博杰普尔语等。

功能和能力

Aspose.OCR for C++ 探索 Aspose.OCR for C++ 的高级特性和功能。

功能图标

照片OCR

以扫描级精度从智能手机照片中提取文本。

功能图标

可搜索的 PDF

将任何扫描件转换为完全可搜索和可索引的文档。

功能图标

URL识别

通过 URL 识别图像,无需将其下载到本地。

功能图标

批量识别

读取多页文档、文件夹和档案中的所有图像。

功能图标

任何字体和样式

识别和辨认所有流行字体和样式的文本。

功能图标

微调识别

调整每个 OCR 参数以获得最佳识别结果。

功能图标

拼写检查器

通过自动纠正拼写错误的单词来改善结果。

功能图标

在图像中查找文本

在一组图像中搜索文本或正则表达式。

功能图标

比较图片文字

比较两张图片上的文字,无论大小写和布局如何。

功能图标

限制识别范围

限制 OCR 引擎将查找的字符集。

功能图标

检测图像缺陷

自动查找图像中可能存在问题的区域。

功能图标

识别区域

查找并读取图像的特定区域,而不是所有文本。

C++ 代码示例

深入研究代码示例,将 Aspose.OCR for C++ 无缝集成到您的应用程序中。

C++ 安装精通

Aspose.OCR for C++ 是一个轻量级的 C++ 存档 (LIB) 文件或可下载文件,依赖关系极少,易于分发。您可以直接从您首选的 C++ 集成开发环境 (IDE) 无缝集成到您的项目中。只需安装,即可充分利用 OCR 的全部功能,并以任何支持的格式保存识别结果。

安装完成后,您可以立即开始使用 Aspose.OCR for C++,但会受到一些限制。临时许可证可在 30 天内解除所有试用版的限制。您可以利用这段时间开始开发功能齐全的 OCR 应用程序,以便日后做出是否购买 Aspose.OCR for C++ 的明智决定。

C++ 照片的 OCR

克服 OCR 应用缺乏广泛扫描仪支持的挑战。我们的 API 拥有强大的内置图像预处理滤镜,能够轻松处理旋转、倾斜和噪点图像。此外,它支持所有图像格式,即使是智能手机照片也能实现可靠的识别。大多数预处理和图像校正都是自动化的,只有在棘手的情况下才需要您干预。您还可以预定义要处理的图像区域。

设置倾斜校正的自定义角度并定义识别区域 - C++

string file = "photo.png"; AsposeOCRInput source; source.url = file.c_str(); std::vector<AsposeOCRInput> content = { source };  // Fine-tune recognition RecognitionSettings settings; settings.detect_areas_mode = detect_areas_mode_enum::PHOTO;  // Extract text from the photo auto result = asposeocr_recognize(content.data(), content.size(), settings);  // Output the recognized text wchar_t* buffer = asposeocr_serialize_result(result, buffer_size, export_format::text); std::wcout << std::wstring(buffer) << std::endl;  // Release the resources asposeocr_free_result(result);

检测图像缺陷

图像缺陷会显著影响 OCR 的准确性。这些缺陷可能由图像采集过程的质量、环境条件以及用于捕获图像的硬件造成。为了提高识别准确性,必须对图像进行预处理和增强,尽可能地减少这些缺陷。Aspose.OCR

for C++ 可以 在识别过程中自动查找 图像中潜在的问题区域。您可以在预览图像时突出显示问题区域,甚至可以使用其他识别设置对其进行 OCR 处理,以获得更佳效果。

识别模糊、扭曲和低对比度图像上的文本 - C++

// Provide the image string file = "source.png"; AsposeOCRInput source; source.url = file.c_str(); vector<AsposeOCRInput> content = {source};  // Activate detection of low-contrast areas RecognitionSettings settings; settings.defect_type = defect_type::ASPOSE_OCR_DETECT_DARK_IMAGES;  // Find and show low-contrast areas AsposeOCRRecognitionResult result = asposeocr_recognize(content.data(), content.size(), settings); for (size_t p_number = 0; p_number < result.pages_amount; ++p_number) {   cout << "Page " << p_number << ";\n";   const auto& page = result.recognized_pages[p_number];   for (size_t defect_number = 0; defect_number < page.defects_count; ++defect_number)   {     const auto& defect_area = page.defect_areas[defect_number];     cout << "Low-contrast area " << defect_number << ":" << defect_area.area << std::endl;   } }  // Release the resources asposeocr_free_result(result);

批处理

OCR API 提供各种批处理方法,允许您在一次调用中识别多张图像,使您无需逐张识别每张图像:

  • 识别多页 PDF 和 TIFF 文件。
  • 识别文件夹中的所有文件。
  • 识别档案中的所有文件。

识别 ZIP 档案 - C++

// Provide a ZIP archive string file = "pages.zip"; AsposeOCRInput source; source.url = file.c_str(); std::vector<AsposeOCRInput> content = { source };  // Fine-tune recognition RecognitionSettings settings; settings.detect_areas_mode = detect_areas_mode_enum::COMBINE;  // Extract texts auto result = asposeocr_recognize(content.data(), content.size(), settings);


产品推荐

  • 账号登录
社交账号登录