Aspose.OCR for Java

探索Aspose OCR Java库的高效OCR功能,支持140+语言及多种格式,适用于跨平台文档处理与数据提取,提供精准文本识别与资源优化方案。

为什么选择 Java 的 Aspose OCR 库?

使用 Aspose OCR Java 库解锁强大的 OCR 功能。我们的 Java API 是一款高效、用户友好且经济实惠的 OCR API。只需五行 Java 代码,即可为您的应用程序添加强大的 OCR 功能,无需了解神经网络和其他技术细节。

我们的 OCR 引擎提供无与伦比的速度和准确性,支持超过 130 种语言,包括英语、西里尔文、阿拉伯语、波斯语、中文、日语、韩语、印地语、泰米尔语等等。无论您处理的是扫描件、智能手机照片、屏幕截图还是 PDF,我们的 OCR 都能提取文本并以所有常用格式生成结果。
图像预处理功能可自动校正旋转、模糊、反转和噪点图像,以确保在任何条件下都拥有最高的识别准确率。

插图 OCR

快速、精确的 OCR

利用我们先进的 Java 技术实现高速、准确的 OCR 结果。

多语言支持

所有图片

混合语言检测

任何字体、样式和格式

实时代码示例

体验简单:只需几行 Java 代码即可将图像转换为文本

将文件拖放到此处或单击浏览*

* 通过上传您的文件或使用服务,您同意我们的使用条款隐私政策

将图像转换为文本

探索更多示例 >
AsposeOCR api = new AsposeOCR(); // Add images to the recognition batch OcrInput images  = new OcrInput(InputType.SingleImage); images.add("image1.png"); images.add("image2.png"); // Recognition language RecognitionSettings recognitionSettings = new RecognitionSettings(); recognitionSettings.setLanguage(Language.Eng); // Recognize images ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings); results.forEach((result) -> {   System.out.println(result.recognition_text); });


跨平台

Aspose Java OCR 代码可在任何支持 Java SE 6.0 或更高版本的平台上无缝运行 - 无论是本地机器、Web 服务器还是云端。

微软 WindowsLinuxMacOSGitHub微软 Azure亚马逊网络服务Docker

支持的文件格式

Aspose.OCR for Java 可以处理任何 扫描仪或相机获取的文件。识别结果可以保存、导入数据库或进行实时分析。

图片

  • PDF
  • JPEG
  • 巴布亚新几内亚
  • TIFF
  • 动图
  • 位图

批量OCR

  • 多页 PDF
  • 拉链
  • 文件夹

识别结果

  • 文本
  • PDF
  • 微软 Word
  • 微软 Excel
  • HTML
  • RTF
  • 电子出版
  • JSON
  • XML

易于安装

Aspose.OCR for Java 以轻量级 Java Archive (JAR) 文件或可下载文件的形式发布, 依赖关系极少。只需将 其安装 到您的项目中,即可识别多种支持语言的文本,并以多种格式保存识别结果。

申请试用许可证 以启动功能齐全、不受限制的 OCR 应用程序的开发。

随处可用

我们的 Java 库完全支持 Java SE 6 或更高版本,使您的应用程序能够在任何平台上无缝运行 - 桌面 Windows、Windows Server、macOS、Linux 和云。

140多种识别语言

我们的 Java OCR 库是一套通用的解决方案,适用于全球范围内的文档处理、数据提取和内容数字化。它支持多种欧洲、中东和亚洲的书写文字,能够完美适配任何国家/地区和企业。

Aspose OCR for Java 可识别多语言文档中的文本,例如中文/英文、阿拉伯文/法文或西里尔文/英文。支持以下语言:

  • 扩展拉丁语:英语、西班牙语、法语、印尼语、葡萄牙语、德语、越南语、土耳其语、意大利语、波兰语等 80 多种语言;
  • 西里尔字母:俄语、乌克兰语、哈萨克语、保加利亚语,包括西里尔文/英语混合文本;
  • 阿拉伯语、波斯语、乌尔都语,包括混合英语的文本;
  • 汉语、韩语、日语、天城文和达罗毗荼语,包括印地语、泰米尔语、马拉地语等。

特性和功能

Aspose.OCR for Java 探索 Aspose OCR for Java 的高级特性和功能。

功能图标

照片OCR

以扫描级精度从智能手机照片中提取文本。

功能图标

可搜索的 PDF

将任何扫描件转换为可搜索和可编辑的文档。

功能图标

URL识别

通过 URL 识别图像,无需将其下载到本地。

功能图标

批量识别

读取多页文档、文件夹和档案中的所有图像。

功能图标

任何字体和样式

识别和辨认所有流行字体和样式的文本。

功能图标

微调识别

调整每个 OCR 参数以获得最佳识别结果。

功能图标

拼写检查器

通过自动纠正拼写错误的单词来改善结果。

功能图标

在图像中查找文本

在一组图像中搜索文本或正则表达式。

功能图标

比较图片文字

比较两张图片上的文字,无论大小写和布局如何。

功能图标

全世界

使用自动语言检测提取任何语言的文本。

功能图标

关键细节提取

自动从身份证中提取重要细节。

功能图标

与 Aspose 解决方案完全集成

将 OCR 与其他 Aspose 产品无缝集成,以获得全面、高效的 Java 解决方案。

代码示例

探索代码示例以了解如何将 OCR API 无缝集成到您的 Java 应用程序中。

安装

Aspose OCR for Java 可轻松分发为 Java 存档 (JAR) 文件,依赖关系极少,也可从 Maven 存储库获取。您可以直接从您首选的 Java 集成开发环境 (IDE) 无缝集成到您的项目中。只需安装,即可充分利用 OCR 的全部功能,并以任何支持的格式保存识别结果。

安装完成后,您可以立即开始使用 Aspose.OMR for Java,但会受到一些限制。临时许可证可在 30 天内解除所有试用版限制。您可以利用这段时间开发功能齐全的 OCR 应用程序,以便日后做出是否购买 Aspose.OCR for Java 的明智决定。

使用 Java 识别扫描图像上的文本

克服 OCR 应用缺乏广泛扫描仪支持的挑战。我们的 API 拥有强大的内置图像预处理滤镜,能够轻松处理旋转、倾斜和噪点图像。此外,它还支持所有图像格式,即使是智能手机照片也能实现可靠的识别。大多数预处理和图像校正都是自动化的,只有在棘手的情况下才需要您手动干预。

应用自动图像校正 - Java

// Create instance of OCR API AsposeOCR api = new AsposeOCR();  // Define pre-processing filters PreprocessingFilter filters = new PreprocessingFilter(); filters.add(PreprocessingFilter.ToGrayscale()); filters.add(PreprocessingFilter.Rotate(-90));  // Pre-process image before recognition BufferedImage imageRes = api.PreprocessImage(imagePath, filters);  // Recognize image RecognitionResult result = api.RecognizePage(imageRes, set);

使用 Java 从照片中提取文本

在您的 Java 应用程序中集成文本检测和识别。轻松获取照片的精准结果,增强您的图像处理能力。提升图像处理能力,从照片中获取精准结果。

检测并识别照片上的文字 - Java

// Add a photo to the recognition batch OcrInput images  = new OcrInput(InputType.SingleImage); images.add("photo.jpg");  // Set photo recognition mode RecognitionSettings recognitionSettings = new RecognitionSettings(); recognitionSettings.setDetectAreasMode(DetectAreasMode.PHOTO);  // Extract text from a photo ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings); results.forEach((result) -> {   System.out.println(result.recognition_text); });

Java中的资源优化

光学字符识别需要消耗大量资源。我们的 API 提供了灵活的方法来平衡经典的时间-价格-质量三要素。它允许您限制识别引擎使用的线程数量。虽然这种调整可能会导致识别速度变慢,但它使您能够为并行图像处理、Web 服务器操作、数据库管理或后台数据分析等并发任务分配资源。

  • 在彻底识别和快速识别之间进行选择。
  • 指定分配给识别的线程数,或允许库自动扩展到处理器核心的数量。
  • 通过将计算卸载到 GPU 来释放 CPU。

平衡资源使用

RecognitionSettings recognitionSettings = new RecognitionSettings(); recognitionSettings.setThreadsCount(2);

只需极少设置即可快速识别

如果您的图像是高质量扫描件,没有倾斜或失真,则可以使用最快的识别模式,该模式消耗的资源最少:

快速识别OCR - Java

AsposeOCR api = new AsposeOCR();  // Add images to the recognition batch OcrInput images  = new OcrInput(InputType.SingleImage); images.add(os.path.join(self.dataDir, "source1.png")); images.add(os.path.join(self.dataDir, "source2.png"));  // Fast recognize images ArrayList<RecognitionResult> results = api.RecognizeFast(images); results.forEach((result) -> {   System.out.println(result); });


产品推荐

  • 账号登录
社交账号登录