Aspose.OCR for Java
探索Aspose OCR Java库的高效OCR功能,支持140+语言及多种格式,适用于跨平台文档处理与数据提取,提供精准文本识别与资源优化方案。
使用 Aspose OCR Java 库解锁强大的 OCR 功能。我们的 Java API 是一款高效、用户友好且经济实惠的 OCR API。只需五行 Java 代码,即可为您的应用程序添加强大的 OCR 功能,无需了解神经网络和其他技术细节。
我们的 OCR 引擎提供无与伦比的速度和准确性,支持超过 130 种语言,包括英语、西里尔文、阿拉伯语、波斯语、中文、日语、韩语、印地语、泰米尔语等等。无论您处理的是扫描件、智能手机照片、屏幕截图还是 PDF,我们的 OCR 都能提取文本并以所有常用格式生成结果。
图像预处理功能可自动校正旋转、模糊、反转和噪点图像,以确保在任何条件下都拥有最高的识别准确率。
体验简单:只需几行 Java 代码即可将图像转换为文本
将文件拖放到此处或单击浏览** 通过上传您的文件或使用服务,您同意我们的使用条款和隐私政策。
AsposeOCR api = new AsposeOCR(); // Add images to the recognition batch OcrInput images = new OcrInput(InputType.SingleImage); images.add("image1.png"); images.add("image2.png"); // Recognition language RecognitionSettings recognitionSettings = new RecognitionSettings(); recognitionSettings.setLanguage(Language.Eng); // Recognize images ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings); results.forEach((result) -> { System.out.println(result.recognition_text); });
Aspose Java OCR 代码可在任何支持 Java SE 6.0 或更高版本的平台上无缝运行 - 无论是本地机器、Web 服务器还是云端。
Aspose.OCR for Java 可以处理任何 扫描仪或相机获取的文件。识别结果可以保存、导入数据库或进行实时分析。
Aspose.OCR for Java 以轻量级 Java Archive (JAR) 文件或可下载文件的形式发布, 依赖关系极少。只需将 其安装 到您的项目中,即可识别多种支持语言的文本,并以多种格式保存识别结果。
申请试用许可证 以启动功能齐全、不受限制的 OCR 应用程序的开发。
我们的 Java 库完全支持 Java SE 6 或更高版本,使您的应用程序能够在任何平台上无缝运行 - 桌面 Windows、Windows Server、macOS、Linux 和云。
我们的 Java OCR 库是一套通用的解决方案,适用于全球范围内的文档处理、数据提取和内容数字化。它支持多种欧洲、中东和亚洲的书写文字,能够完美适配任何国家/地区和企业。
Aspose OCR for Java 可识别多语言文档中的文本,例如中文/英文、阿拉伯文/法文或西里尔文/英文。支持以下语言:
Aspose.OCR for Java 探索 Aspose OCR for Java 的高级特性和功能。
照片OCR
以扫描级精度从智能手机照片中提取文本。
可搜索的 PDF
将任何扫描件转换为可搜索和可编辑的文档。
URL识别
通过 URL 识别图像,无需将其下载到本地。
批量识别
读取多页文档、文件夹和档案中的所有图像。
任何字体和样式
识别和辨认所有流行字体和样式的文本。
微调识别
调整每个 OCR 参数以获得最佳识别结果。
拼写检查器
通过自动纠正拼写错误的单词来改善结果。
在图像中查找文本
在一组图像中搜索文本或正则表达式。
比较图片文字
比较两张图片上的文字,无论大小写和布局如何。
全世界
使用自动语言检测提取任何语言的文本。
关键细节提取
自动从身份证中提取重要细节。
与 Aspose 解决方案完全集成
将 OCR 与其他 Aspose 产品无缝集成,以获得全面、高效的 Java 解决方案。
探索代码示例以了解如何将 OCR API 无缝集成到您的 Java 应用程序中。
克服 OCR 应用缺乏广泛扫描仪支持的挑战。我们的 API 拥有强大的内置图像预处理滤镜,能够轻松处理旋转、倾斜和噪点图像。此外,它还支持所有图像格式,即使是智能手机照片也能实现可靠的识别。大多数预处理和图像校正都是自动化的,只有在棘手的情况下才需要您手动干预。
// Create instance of OCR API AsposeOCR api = new AsposeOCR(); // Define pre-processing filters PreprocessingFilter filters = new PreprocessingFilter(); filters.add(PreprocessingFilter.ToGrayscale()); filters.add(PreprocessingFilter.Rotate(-90)); // Pre-process image before recognition BufferedImage imageRes = api.PreprocessImage(imagePath, filters); // Recognize image RecognitionResult result = api.RecognizePage(imageRes, set);
在您的 Java 应用程序中集成文本检测和识别。轻松获取照片的精准结果,增强您的图像处理能力。提升图像处理能力,从照片中获取精准结果。
// Add a photo to the recognition batch OcrInput images = new OcrInput(InputType.SingleImage); images.add("photo.jpg"); // Set photo recognition mode RecognitionSettings recognitionSettings = new RecognitionSettings(); recognitionSettings.setDetectAreasMode(DetectAreasMode.PHOTO); // Extract text from a photo ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings); results.forEach((result) -> { System.out.println(result.recognition_text); });
光学字符识别需要消耗大量资源。我们的 API 提供了灵活的方法来平衡经典的时间-价格-质量三要素。它允许您限制识别引擎使用的线程数量。虽然这种调整可能会导致识别速度变慢,但它使您能够为并行图像处理、Web 服务器操作、数据库管理或后台数据分析等并发任务分配资源。
RecognitionSettings recognitionSettings = new RecognitionSettings(); recognitionSettings.setThreadsCount(2);
如果您的图像是高质量扫描件,没有倾斜或失真,则可以使用最快的识别模式,该模式消耗的资源最少:
AsposeOCR api = new AsposeOCR(); // Add images to the recognition batch OcrInput images = new OcrInput(InputType.SingleImage); images.add(os.path.join(self.dataDir, "source1.png")); images.add(os.path.join(self.dataDir, "source2.png")); // Fast recognize images ArrayList<RecognitionResult> results = api.RecognizeFast(images); results.forEach((result) -> { System.out.println(result); });