以下产品与 Document AI 共享功能。不过,这些产品可执行特定的文本和分析功能。根据您的使用场景,这些产品可能提供您所需的特定功能。
将图片转换成文字
您可以使用以下任一方法将图片中的内容转换为文字:
- Enterprise Document OCR。
Cloud Vision API(使用
TEXT_DETECTION
或DOCUMENT_TEXT_DETECTION
枚举)。请参阅:
检测视觉伪影
您可以使用 AutoML Vision 对象检测将图片的部分内容转换为文本文档。如需了解详情,请参阅图片数据。
对文档进行分类
在获取文档纯文本并预先运行 OCR 后,您可以使用以下产品对文档进行分类和标记:
- 借助预训练的 Natural Language API,您可以使用通用类别列表对内容进行分类。
- 使用 AutoML Natural Language 分类功能创建自定义机器学习模型,并使用您自己的类别标签对内容进行分类。
虽然也有例外情况,但一般不建议使用 AutoML Vision 分类进行文档分类,因为它的准确性往往不如基于文本的方法。不过,您可以使用它来对图片内容进行分类。
- 这通常不是建议的文档分类方法,因为它的准确性往往不如基于文本的方法,但也有例外情况
Natural Language API | |
AutoML Natural Language 分类 | |
AutoML Vision 分类 |
分析和提取实体
您可以使用 Form Parser 或任何预训练的处理器来识别文档中的已知实体(专有名词,例如公众人物、公司品牌等)以及遵循常见模式的实体(例如手机号码和地址),以满足您的使用情形。
- 您还可以使用 Natural Language API 来识别常见的公共实体。
- AutoML Natural Language 产品用于实体提取。您可以使用这些数据创建自定义机器学习模型,以识别特定于贵公司或使用情形的实体。
Natural Language API | |
AutoML Natural Language 实体提取 |
其他产品
将这些互补产品与 Document AI 集成,打造完整的文档处理和分析解决方案。
- Vertex AI:将 AutoML 和 AI Platform 整合到统一的 API、客户端库和平台中。
- Cloud Translation API:通过预训练模型在数以千计的语言对之间动态翻译文本。提供了一个文档翻译 API,用于直接翻译 PDF 和 DOCX 等格式的文档。请参阅翻译文档。
- 工作流:结合使用 Google Cloud 服务和 API 来构建可靠的应用、流程自动化以及数据和机器学习流水线。
- AppSheet Automation:通过开放的云创建自定义自动化和应用。
- Google 云端硬盘扫描器:借助 Google 云端硬盘 Android 应用,您可以扫描文档并将其上传到 Google 云端硬盘,还可以获得由 Document AI 提供的智能标题建议。
- Google 翻译:这项服务可提供英文和另外 100 多种语言之间的互译功能,让您即时翻译字词、短语和网页内容。
寻找合作伙伴
借力于我们不断发展壮大的合作伙伴生态系统,您可以更轻松地创建和管理文档分析解决方案。如需查看合作伙伴及其提供的服务,请参阅 Document AI 合作伙伴。