次のプロダクトは、Document AI と機能を共有しています。ただし、これらのプロダクトは特定のテキストと分析の機能を実行します。ユースケースによっては、これらのプロダクトで必要な特定の機能を利用できる場合があります。
画像をテキストに変換する
画像内のコンテンツをテキストに変換するには、次のいずれかの方法を使用します。
- Enterprise Document OCR。
Cloud Vision API(
TEXT_DETECTION
列挙型またはDOCUMENT_TEXT_DETECTION
列挙型を使用)。参照:
視覚的なアーティファクトを検出する
AutoML Vision オブジェクト検出を使用すると、画像の一部をテキスト ドキュメントに変換できます。詳しくは、画像データをご覧ください。
ドキュメントを分類する
ドキュメントの書式なしテキストと OCR を事前に実行することで、次のプロダクトを使用してドキュメントを分類し、ラベル付けできます。
- 事前トレーニング済みの Natural Language API を使用すると、カテゴリの一般化されたリストを使用してコンテンツを分類できます。
- AutoML Natural Language 分類を使用してカスタム機械学習モデルを作成し、独自のカテゴリラベルでコンテンツを分類します。
例外がある場合もありますが、一般的に、AutoML Vision 分類はテキストベースの方法よりも精度が低くなる傾向があるため、ドキュメント分類にはおすすめしません。ただし、画像コンテンツの分類には使用できます。
- 一般的に、この方法はドキュメントの分類には推奨されません。精度がテキストベースの方法よりも低くなる傾向があるためです。ただし、例外もあります。
Natural Language API | |
AutoML Natural Language 分類 | |
AutoML Vision 分類 |
エンティティを分析して抽出する
フォーム パーサーまたはユースケースの事前トレーニング済みプロセッサのいずれかを使用して、ドキュメント内の既知のエンティティ(著名人、会社のブランディングなどの固有名詞)と、電話番号や住所などの一般的なパターンに従うエンティティを識別できます。
- Natural Language API を使用して、一般的な公開エンティティを識別することもできます。
- AutoML Natural Language プロダクトはエンティティ抽出用です。これらを使用して、会社やユースケースに固有のエンティティを識別するカスタム機械学習モデルを作成します。
Natural Language API | |
AutoML Natural Language Entity Extraction |
その他のサービス
これらの補完的なプロダクトを Document AI と統合して、完全なドキュメント処理と分析ソリューションを作成します。
- Vertex AI: AutoML と AI Platform を統合された API、クライアント ライブラリ、プラットフォームにまとめます。
- Cloud Translation API: 事前トレーニング済みモデルを使用して、数千もの言語ペアでテキストを動的に翻訳します。PDF や DOCX などの形式のドキュメントを直接翻訳する Document Translation API を提供します。ドキュメントを翻訳するをご覧ください。
- Workflows: Google Cloud サービスと API を組み合わせて、信頼性の高いアプリケーション、プロセス自動化、データ パイプラインと機械学習パイプラインを構築します。
- AppSheet Automation: オープン クラウドでカスタム自動化とアプリケーションを作成します。
- Google ドライブのドライブ スキャナ: Google ドライブの Android アプリでは、ドキュメントをスキャンして Google ドライブにアップロードできます。また、Document AI を活用したインテリジェントなタイトルの候補も表示されます。
- Google 翻訳: 単語、フレーズ、ウェブページを英語から 100 以上の他言語にすぐに翻訳できるサービスです。
パートナーを探す
拡大を続ける Google のパートナー エコシステムを活用して、ドキュメント分析ソリューションの作成と管理を行いましょう。パートナーのリストと提供しているサービスについては、Document AI パートナーをご覧ください。