この記事は、2024/11/15に公開された「Enable Image Analysis with Cloudera’s New Accelerator for Machine Learning Projects Based on Anthropic Claude」の翻訳です。
企業は、画像、手書きの文字、ドキュメントなど、大量の非構造化データを収集しています。しかも、これらのデータの大半は、まだ手動で収集されています。このようなデータからビジネス上の洞察を引き出すには、データをデジタル化することが重要です。手動のプロセスで出力したデータをデジタル化する上で最も困難なのが、非構造化データを変換して実用的な洞察を得られる形式にすることです。
人工知能は、複雑で抽象的な非構造化データ資産からビジネス上の貴重な洞察を抽出するための新しいツールです。こうした AI アプリケーションをすばやく効率的に作成して非構造化データを発掘できるようにするため、Cloudera は、Accelerator for Machine Learning Projects (AMP) に新たな機能を導入しました。この新機能は使いやすい AI クイックスターターで、画像に含まれる情報の抽出や操作をサポートする大規模言語モデル (LLM) である Anthropic 社の Claude をベースとしています。Claude 3は従来の光学文字認識 (OCR) を超える高度な推論機能を備えているため、手書きのメモをテキストに変換する場合でも、情報量の多い複雑なフォームからデータを抽出する場合でも、ユーザーは必要な情報だけを画像から正確に指定して取り出すことができます。
他の OCR システムと異なり、Claude 3は文脈を見落としたりデータのクリーニングに複数の手順を要したりしないため、文書を理解する複雑な作業をすぐに実行できます。そのため、構造化されていない画像入力データをすばやくデジタル化して分析し、機械で読み取り可能な形式で抽出する必要がある企業に非常に有効なツールとなっています。
非構造化データから情報を検索して取得できる機能は、時間のかかる手動の管理業務を迅速かつ正確にデジタル化したい企業にとって極めて重要です。この AMP により、組織のデータや個々のユースケース固有の文脈に応じて調整された、本番運用可能なモデルをすばやく展開できます。
この AMP のユースケースとしては、以下のようなものが想定されます。
印字されたテキストの変換: スキャンされた文書、PDF、印刷物からデジタルテキストをすばやく抽出して、ドキュメントの効率的なデジタル化をサポートします。
手書きのテキストの変換: 手書きのメモを機械で読み取り可能なテキストに変換します。個人のメモや歴史的資料、さらには法的文書をデジタル化するのに最適です。
フォームの転記: 構造化されたフォームからデータを抽出しながら、構成やレイアウトを維持することで、データ入力プロセスを自動化します。
複雑なドキュメントに対応した質問応答: ドキュメントに関して文脈に沿った質問が行われると、複雑なフォームや形式のドキュメントからでも適切な回答を引き出します。
データの変換: 構造化されていない画像コンテンツを JSON 形式に変換し、画像ベースのデータを構造化データベースやワークフローに簡単に統合できるようにします。
ユーザー定義のプロンプト: 上級ユーザー向けに、カスタムプロンプトを柔軟に作成できる機能を提供し、画像データを含む特定分野のユースケースや高度に専門化されたユースケースに対応します。
この AMP は、ボタンをクリックするくらいの手間で簡単に利用を開始できます。ユーザーは、Cloudera AI (旧 Cloudera Machine Learning) ワークスペース内の AMP カタログから起動することも、リポジトリ URL を使用して新しいプロジェクトを開始することもできます。要件や開始手順の詳細については、GitHub のガイドをご覧ください。
This may have been caused by one of the following: