フランスのMistral AIが新しいOCR「Mistral OCR」を発表。高速で多言語対応、複雑な文書解析が可能。
要約するとフランスのAIスタートアップ企業Mistral AIは、6日に新しい光学式文字認識(OCR)技術「Mistral OCR」を発表しました。
このOCRは、複雑な文書の解析を高速かつ高精度で行うことができ、特に画像、表、数式などが含まれるドキュメントからテキストや図版情報を抽出し、マークダウン形式で出力することが可能です。
また、多言語対応が特徴で、広範なスクリプトやフォントの解析にも対応しています。
ベンチマークテストでは、既存の主要なOCRモデルを上回る精度を示しましたが、日本語はまだサポートされていません。
さらに、Mistral OCRは1ノードあたり最大2,000ページを1分で処理できる高速性も持ち合わせています。
出力形式はテキストだけでなく、JSONなどの構造化データにも対応しており、ドキュメントそのものをプロンプトとして利用する機能も提供されています。
特に機密性の高い情報を扱う組織向けには、オンプレミス導入のオプションも計画されており、ユーザーのニーズに応じた柔軟な対応が期待されています。
この新技術は、OCRの利用をさらに広げる可能性を秘めており、特にビジネスや学術研究の分野での活用が見込まれています。
参考リンクhttps://news.yahoo.co.jp/articles/7aa33860a9a65acf81b00892f780ac4ad27db332