HANCOM

AI

Hancom は、新しい AI 技術と長年蓄積されたデータを統合することで、
個人と企業のいずれにもご利用いただける技術を提供しています。

Hancom Data Loader
AI 向けの文書データの抽出 SDK

Hancom Data Loader は文書データ抽出 SDK であり、さまざまな文書形式を効率的にデータに変換し、そのデータを利用できるようにします。この SDK は、検索拡張生成 (RAG) ソリューションを構築するコア テクノロジーです。

  • AI features for generating ideas about documents

    1.文書からのデータの正確な抽出と分割

  • A chatbot that handles your needs automatically

    2.メタデータを抽出して意味上の単位ごとに文書をセグメント化

  • Customized workingenvironments just for you

    3.json や csv などの形式をサポートし、広範囲の利用が可能

Hancom の AI 文書データ抽出テクノロジー

文書のテキスト、表、グラフ、画像を効果的にデータに変換し、AI 学習および RAG のためにメタデータとして提供します。

文書のテキスト、表、グラフ、画像などのデータを抽出

メタデータの種類
  • Passage

    パッセージ

    • ページ番号、場所、段落情報
    • 文書のメタデータ (例: 最終更新日)
  • Text

    テキスト

    • テキストの抽出
    • 段落、表、ヘッダー、フッターなどの文書レイアウト要素によるテキスト処理
    • 複数の列の種類による分類
  • Table

    • 行/列で結合されたセルの特定および処理
    • 表内の複合表の特定および処理
    • ページの境界を越えた表情報の認識
    • 境界のない表の処理
  • ai-Assistant

    画像

    • 画像からのテキストおよび表情報の抽出
    • 画像検索のためのメタデータ
Hancom Data Loader は、
前処理 (読込と分割) の間の精度と処理時間を大幅に改善する RAG ソリューションを構築するコア テクノロジーです。
Data Loader Process Data Loader Process

RAG ソリューションを構築するためのコア テクノロジー