LayerX エンジニアブログ

LayerX の エンジニアブログです。

【Data-centric AI】Confident Learningによるデータセットの品質改善【固有表現抽出編】

はじめに こんにちは。機械学習エンジニアの上川です。LayerXでは、バクラクのAI-OCR機能の精度改善に取り組んでいます。本記事では、Data-centric AIにまつわる技術を用いて、AI-OCRデータセットの品質改善を行うための技術検証を行なったのでその紹介をし…

バクラクのデータセットを用いた項目領域推定とレイアウト情報の重要性

こんにちは。機械学習エンジニアの上川です。本記事では、バクラクのデータを用いて書類上の項目領域を推定する物体検出モデルを構築し、項目領域の推定におけるレイアウト情報の重要性について考察を行ったので、その紹介をします。 AI-OCRにおけるレイアウ…

Document Layout Analysisに物体検出を利用したDocument Object Detectionのすゝめ

はじめに こんにちは。バクラク事業部 機械学習チームの機械学習エンジニアの上川(@kamikawa)です。 バクラクではAI-OCRという機能を用いて、請求書や領収書をはじめとする書類にOCRを実行し、書類日付や支払い金額などの項目内容をサジェストすることで、お…

【JSAI2024参加レポート】LayerXにおけるAI・機械学習技術の活用と展望の発表内容やセッションの紹介など

機械学習エンジニアの上川(@yuta_kamikawa)です。 この記事は2024年5月28日(火) ~ 5月31日(金)に静岡県浜松市で開催されたJSAI2024 (第38回 人工知能学会全国大会) の参加レポートとなります。 LayerXとしては、昨年に引き続きプラチナスポンサーとして協賛…