ニュースリリース

コンピュータービジョン分野のトップカンファレンス
「CVPR 2023」に人行動に関するAI技術の論文2件が採択
「高速・高精度人物行動認識」と「ゼロショット異常行動認識」で

2023年4月4日

コニカミノルタ株式会社(本社:東京都千代田区、社長:大幸 利充、以下 コニカミノルタ)の人行動に関するAI技術の開発についての論文2件が、コンピュータービジョン分野のトップカンファレンスのひとつである「CVPR 2023」に採択されました。
「CVPR(Computer Vision and Pattern Recognition)」は毎年開催されるコンピュータービジョンやパターン認識に関する国際会議で、今年は6月にカナダ・バンクーバーで開催が予定されています。学術論文に特化した検索サービス「Google Scholar」において、掲載論文数や引用された回数などをもとに学術分野への影響度を示したランキングで上位に入る会議でもあり、今回は9,155件の中から2,360件の論文が採択されました。コンピュータービジョン分野で世界的に影響力が高い国際会議に2件の論文が同時に採択されたのは、コニカミノルタの人行動に関連するAI技術が、価値ある研究として高く評価された結果だと考えています。

【 研究の内容 】

コニカミノルタでは、独自の「FORXAI(フォーサイ) Imaging AI」骨格検出技術(以下 骨格検出技術)として、AIが映像中の人物を検知し、その骨格を高速に検出することで、どのような姿勢をとっているかを推定する技術を開発し、行動認識などのアルゴリズムと組み合わせて製造、リテール、介護などの事業に活用しています。この技術は、情報機器や医療機器の画像処理で高速化を追求してきた経験を活かして、認識精度の高さと高速処理を両立しているだけでなく、エッジコンピューティングによって低消費電力・低コストも実現しています。

ひとつ目のテーマである「高速・高精度人物行動認識」では、人物骨格と物体輪郭を同時に検出して行動を認識するまでを、従来の211倍である約1,900FPS*の速度に高めることに成功しました。ここでは、動画の中から人物骨格と物体輪郭のみを点群として効率的に捉えることで、処理するデータ量を大幅に削減し、高速化を実現しました。また、物体輪郭から物体の種類を検出し、骨格の動きと組み合わせることで行動認識の精度も向上させており、さまざまな用途への応用が期待できます。

The kinetics dataset used in this image is licensed by Google Inc. under a Creative Commons Attribution 4.0 International License.

ふたつ目のテーマである「ゼロショット異常行動認識」は、異常行動を機械学習させるのに異常シーンの正解付き動画を一切利用しない「ゼロショット学習」技術であり、15秒という短時間の学習にもかかわらず、一部の教師あり学習手法に匹敵する精度を達成しました。ここでは異常行動を判断する際、骨格検出技術のほかに、行動を文章に置き換えて比較する最新の自然言語処理技術を併用することで、検出精度を高めています。
人物の異常行動認識は、事故や犯罪を予防するための活用が期待されていますが、教師データ作成や学習時間の長さなどが課題です。ゼロショット学習を用いた新たなアプローチでこれらの課題の解決を目指します。

M. S. Ryoo, and J. K. Aggarwal. UT-Interaction Dataset, ICPR Contest on Semantic Description of Human Activities (SDHA). In ICPR Workshops, 2010.の画像を利用

【 採択された研究テーマの概要 】

タイトル Unified Keypoint-based Action Recognition Framework via Structured Keypoint Pooling, CVPR (2023).
arXiv URL: https://arxiv.org/abs/2303.15270
Prompt-Guided Zero-Shot Anomaly Action Recognition using Pretrained Deep Skeleton Features, CVPR (2023).
arXiv URL: https://arxiv.org/abs/2303.15167
研究者 コニカミノルタ株式会社
FORXAI事業統括部 AI技術開発部
関井 大気、八馬 遼、佐藤 文彬

【 画像IoTプラットフォーム「FORXAI」について 】

「FORXAI」は、職場や現場が抱える課題を見える化し、解決することでDXを加速させることを目的として開発された画像IoTプラットフォームです。コニカミノルタ固有の技術に加え、パートナー企業の保有するさまざまなIoTやAIの技術で構成されています。「FORXAI」を活用してパートナー企業同士がアセットを持ち寄り、高品質なソリューションを創出して、世界中の働く現場の進化や安全・安心な社会の実現に貢献していきます。

* FPS:「frames per second」の略。1秒間あたりの動画に表示される画像数を表す単位

関連リンク

ニュースリリースに記載されている内容は、報道発表日現在の情報です。お客様がご覧いただいた時点で、情報が変更(生産・販売が終了している場合や、価格、仕様など)されている可能性がありますのであらかじめご了承下さい。