Highlights

Maeda et al., Pattern Recognition 2026

Frequency-Guided Multi-Level Human Action Anomaly Detection with Normalizing Flows

Gu et al., IEEE TVCG 2025

Diverse Code Query Learning for Speech-Driven Facial Animation

Ding et al., IEEE TKDE 2025

Learning to Discriminate While Contrasting: Combating False Negative Pairs with Coupled Contrastive Learning for Incomplete Multi-View Clustering

News

  • 2025/11/17 | One paper is accepted to Pattern Recognition!

                             Frequency-guided multi-level human action anomaly detection with normalizing flows, Pattern Recognition, 2026

  • 2025/9/1     | Computational Media Intelligence (CMI) Lab. starts from HERE!
  • 2025/9/1     | 顧が講師として福井大学に赴任しました。

Lab. Vision

(EN) The vision of our lab is to advance computational intelligence for visual media — systems that can perceive, understand, and generate rich multimodal content. We develop across the full spectrum of media perception, with a primary focus on 2D/3D human-related motion modeling, image and video processing, and multimodal data learning. Our goal is to build data-driven systems that uncover underlying visual patterns through machine learning, computer vision (CV), computer graphics (CG), and pattern recognition, enabling new forms of interactive, expressive, and human-aware digital media.

(JP) 本研究室は、視覚メディアのための計算知能の発展を目指し、ビジュアルコンテンツを認識・理解・生成できる知的システムの創出に取り組んでいます。画像・映像処理に加え、人物動作のモデリングや、マルチモーダル表現学習などを中心に、コンピュータビジョン(CV)、コンピュータグラフィックス(CG)、パターン認識分野の技術を融合することで研究を展開しております。また、言語・音楽などの異種メディアとの統合や現実世界への応用を通じて、人に寄り添う創造的、かつ表現力豊かなデジタルメディアの新たな可能性を探求しています。