썬문_도쿄타워_구글프로필용.jpg

I am an Assistant Professor at The University of Tokyo, Japan. My research spans multimodal AI and data-centric AI. My recent work focuses on leveraging generative AI for education (e.g., LLM-code-detector), evaluation (LMM-as-a-judge), and applications in Japanese cultural contexts (JMMMU, MangaLMM). I previously worked on OCR, including multilingual text recognition and synthetic visual text generation (TRBA, COO, CLL-STR).

CV | email | Google Scholar | LinkedIn | Github

Work experience

Education

Publications

(*: Equal contribution)

Enhancing Safety Assessment of LLM Responses via Text-to-Image Generation

Jeonghun Baek*, Eunchung Noh*
IEEE Access, 2026 [Paper]
Preliminary version: International Conference on Computer Vision (ICCV) WiCV Workshop, 2025

Exploring LMM-as-a-Judge for Image Harmonization Evaluation

Jeonghun Baek*, Eunchung Noh*
International Conference on Multimedia Information Processingand Retrieval (MIPR), 2026
Extended abstract version@International Conference on Computer Vision (ICCV) UniLight Workshop, 2025

Beyond Bilingual Transfer:Multilingual Code-Switching in Instruction Tuning

Shunta Asano*, Jeonghun Baek*, Toshihiko Yamasaki
arXiv preprint 2026 [Paper]

Manga109-v2026: Revisiting Manga109 Annotations for Modern Manga Understanding

Jeonghun Baek*, Atsuyuki Miyai*, Shota Onohara*, Hikaru Ikuta, Kiyoharu Aizawa
International Conference on Machine Learning (ICML) Culture × AI Workshop, 2026 [Paper] [Project page]

Responsible Federated LLMs via Safety Filteringand Constitutional AI

Eunchung Noh*, Jeonghun Baek*
Association for Computational Linguistics (ACL) TrustNLP Workshop, 2026 [Paper]

MangaVQA and MangaLMM: A Benchmark and Specialized Model for Multimodal Manga Understanding

Jeonghun Baek*, Kazuki Egashira*, Shota Onohara*, Atsuyuki Miyai*, Yuki Imajuku, Hikaru Ikuta, Kiyoharu Aizawa
European Chapter of the Association for Computational Linguistics (EACL), Findings, 2026 [Project page] [Paper] [Code]
Extended abstract version@International Conference on Computer Vision (ICCV) COMIQ Workshop, 2025 [Slides]

JMMMU-Pro: Image-based Japanese Multi-discipline Multimodal Understanding Benchmark via Vibe Benchmark Construction

Atsuyuki Miyai, Shota Onohara, Jeonghun Baek, Kiyoharu Aizawa
arXiv preprint 2025 [Project page]

MaskingAgent: Preventing LLM Tutor from Providing Full Solutions in Python Programming Courses

Jeonghun Baek, Tetsuro Yamazaki, Akimasa Morihata, Junichiro Mori, Yoko Yamakata, Kenjiro Taura, Shigeru Chiba
ACM Special Interest Group on Computer Science Education (SIGCSE) Technical Symposium, poster, 2026 [Paper] [Poster]

LLM-Based Explainable Detection of LLM-Generated Code in Python Programming Courses

Jeonghun Baek, Tetsuro Yamazaki, Akimasa Morihata, Junichiro Mori, Yoko Yamakata, Kenjiro Taura, Shigeru Chiba
ACM Special Interest Group on Computer Science Education (SIGCSE) Technical Symposium, paper (acceptance rate 30.3%, 174/574), 2026 [Paper] [Slide] [Code]