728x90
반응형
저는 고려대학교 인공지능대학원 PRML 연구실에서 이성환 교수님의 지도 아래 석사 과정을 마친 진경민입니다. 대학원 진학 이전에는 고려대학교에서 컴퓨터공학과와 인공지능을 전공하여 2021년에 학사 학위를 취득했습니다.
시각 지각에서 시작해 체화된 추론으로 확장되는 멀티모달 지능을 연구합니다.
저의 연구는 컴퓨터 비전 분야에서 시작되었으며, 트랜스포머 아키텍처와 합성곱 신경망을 결합한 새로운 포즈 추정 프레임워크를 제안해 다수의 벤치마크에서 최고 수준의 성능을 달성했습니다. 이러한 연구 성과를 바탕으로 WACV를 포함한 국제 학회 및 저널에 논문을 발표했습니다.
이후 LG전자에 합류하여 인체 및 손 포즈 추정 모델을 엣지 디바이스 환경에 적용하는 연구를 수행하며, 실제 환경에서의 효율성과 강건성을 중심으로 한 모델 개발에 참여했습니다. 연구 관심사는 점차 확장되어 Vision–Language–Audio 기반의 대규모 멀티모달 모델, cross-modal continual learning, 그리고 GRPO 및 DPO와 같은 강화학습 기반 정책 최적화 기법을 활용한 멀티모달 학습 연구를 진행했습니다.
최근에는 로봇 선행 연구 조직에서 로봇 인지 및 자연어 기반 객체 이해 기술을 연구하고 있으며, 멀티모달 파운데이션 모델과 체화된 인공지능을 연결해 로봇이 시각 정보를 언어적으로 이해하고 물리적 환경과 효과적으로 상호작용할 수 있도록 하는 것을 목표로 하고 있습니다.
728x90
반응형
'AI' 카테고리의 다른 글
| 리눅스 우분투 및 설치 딥러닝 cuda 환경 설정 (0) | 2023.01.27 |
|---|---|
| LG전자 2022 R&D 석박사 산학장학생 후기 (8) | 2022.10.22 |
| 고려대학교 정보대학 인공지능학과 이성환 교수님 PRML연구실 학석사 연계과정 (석사) 합격 후기 (1) | 2022.09.12 |
| NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis (0) | 2021.11.08 |
| Learning Correspondence from the Cycle-consistency of Time (0) | 2021.09.26 |
댓글