본문 바로가기

728x90
반응형
기계학습
728x90
반응형
8

PoseTrack 2017, 2018, COCO Dataset 키포인트 관절 비교 Joint index index 2017 2018 index diff COCO 0 Right Ankle Nose 13, 0 Nose 1 Right Knee Head Bottom 12, 1 Left Eye 2 Right Hip Head Top 14, 2 Right Eye 3 Left Hip Left Ear _, 3 Left Ear 4 Left Knee Right Ear _, 4 Right Ear 5 Left Ankle Left Shoulder 9, 5 Left Shoulder 6 Right Wrist Right Shoulder 8, 6 Right Shoulder 7 Right Elbow Left Elbow 10, 7 Left Elbow 8 Right Shoulder Right Elbow 7, 8 Right.. 2021. 9. 16.
Learning Temporal Pose Estimation from Sparsely-Labeled Videos Abstract 비디오에서 다인칭 포즈 추정을 위한 현대적인 접근 방식은 많은 양의 고밀도 주석을 필요로 합니다. 그러나 비디오의 모든 프레임에 라벨을 부착하는 것은 비용이 많이 들고 노동력이 많이 듭니다. 고밀도 주석의 필요성을 줄이기 위해, 고밀도 시간적 포즈 전파 및 추정을 수행하는 방법을 배우기 위해 sparsely labeled train 비디오(매 k 프레임)를 활용하는 PoseWarper 네트워크를 제안합니다. 비디오 프레임 쌍(프레임 A와 라벨이 부착되지 않은 프레임 B)이 주어진 경우, A와 B 사이의 포즈 뒤틀림을 암묵적으로 학습하기 위해 프레임 B의 기능을 사용하여 프레임 A에서 인간의 자세를 예측하도록 모델을 훈련합니다. 훈련된 PoseWarper를 여러 애플리케이션에 활용할 수 있.. 2021. 9. 2.
Deep Dual Consecutive Network for Human Pose Estimation Abstract 복잡한 상황에서의 멀티 프레임 휴먼 포즈 예측은 어렵다. 정적 이미지에 대해 놀라운 결과를 보여주었지만 비디오 시퀀스에 이러한 모델을 적용하면 성능이 저하된다. 비디오의 문제점 - 비디오 프레임 간의 시간 의존성을 캡처하지 못해 발생하는 모션 블러, 비디오 아웃포커스 또는 occlusion. 기존의 반복 신경망을 직접 사용하는 것은 공간적 맥락, 특히 occlusion를 다루는 데 있어 경험적 어려움을 야기한다. 이 논문에서는 키포인트 감지를 용이하게 하기 위해 비디오 프레임 사이의 풍부한 시간적 신호를 활용하여 새로운 멀티 프레임 휴먼 포즈 추정 프레임워크를 제안한다. 여기엔 세 가지 모듈식 구성요소가 설계되어 있습니다. Pose Residual Fusion 모듈이 weighted 포즈.. 2021. 8. 27.
A Graph Attention Spatio-temporal Convolutional Network for 3D Human Pose Estimation in Video Abstract—시공간 정보는 3D 포즈 추정에서 폐색 및 깊이 모호성을 해결하는 데 중요합니다. 이전의 방법은 고정 길이의 시공간 정보를 포함하는 시간적 컨텍스트 또는 로컬에서 전역적 아키텍처에 초점을 맞췄습니다. 현재까지, 다양한 시공간 시퀀스를 동시에 유연하게 캡처하고 실시간 3D 포즈 추정을 효과적으로 달성하기 위한 효과적인 제안은 없었습니다. 본 연구에서는 주의 메커니즘을 통해 국소 및 전역 공간 정보를 모델링하여 인간 골격의 운동학적 제약 조건, 즉 자세, 국소 운동학적 연결 및 대칭에 대한 학습을 개선합니다. 단일 및 다중 프레임 추정에 적응하기 위해 확장 시간 모델을 사용하여 다양한 골격 시퀀스를 처리합니다. 또한, 중요한 것은, 우리는 시너지 효과를 달성하기 위해 시간적 의존성을 가진 공.. 2021. 7. 30.
Keep It SMPL: Automatic Estimation of 3D Human Pose and Shape from a Single Image Simplify - Abstract 단일 제한되지 않은 이미지에서 인체의 3D 자세와 3D 모양을 자동으로 추정하는 첫 번째 방법 제안. 전체 3D 메쉬를 추정하여 2D 조인트만으로도 체형에 대한 정보를 얻을 수 있습니다. 사용 방법 3D 메쉬 추정은 인체의 복잡성, 관절, 폐색, 의류, 조명, 그리고 2D에서 3D를 추론하는 내재적 모호성 때문에 어렵지만 이를 해결하기 위해 먼저 최근 발표된 CNN 기반 방법인 DeepCut을 사용하여 2D 신체 관절 위치를 예측(bottom-up)합니다. 그런 다음 SMPL이라는 최근 발표된 통계 체형 모델을 2D 관절에 맞춥니다(top-down). 투사된 3D 모델 조인트와 검출된 2D 조인트 사이의 오차에 불이익을 주는 objective function을 최소화함.. 2021. 7. 29.
Monocular, One-stage, Regression of Multiple 3D People Abstract 인간 pose detection는 딥 러닝, 매개 변수 인간 모델링, 대규모 2d 및 3d 데이터 세트의 최근 발전으로 큰 혜택을 받았습니다. 그러나 기존 3D 모델은 이미지당 한 사람, 전체 인물 보기, 간단한 배경 또는 많은 카메라를 고려하여 장면에 대해 강력한 가정을 합니다. 본 논문에서는 최첨단 심층 다중 작업 신경망과 매개 변수 인간 및 장면 모델링을 활용하여 상호 작용하는 여러 사람을 위한 fully automatic monocular visual sensing system (완전 자동 단안 시각적 감지 시스템)을 활용하며, (i) 단일 이미지에서 여러 사람의 2d 및 3d 자세와 모양을 유추하고 양쪽 모에서 세밀한 의미 표현에 의존합니다. 델타 및 이미지 레벨, 피드포워드 및.. 2021. 7. 29.
Deep High-Resolution Representation Learning for Human Pose Estimation Abstract 본 논문에서는 신뢰할 수 있는 고해상도 표현을 학습하는 데 중점을 둔 인간 포즈 추정 문제에 관심이 있습니다. 대부분의 기존 방법은 고해상도 네트워크에서 생성된 저해상도 표현에서 고해상도 표현을 복구합니다. 대신, 제안된 네트워크는 전체 프로세스를 통해 고해상도 표현을 유지합니다. 첫 번째 단계로 고해상도 하위 네트워크에서 시작하여 점차 고해상도 하위 네트워크를 하나씩 추가하여 더 많은 단계를 형성하고, 다중 해상도 하위 네트워크를 병렬로 연결합니다. 각 고해상도 표현이 다른 병렬 표현으로부터 정보를 반복적으로 수신하여 풍부한 고해상도 표현을 유도하는 반복적인 다중 스케일 융합을 수행합니다. 따라서 예측된 키포인트 열 지도가 잠재적으로 더 정확하고 공간적으로 더 정확합니다. COCO 키포.. 2021. 7. 25.
인공지능 conda install tensorflow //콘다 안 될 때 안녕하세요 인공지능, 기계학습, 머신러닝에 텐서플로우가 거의 필수라고 볼 수 있죠! 파이썬 모듈인 tensorflow는 pip install을 통해 설치도 가능하지만, 저처럼 anaconda와 주피터 노트북을 이용하시는 분들은 pip 모듈을 사용하는 경우 사용하기 어려운 경우가 있습니다. 이를 해결하기 위해 conda install을 통해 텐서플로우를 설치해주어야 합니다. conda install tensorflow 이 명령어를 실행해야 하는데요. 터미널에서 conda not found 라고 메세지를 띄울 수도 있습니다. 저도 이것 때문에 고생을 많이 했죠!ㅜㅜ 다시 설치도 여러번 해보고 스택오버플로우도 열심히 뒤져보았는데 저 같은 경우에는 zshrc파일에 아나콘다 경로설정이 안 되어 있어서 그런 거였더.. 2020. 1. 1.