728x90 반응형 AI/포즈 추정 728x90 반응형 13 Monocular, One-stage, Regression of Multiple 3D People Abstract 인간 pose detection는 딥 러닝, 매개 변수 인간 모델링, 대규모 2d 및 3d 데이터 세트의 최근 발전으로 큰 혜택을 받았습니다. 그러나 기존 3D 모델은 이미지당 한 사람, 전체 인물 보기, 간단한 배경 또는 많은 카메라를 고려하여 장면에 대해 강력한 가정을 합니다. 본 논문에서는 최첨단 심층 다중 작업 신경망과 매개 변수 인간 및 장면 모델링을 활용하여 상호 작용하는 여러 사람을 위한 fully automatic monocular visual sensing system (완전 자동 단안 시각적 감지 시스템)을 활용하며, (i) 단일 이미지에서 여러 사람의 2d 및 3d 자세와 모양을 유추하고 양쪽 모에서 세밀한 의미 표현에 의존합니다. 델타 및 이미지 레벨, 피드포워드 및.. 2021. 7. 29. Deep High-Resolution Representation Learning for Human Pose Estimation Abstract 본 논문에서는 신뢰할 수 있는 고해상도 표현을 학습하는 데 중점을 둔 인간 포즈 추정 문제에 관심이 있습니다. 대부분의 기존 방법은 고해상도 네트워크에서 생성된 저해상도 표현에서 고해상도 표현을 복구합니다. 대신, 제안된 네트워크는 전체 프로세스를 통해 고해상도 표현을 유지합니다. 첫 번째 단계로 고해상도 하위 네트워크에서 시작하여 점차 고해상도 하위 네트워크를 하나씩 추가하여 더 많은 단계를 형성하고, 다중 해상도 하위 네트워크를 병렬로 연결합니다. 각 고해상도 표현이 다른 병렬 표현으로부터 정보를 반복적으로 수신하여 풍부한 고해상도 표현을 유도하는 반복적인 다중 스케일 융합을 수행합니다. 따라서 예측된 키포인트 열 지도가 잠재적으로 더 정확하고 공간적으로 더 정확합니다. COCO 키포.. 2021. 7. 25. LSTM_Pose_Machines Abstract 이 논문은 단일 이미지 인간 포즈 추정에 대한 최신 결과가 다단계 컨볼루션 신경망(CNN)에 의해 달성되었음을 관찰했습니다. 정적 이미지에서 우수한 성능에도 불구하고, 비디오에서 이러한 모델을 적용하는 것은 계산 집약적일 뿐만 아니라 성능 저하와 깜박임으로 인해 어려움을 겪습니다. 이러한 차선의 결과는 주로 순차적 기하학적 일관성을 부과할 수 없고 심각한 영상 화질 저하(예: 모션 블러 및 폐색)를 처리할 수 없고 비디오 프레임 간의 시간적 상관 관계를 캡처할 수 없기 때문입니다. 본 논문에서는 이러한 문제를 해결하기 위한 새로운 반복 네트워크를 제안했습니다. 다단계 CNN에 가중치 공유 체계를 적용하면 반복 신경망(RNN)으로 다시 작성할 수 있다는 것을 보여주었습니다. 이 속성은 여러.. 2021. 7. 13. 이전 1 2 다음