본문 바로가기

728x90
반응형
분류 전체보기
728x90
반응형
273

A Graph Attention Spatio-temporal Convolutional Network for 3D Human Pose Estimation in Video Abstract—시공간 정보는 3D 포즈 추정에서 폐색 및 깊이 모호성을 해결하는 데 중요합니다. 이전의 방법은 고정 길이의 시공간 정보를 포함하는 시간적 컨텍스트 또는 로컬에서 전역적 아키텍처에 초점을 맞췄습니다. 현재까지, 다양한 시공간 시퀀스를 동시에 유연하게 캡처하고 실시간 3D 포즈 추정을 효과적으로 달성하기 위한 효과적인 제안은 없었습니다. 본 연구에서는 주의 메커니즘을 통해 국소 및 전역 공간 정보를 모델링하여 인간 골격의 운동학적 제약 조건, 즉 자세, 국소 운동학적 연결 및 대칭에 대한 학습을 개선합니다. 단일 및 다중 프레임 추정에 적응하기 위해 확장 시간 모델을 사용하여 다양한 골격 시퀀스를 처리합니다. 또한, 중요한 것은, 우리는 시너지 효과를 달성하기 위해 시간적 의존성을 가진 공.. 2021. 7. 30.
Keep It SMPL: Automatic Estimation of 3D Human Pose and Shape from a Single Image Simplify - Abstract 단일 제한되지 않은 이미지에서 인체의 3D 자세와 3D 모양을 자동으로 추정하는 첫 번째 방법 제안. 전체 3D 메쉬를 추정하여 2D 조인트만으로도 체형에 대한 정보를 얻을 수 있습니다. 사용 방법 3D 메쉬 추정은 인체의 복잡성, 관절, 폐색, 의류, 조명, 그리고 2D에서 3D를 추론하는 내재적 모호성 때문에 어렵지만 이를 해결하기 위해 먼저 최근 발표된 CNN 기반 방법인 DeepCut을 사용하여 2D 신체 관절 위치를 예측(bottom-up)합니다. 그런 다음 SMPL이라는 최근 발표된 통계 체형 모델을 2D 관절에 맞춥니다(top-down). 투사된 3D 모델 조인트와 검출된 2D 조인트 사이의 오차에 불이익을 주는 objective function을 최소화함.. 2021. 7. 29.
Monocular, One-stage, Regression of Multiple 3D People Abstract 인간 pose detection는 딥 러닝, 매개 변수 인간 모델링, 대규모 2d 및 3d 데이터 세트의 최근 발전으로 큰 혜택을 받았습니다. 그러나 기존 3D 모델은 이미지당 한 사람, 전체 인물 보기, 간단한 배경 또는 많은 카메라를 고려하여 장면에 대해 강력한 가정을 합니다. 본 논문에서는 최첨단 심층 다중 작업 신경망과 매개 변수 인간 및 장면 모델링을 활용하여 상호 작용하는 여러 사람을 위한 fully automatic monocular visual sensing system (완전 자동 단안 시각적 감지 시스템)을 활용하며, (i) 단일 이미지에서 여러 사람의 2d 및 3d 자세와 모양을 유추하고 양쪽 모에서 세밀한 의미 표현에 의존합니다. 델타 및 이미지 레벨, 피드포워드 및.. 2021. 7. 29.
Deep High-Resolution Representation Learning for Human Pose Estimation Abstract 본 논문에서는 신뢰할 수 있는 고해상도 표현을 학습하는 데 중점을 둔 인간 포즈 추정 문제에 관심이 있습니다. 대부분의 기존 방법은 고해상도 네트워크에서 생성된 저해상도 표현에서 고해상도 표현을 복구합니다. 대신, 제안된 네트워크는 전체 프로세스를 통해 고해상도 표현을 유지합니다. 첫 번째 단계로 고해상도 하위 네트워크에서 시작하여 점차 고해상도 하위 네트워크를 하나씩 추가하여 더 많은 단계를 형성하고, 다중 해상도 하위 네트워크를 병렬로 연결합니다. 각 고해상도 표현이 다른 병렬 표현으로부터 정보를 반복적으로 수신하여 풍부한 고해상도 표현을 유도하는 반복적인 다중 스케일 융합을 수행합니다. 따라서 예측된 키포인트 열 지도가 잠재적으로 더 정확하고 공간적으로 더 정확합니다. COCO 키포.. 2021. 7. 25.
LSTM_Pose_Machines Abstract 이 논문은 단일 이미지 인간 포즈 추정에 대한 최신 결과가 다단계 컨볼루션 신경망(CNN)에 의해 달성되었음을 관찰했습니다. 정적 이미지에서 우수한 성능에도 불구하고, 비디오에서 이러한 모델을 적용하는 것은 계산 집약적일 뿐만 아니라 성능 저하와 깜박임으로 인해 어려움을 겪습니다. 이러한 차선의 결과는 주로 순차적 기하학적 일관성을 부과할 수 없고 심각한 영상 화질 저하(예: 모션 블러 및 폐색)를 처리할 수 없고 비디오 프레임 간의 시간적 상관 관계를 캡처할 수 없기 때문입니다. 본 논문에서는 이러한 문제를 해결하기 위한 새로운 반복 네트워크를 제안했습니다. 다단계 CNN에 가중치 공유 체계를 적용하면 반복 신경망(RNN)으로 다시 작성할 수 있다는 것을 보여주었습니다. 이 속성은 여러.. 2021. 7. 13.
논문리뷰 PV-RCNN: Point-Voxel Feature Set Abstraction for 3D Object Detection 링크: https://arxiv.org/abs/1912.13192 분야: 3d 2020 참고: 블로그, 코드 이번 논문은 작년 cvpr 2020의 pv-rcnn: point voxel feature set abstraction for 3d object detection입니다. 이 논문에서 자세히 봐야하는 것은 저자가 왜 , 그리고 어떻게 grid방식과 point방식을 잘 통합하려는지입니다. 1저자인 샤오슈아이님은 3D object detection 분야에서 좋은 논문을 여러개 내신분입니다. 이 논문의 네트워크로 KITTI의 3d object detection 성능 비교에서 1등을 했었습니다. 현재는 다른 네트워크로 바뀌였고, 현재 pv-rcnn++로 5위를 하고 있는것으로 알고있습니다. 1.Backgro.. 2021. 4. 4.
PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation Abstract 포인트 클라우드는 중요한 기하학적 데이터 구조 유형입니다. 불규칙한 형식으로 인해 대부분의 연구자들은 이러한 데이터를 일반 3D voxel 그리드 또는 이미지 모음으로 변환합니다. 그러나 이로 인해 데이터가 불필요하게 방대해지고 문제가 발생합니다. 이 논문에서 우리는 입력 포인트의 순열 불변성을 잘 존중하는 포인트 클라우드를 직접 소비하는 새로운 유형의 신경망을 설계합니다. PointNet이라는 이름의 우리 네트워크는 객체 분류, 부분 분할에서 장면 의미 분석에 이르기까지 다양한 애플리케이션을위한 통합 아키텍처를 제공합니다. 간단하지만 PointNet은 매우 효율적이고 효과적입니다. 경험적으로, 그것은 동등한 수준의 강력한 성능을 보여줍니다. 이론적으로 우리는 네트워크가 학습 한 내용과 .. 2021. 3. 28.
논문 리뷰 Multi-View 3D Object Detection Network for Autonomous Driving Multi-View 3D Object Detection Network for Autonomous Driving 링크: https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8100174 분야: 3d 2017 저자: Xiaozhi Chen1, Huimin Ma1, Ji Wan2, Bo Li2, Tian Xia2 1Department of Electronic Engineering, Tsinghua University 2Baidu Inc. 참고: https://adioshun.gitbooks.io/paper-3d-object-detection-and-tracking/content/2017-multi-view-3d-object-detection-network-fo.. 2021. 3. 26.
클로저- 콜백을 구현하는 이상적인 구조 자바스크립트를 공부하다 보면 흔히 접할 수 있는 단어 중 하나인 클로저! 콜백을 공부하다보면 접할 수도 있고, 전반적인 프로그래밍 언어를 공부할 때 등장하는 개념이기도 하다. 이 글은 mdn 클로저 문서를 보고 공부하며 적은 글입니다 ㅎㅎ.. 클로저 클로저란 함수와 함수가 선언된 어휘적 환경(Lexical scoping)의 조합이다. MDN 에서는 이렇게 클로저를 정의하고 있다. 그렇다면 어휘적 환경, Lexical scoping 은 뭘까? 쉽게 말하면 변수들의 범위를 어휘적으로 지정하겠다는 말이다. 즉 지역변수의 스코프(범위)를 어디에 선언했는지에 따라 결정하는 것. 예제를 보자. function init() { var name = "구운밤"; function displayName() { console.. 2021. 1. 27.
Javascript는 비동기를 어떻게 처리해 - async await 시리즈 목차 이 글은 시리즈 글입니다. 이번 글에서는 자바스크립트에서 비동기 작업을 더 쉽게 다룰 수 있는 방식인 async await 에 대해 알아볼 것입니다. 기본적으로 자바스크립트가 비동기로 동작하지 않는다는 사실과 비동기룰 다루던 첫 형태인 콜백함수, 그 콜백 함수를 더 쉽게 다루기 위해 등장한 프로미스는 저번 글에서 다루었습니다! 자바스크립트가 비동기함수를 어떻게 처리하는지 동작 원리를 모르시는 분과 콜백함수, 프로미스가 뭔지 잘 모르겠다 하시는 분들은 이전 글을 참고해보세요! Javascript는 비동기를 어떻게 처리해 - 동작 원리 Javascript는 비동기를 어떻게 처리해 - 콜백 함수 Javascript는 비동기를 어떻게 처리해 - 프로미스 Javascript는 비동기를 어떻게 처리해 .. 2021. 1. 22.