본 논문에서는 시야가 가려진 곳이나 잔디, 관목 등 비정형 오프로드 특성이 있는 까다로운 실외 환경에서 지도 없는 전역 내비게이션을 위한 새로운 End-to-End Diffusion 기반 궤적 생성 방법인 DTG를 제시한다. 우리의 접근 방식은 목표 지점이 주어졌을 때 다음과 같은 목표를 만족하는 궤적을 생성한다. 1) 목표까지의 이동 거리 최소화, 2) 바람직하지 않은 영역을 피하는 경로
구체적으로 본 논문에서는 궤적을 효율적으로 생성하기 위한 새로운 조건부 RNN Diffusion 모델을 제시한다. 또한 Diffusion 모델이 더 주행 가능한 궤적을 생성하도록 보장하는 Adaptive 학습 방법을 제안한다. 이러한 방법들을 다양한 실외 환경에서 평가하고 Husky 로봇에서 다른 전역 내비게이션 알고리즘들과 성능을 비교했다.
Q1. Mapless Navigation과 Map이 있는 Navigation의 핵심적인 차이가 뭘까 ?
Q2. DTG Traversability estimation의 baseline이 뭐지 ?
실험에서는 어떻게 정량적으로 평가했지 ?
Q3. 생성하는 Waypoint의 길이가 다 똑같은가 ? : yes
Introduction
Global Navigation은 large-scale 환경에서 로봇의 궤적을 계산하는 데 사용된다. 전역 내비게이션은 자율 주행, 라스트마일 배송 등에서 널리 사용되지만 이를 성공적으로 수행하기 위해서는 다양한 과제들을 해결해야 한다. Mapless Navigation은 실외 전역 내비게이션에서 중요하게 다뤄진다. 많은 전역 내비게이션 전략에서는 계획을 더 잘 세우기 위해서 전역 지도를 계산한다. 하지만 정확하고 상세한 지도를 획득하는 것은 특히 날씨 변화, 위험 지역 등으로 인해 환경이 자주 변화하는 실외 내비게이션 작업에서 큰 어려움이 있다. 따라서 일반적인 실외 환경을 위한 Mapless Naviagation 전략을 개발하는 것이 중요하다.
- Computing Traversable Trajectories for Robotic Navigation
복잡한 실외 시나리오에서는 실외 환경이 다양한 지형, 식물 등을 포함하고 있기 때문에 안전한 실외 내비게이션을 위해 주행 가능성을 분석하는 것이 중요하다. 전통적으로 인식과 계획은 두 개의 다른 작업으로 분리되어 있다. 주행 가능 영역을 감지하기 위한 인식과, 경유점을 생성하기 위한 계획이다. 하지만 이런 방식으로 만들어진 Traversability 지도가 환경을 가장 효과적으로 표현하는 방식이라고 할 수는 없다. 예를 들어 Learning-based 방식에서는 High-dimensional observation이 보통 Traversability를 인코딩하는 벡터로 처리된다. 또한 시야가 가려져 있을 경우 가려진 물체 뒤의 주행 가능 영역을 추정하는 것이 어려울 수 있다. 따라서 실외 시나리오에서는 복잡한 주행 가능성 정보를 효과적으로 모델링하는 것이 중요하다.
- Optimal Trajectory Generation Towards Designated Goals
주행 가능성을 보장하는 것을 넘어, 내비게이션 문제는 종종 제약 조건 하에서 최적 궤적을 계산하는 것을 목표로 하는 최적화 문제로 공식화된다. 일반적인 최적성 기준에는 실행 시간이나 이동 거리의 최소화가 있다. 하지만 Mapless Navigation의 경우, 정확한 지도가 없어서 남은 이동 거리를 평가하기가 어려울 때가 있다. 예를 들어 더 넓은 통로나 좁은 통로를 통과하는 것이 더 짧은 이동거리일지 알기 어렵다.
- Generating Trajectories with Traversability and Optimality
Learning-based 접근 방식은 실외 내비게이션 작업에서 주목할 만한 성능을 보여 준다. 그러나 이동 거리 측면에서 최적이면서 주행 가능성 제약을 만족하는 궤적을 정확하게 생성할 수 있는 효과적인 모델을 선택하는 것은 어렵다. On-policy 강화학습 기반 실외 내비게이션 접근 방식이 최적 궤적을 생성할 수 있지만, 복잡한 실외 시나리오에서 충돌이나 전복과 같은 실패 사례를 시도하는 것은 안전하지 않다. Diffusion 모델은 로봇 팔의 Picking, Pushing과 내비게이션같은 다양한 로봇 Application에서 유망한 성능을 보여준다. 그러나 U-Net을 이용한 노이즈 제거 절차는 실시간 내비게이션에는 여전히 계산적으로 효율적이지 않다. 또한 NoMaD는 매우 가까운 하위 목표 이미지를 필요로 하기 때문에 완전히 지도가 없는 것은 아니며, 가장 가까운 하위 목표가 로봇과 매우 가까워야 한다. 게다가 Diffusion 모델은 추가 제약 없이 단지 GT를 모방하도록만 훈련된다.
- Main Innovation
본 논문에서는 Mapless Navigation에 Diffusion을 도입하고 복잡한 실외 환경에서 궤적을 생성하는 새로운 End-to-End 접근 방식인 DTG를 제시한다. 환경 정보를 제공받아 Diffusion 모델은 무작위 가우시안 노이즈를 입력받아 여러 단계에 걸쳐 노이즈를 제거하여 목표까지의 이동 거리가 짧은 Traversable 궤적을 예측한다.
Prior Work and Background
- Outdoor Navigation
- Traversability Analysis
- Trajectory Generation
실외 시나리오에서 궤적 생성은 그 응용에 따라 다양하게 나뉘어진다. 어떤 방법은 과거의 움직임을 기반으로 궤적을 예측하기 위해 LSTM이나 Gaussian Mixture Model을 사용하였다. 복잡한 환경을 인지하여 실현 가능한 경로를 계산하기 위해 Bayesian 기반 방법, GAN 등을 활용하는 방법도 있다. ViNT나 NoMaD와 같은 방법들은 내비게이션을 위해 현재 이미지를 사전 기록된 하위 목표 이미지와 비교하는 방식을 채택했지만, 들어오는 이미지가 하위 목표 이미지와 상당히 다르거나 완전히 알려지지 않은 환경에서는 적용하기 어렵다는 한계점이 있다.
Approach
A. Problem Definition
우리가 해결하고자 하는 문제는 실외 Mapless Navigation이다. 목표점이 주어졌을 때 우리의 모델은 목표까지의 이동 거리를 최소화하면서 로봇의 주행 가능 영역에서 궤적을 생성한다.
사용한 센서는 3D 라이다와 로봇의 Odometer이다. 우리는 로봇 주변 환경의 정적 및 동적 정보를 캡쳐하기 위해 연속적인 라이다 프레임 Ol 을 활용한다. Odometer는 로봇의 동적 상태를 인코딩하기 위해 연속적인 로봇 속도 프레임 Ov를 제공한다.
목표는 g = {gx, gy}로 표시된다. 따라서 관찰은 O = {Ol, Ov, Og}이다. 관찰 O가 주어졌을 때, DTG는 주행 가능성 제약을 만족하면서 목표 g까지의 최소 이동거리를 가진 궤적 t = {w1, ..., wM}을 생성한다.
문제는 다음 방정식으로 공식화될 수 있다. 여기서 h는 마지막 Waypoint와 목표 사이의 이동 거리 함수를 나타내며, A는 로봇 주변의 주행 가능 영역이고 A~는 주행 불가능 영역을 나타낸다. 베타는 하이퍼파라미터리고 f는 궤적의 주행 가능성을 계산하며, 이는 궤적이 주행 불가능 영역을 통과하는 비율이다.
따라서 이 함수는 두 가지 목표를 달성한다. 1) 이동 서리 최적화, 2) 주행 가능성 제약 만족 Inference는 O만을 입력으로 받지만, 모델을 훈련시키기 위해서는 주행 가능성 GT를 계산하기 위해서 A가 필요하다.
B. Architecture
파이프라인에는 두 가지 모델이 있다. Perception Encoder와 Diffusion Model이다.
1) Perception Encoder
Perception Encoder는 O를 Diffusion 모델의 입력으로 사용될 벡터로 인코딩한다.
pcθ(·)는 PointCNN 모델을 나타낸다. 인코더 계층은 pcθ(ol), pvθ(ov), g로부터의 연결된 임베딩을 받아 확산 모델의 조건으로 사용될 벡터 c로 임베딩을 인코딩한다. peθ(·), pvθ(·)는 Linear layer 시퀀스이다.
2) Diffusion Model
Diffusion 모델은 가우시안 노이즈를 목표 데이터로 점진적으로 노이즈를 제거한다. 본 논문에서 Diffusion 모델은 각 O에 대한 Perception Encoder로부터의 조건부 벡터 c를 받아 가우시안 분포를 궤적으로 노이즈를 제거한다. 최근 몇 년 동안 DDPM, DDIM, VDM을 포함한 여러 Diffusion 모델 훈련 전략이 제안되었다. VDM이 다른 것들보다 데이터 생성에서 더 높은 품질과 더 나은 수렴을 보여주기 때문에 이 접근 방식에서는 VDM 전략을 사용하여 궤적을 생성한다.
최종 출력(x0)에서 가우시안 노이즈(xN)까지, 각 단계에서 노이즈가 도입되어 x̃t = √αtxt-1 + √1-αtε로 표시되는 노이즈가 있는 궤적이 된다. 여기서 αt는 1부터 N까지 범위의 단계 t에서의 노이즈 비율이고, ε는 노이즈 자체를 나타낸다. 단계 t에서 예측된 궤적은 xˆt-1 = Rθ(x̃t,t)이며, 여기서 Rθ(·)는 확산 셀이다.
U-Net의 계산량이 매우 많기 때문에, 본 논문에서는 계산 비용을 줄이기 위해 새로운 Diffusion cell을 제안한다. 생성한 궤적이 항상 주행 가능 영역 내에 있어야 하기 때문에 Diffusion cell도 환경 정보를 함께 고려해야 한다. 따라서 환경 정보 벡터 c와 단계 수 t를 생성기의 조건으로 받는 C-RNN을 제안한다. 여기서 dhθ(·)는 GRU셀을 위한 h를 계산한다. dp(·)는 sinusoidal positional embedding을 나타내고, fθ1(·), fθ2(·)는 Linear layer이다. 각 단계는 rθk(·)이다. dgθ(·)는 GRU 셀이다.
그런 다음 우리는 다음과 같은 샘플링된 궤적을 얻는다.
여기서 ξ는 무작위 가우시안 분포 N(μ, ν)에서 샘플링된다. 확산 모델의 출력 xˆ0는 {∆xm, ∆ym} 시퀀스로 구성되며, 경유점 위치 wm = {xm, ym} ∈ τˆ는incremental distances를 누적하여 계산된다.
3) Training Strategy
우리의 접근 방식이 End-to-End 모델이므로, Adaptive training strategy로 두 가지 목표를 함께 훈련시킨다.
3-1) Train the generated trajectories to align with the ground truth paths, which have the shortest travel distance
우리는 Diffusion 모델의 loss를 다음과 같이 정의한다. *SNR : Signal-to-Noise Ratio (신호 대 잡음비) - SNR이 높다 = 신호가 노이즈보다 강하다 = 원본 데이터의 특성이 더 많이 남아있다 - SNR이 낮다 = 노이즈가 신호보다 강하다 = 원본 데이터가 많이 훼손되었다
3-2) Adaptive Training of Diffusion Models
현재 손실 함수는 Diffusion 모델이 GT trajectory만을 모방하도록 훈련시키기 때문에 생성된 궤적이 주행 가능 영역에만 있도록 훈련시키기 위한 제약을 추가해야 한다. 하지만 Diffusion 모델이 가우시안 분포에서 단계별로 노이즈를 제거하기 때문에, 각 단계에서 주행 가능성을 직접 추가하는 것은 훈련에 방해를 준다. 따라서 우리는 Traversability 제약을 추가하기 위한 Adaptive Strategy를 제안한다. 여기서 d(·)는 τˆt의 현재 경유점 wm과 가장 가까운 주행 불가능 영역 사이의 거리를 계산한다. 우리는 현재 사용 가능한 확산 단계를 저장하는 확산 단계 버퍼 bt에서 t를 샘플링한다.
* 학습이 잘 되고 잇는지 모니터링 중에, 학습이 안정적인 단계 (Loss가 임계값보다 낮은 단계)를 찾고 이런 안정적인 단계들을 버퍼에 저장한다. 버퍼에 저장된 안정적인 단계들에 대해서만 주행 가능성 제약을 적용하고, 다른 단계들은 여전히 기본적인 궤적 생성만 학습한다. 안정적인 단계에서는 두 가지 손실을 모두 사용한다.
Experiments
A. Implementation
Cl = 3개의 연속적인 라이다 프레임과 Cv=20개의 연속적인 과거 속도 프레임을 받고, 목표는 GPS값을 미터로 변환하여 설정했다. 훈련 중에는 목표가 60m 이내에서 무작위로 선택되고, 테스트를 위해서는 목표가 50m 이상에서 선택된다. DTG는 각 궤적에서 M=16개의 Waypoint를 생성한다. PointCNN의 voxelize 반경은 0.08m 이다.
B. Evaluation
평가 지표는 주행 가능성, 거리 비율, 추론 시간, 모델 크기이다.
- Traversability
- Distance Ratio
- Comparisons
- Ablation Study
DTG를 1) 훈련 중 Traversability loss가 없는 버전, 2) C-RNN을 일반 U-Net으로 변경한 버전, 3) 생성 모델을 Diffusion에서 CVAE로 변경한 버전과 비교했다. U-Net은 989.51Mb 이상으로 우리가 제안한 CRNN보다 훨씬 크고 다른 모든 접근 방식들보다 훨씬 느리지만, U-Net 모델이 CRNN보다 크기 때문에 정보를 더 잘 인코딩할 수 있고 약간 더 나은 주행 가능성을 가진 궤적을 생성한다. 우리의 새로운 모델인 CRNN은 U-Net보다 더 빠르고 작지만, 궤적 생성에서 비슷한 거리 비율과 주행 가능성을 달성했다.
Conclusion, Limitations and Future Work
궤적 생성기가 실시간으로 궤적을 생성하기 때문에, 내비게이션 중에 최상의 궤적을 현명하게 선택하는 메커니즘이 필요하다.