연구 주제를 정한다는 것
- -

대학원 생활이란 어떻게 보면 너무 바쁘고 어떻게 보면 딱히 할 게 없다. 클로드 코드가 있는 뉴-에라에서는 과제 일도 대충 모면하고자 하면 로드가 다소 줄었다. 베이스라인이 탄탄하게 있는 3,4년차 과제에서는 나도 요령이 생겨서 굳이 로드를 줄이고자 하면 시간 투자를 적게 할 수 있는 환경이 되었다.
누구나 목적이 있다면 구현을 빠르게 할 수 있는 시대에 이제 정말 중요한 것은 내가 어디로 항해하고자 하는가? 하는 큰 로드맵을 세우는 것이다. 방법을 제시하는 것보다, 방향을 제시하는 것이 중요해졌다.
큰 로드맵과 강력한 개인의 주관이 없다면 클로드 코드의 accept all changes만 딸깍이다가 대학원 생활이 - 혹은 그 이후 커리어까지 - 끝날 수도 있을 것 같아서 요새 뭘 해야 할지에 대한 고민이 많다.
연구 주제 선정
내가 뭘 하고 싶은지 알고, 그것에 대해 확신을 가지는 것은 삶의 전반적인 불확실성을 줄여 줘서 불안함을 떨치는 데 도움이 된다. 그럼 하고 싶은 것을 찾으려면 어떻게 해야 할까?
<손자병법>에는 누구나 들어봤을 법한 유명한 구절이 있다. 바로 '지피지기 백전불태'이다. 전체 맥락은 다음과 같이 이어진다. 손자는 특히 '적을 아는 것', 즉 지피보다 '나 자신을 아는 것', 즉 지기가 더욱 중요하다고 보았는데, 이러한 관점에서도 노자의 영향이 짙게 드리워져 있다.
[ 남을 아는 사람은 지혜로운 자이지만, 자기 자신을 아는 사람이야말로 진정 총명한 자이다. 남을 이기는 사람은 힘센 자이지만, 자기 자신을 이기는 사람이야말로 진정 강한 자이다. ]
노자 또한 손자와 마찬가지로 자기 자신을 돌아볼 줄 아는 힘을 최고의 지혜라 여겼다.
잘 하는 사람이 많은 곳에서 자아가 압도당하지 않으려면 지기를 똑바로 하는 것이 중요하기 때문에 항상 주의할 필요가 있다.
내 생각에 내가 잘 하는 건
- 빨리 프로토타입을 만들어서 1차 결과를 보는 것
- 경계에서 여러 컨텍스트를 조합해 새 아이디어를 내고 이 생각을 전체 맥락에서 특정 위치에 놓는 것
- 여러 사람과의 커뮤니케이션
이다. 반면에 정말 못 하는 건
- 정해진 틀 안에서 문제를 잘 푸는 것
- 복잡한 수식을 다루는 것
- 많은 리소스를 효율적으로 쓰고 관리하는 것
- 정리정돈
이다.
대학원에 처음 왔을 때 사수였던 선배는 이런 말씀을 하셨다.
"SLAM이나 LIO, Semantic Segmentation은 정답이 있고, 플래닝은 정답이 없는 문제야. 그래서 전자는 벤치마크 데이터셋이라는 것이 있고 남들보다 0.01이라도 성능을 높이는 것이 중요한데, 후자는 문제 정의부터 설득해야 하는 분야야. 왜냐면 <좋은 길>이라는 것은 맞닥뜨린 문제마다, 사람마다 다를 수 있거든. 정해진 트랙에서 겨루는 게 아니라 문제 정의, 방법, 메트릭까지 제시하면서 내가 겨룰 운동장을 직접 만드는 분야가 플래닝이야."
이런 얘기를 듣고 지피지기 했을 때 나는 플래닝이 내가 잘 할 수 있는 분야라는 생각에 플래닝으로 연구 분야를 정했는데 석사과정까지는 옳은 선택이라고 보고 있다.
내가 아직까지는 자신 없는 분야는
- 정통 딥러닝 : 실험 테이블 관리를 잘 못 하며 - 편집증적으로 실험 테이블 관리를 하는 사람들을 보며 저게 재능이구나, 싶었다 - GPU를 많이 쓰는 것 자체가 나한테 좀 스트레스로 다가온다. (실험 돌리기 전에는 잠을 못 자는 것이 큰 스트레스...)
- SLAM, LIO : 내가 못 하는 수학이 너무 많이 나오고 데이터셋 실험을 많이 돌려야 하고 엄밀- 정확- 해야 함.
적고 보니 그냥 연구자로서 자질이 모자란 것 같기도...
강박이 없고 스트레스에 취약한데, 장단점이 있는 것 같다. 스트레스에 취약해서 생활 루틴을 잘 지키려는 게 항상 1순위 목표여서 결론적으로는 감정기복이 적게 업무에 임할 수 있는 듯. 꼼꼼한 건 천성적으로 부족해서 항상 정말 주의하려고 노력하고 있다.
그래서 석사과정에서 플래닝을 대하는 나의 태도는 항상 <경계에 서 있는 것>이다.
어느 때부터인가 역사학의 트렌드는 '경계 넘기'가 되었다. 역사가들은 서양 혹은 동양의 어떤 장소를 반대편의 시각으로 보거나, 동서양 구분을 넘어 아예 새로운 혼종이 생겨나는 과정을 추적하기도 한다. <상하이의 유대인 제국>도 이런 '경계 넘기' 서술의 하나이지만, 이전과 다른 새로운 면모로 가득하다. 상하이라는 동양의 도시를 서양과의 관계 속에서 보지만, 이 '지역'이라는 기초 위에 유대인이라는 인종성, 글로벌하면서 동시에 로컬적인 무역 네트워크, 중국 개혁의 방향성 충돌 같은 새로운 층위를 겹쳐서 도시의 역사를 다층적으로 조망한다. 또한 복합적인 서사 속에 도시사, 제국주의 , 2차 세계대전, 중국 개혁 개방 같은 역사적 주제들이 함께 묻어져 나온다.
<상하이의 유대인 제국>, 추천사 중
이 <경계 넘기>를 내 식대로 써 보자면 아래와 같다.
어느 때부터인가 나의 논문 작성의 트렌드는 '경계 넘기'가 되었다. 연구자들은 AI 혹은 로보틱스의 어떤 도메인을 반대편의 시각으로 보거나, 아예 새로운 혼종이 생겨나는 과정을 추적하기도 한다.
AI를 로보틱스라는 물리적 실체와의 관계 속에서 조망하면서도, 이 '로보틱스 도메인'이라는 기초 위에 통계적·확률적 추론의 도구적 활용성, 방대한 모델이 로컬의 Embodied 디바이스라는 물리적 제약 속에서 확보해야 하는 저비용·실시간성, 그리고 연산의 효율성과 알고리즘의 정교함 사이의 방향성 충돌 같은 새로운 층위를 겹쳐서 로봇 지능의 구현 방식을 다층적으로 조망한다.
로보틱스는 다양한 학문이 뭉쳐있는 분야라서 학문과 학문 사이의 경계가 엄청 많고 그 엣지에서 양쪽을 오가면 뭐든 시도해 볼 수 있는 여지가 많은 분야이다. 나는
- Probabilistic Generative Model : CFM, Memory retrieval
- Lightweight AI : TTA
- Continuous Representation : GS
라는 키워드로 AI - Robotics - Graphics를 왔다 갔다 하며 연구를 계속할 생각이다.
그래서 2026년에 마저 해야 할 것
나는 지금 문어발마냥 걸치고 있는 연구 주제가 너무 많아서 가지치기를 할 필요가 있다. 갈래는 크게 두 가지인데,
1) DreamFlow의 extended 버전인 DreamFlow++
2) 작년 ICRA 제출 이후부터 매진하고 있는 GS Planner
1)은 항상 하고 싶어 했던 모바일 로봇의 실외 자율주행 연구의 흐름이고, 이대로 후속 작업 없이 졸업했다가는 DreamFlow가 아직 어디 내 놓아도 속으로는 멋쩍을 수준이기 때문에 빠른 시일 안에 보강을 해야 한다.
2)는 내 로드맵과는 관련은 없지만 여러 가지 이유 때문에 마음을 엄청 많이 쏟게 되어서 매진하고 있는 연구이다.
여기에 더해서 과제 일을 나름 보람차게 하기 위해서는 계층을 다음과 같이 나눌 수 있다.
- Learning-based local planner
- [KIRO] 동적 물체 추종 (IsaacLab) + [CS588] Agentic AI 텀프 (핵심 : Prediciton, retrieval 기반 navigation 성능 향상)
- [KEIT Huma, Quad] 이미지 기반 회피 w/ url_navigation_pkg (핵심 : 여러 플랫폼에 손쉽게 적용할 수 있는 패키지 고도화)
- DreamFlow++ (핵심: DreamFlow 오픈소스 할 수 있도록 완전 새로 개발 및 논리 보강, 분석 심화)
- GS-planner
- 그냥 좋아서 하는 거임!!! 77ㅑ오
- GS가 미래다
연구자가 길러야 할 능력
프로그래밍이 엔지니어링의 영역을 다소 벗어난 지금에서 내가 길러야 할 역량은 1) 도메인 지식 , 2) 수학적 해석 능력, 3) 커뮤니케이션 능력 (글쓰기, 영어)이다.
내가 생각하기에 내 주변에서 제일 똑똑한 사람 중 한 명은 홀홀단신으로 ICCV, NIPS 논문을 휘리릭 써내고 다시 업계로 돌아간 나의 친언니인데, 그녀는 놀랍게도 작년까지 지피티 무료버전만 가지고 논문을 썼다. 그런데 어느 날 공동연구자가 언니의 무료 지피티를 보더니 "왜 언니 지피티는 이렇게 똑똑해..?"라고 물어봤다고 한다.
그녀는 무엇이든 분석하여 설명하는 능력이 좋고 문제의 핵심을 꿰뚫는 말을 해서 항상 나를 쭈구리처럼 납득하게 만드는 화술의 소유자이다. 그러니까 이 LLM이라는 친구는 전적으로 나의 프롬프트 써내기 능력에 따라 결과물이 천양지차인 것이다. 프로 버전을 결제하는 것도 좋지만, 내가 뭘 원하는지 알고 설명을 잘 해줘야 LLM을 주도적으로 사용할 수 있는 것 같다.
내가 뭘 원하는지 알고 설명을 잘 하려면 타겟이 되는 도메인에 대해 잘 알고 있으면서 글을 잘 써야 한다. 그러려면 내가 하고자 하는 로드맵에 필요한 도메인 지식을 계속 공부하면서 LLM 및 공동연구자들과 함께 잘 커뮤니케이션할 수 있도록 글쓰기와 말하기를 항상 연습해야 한다.
특히 글쓰기의 경우, "자연스러운 말하기"는 가능할 지 모르나 LLM을 아무리 두들겨 패도 "마음을 끌어당기는 글"은 잘 안 나오는 것 같았다. 또한 LLM으로 대체할 수 없는 실시간 영어 대화도 훨씬 더 많이 해야 한다.
그리고 추가로, 내가 앞서 "프로그래밍이 엔지니어링의 영역을 다소 벗어났다"고 말했지만 반은 맞고 반은 틀리다고 생각한다. 프로그래밍 지식 없이 프롬프트만 딸깍여서는 90% 정도의 완성도는 빠르게 달성할 지 모르지만 99% 까지 완성도를 끌어올리기에는 역부족이기 때문이다. 작동만 하면 그 다음에는 뭐를 고쳐야 할 지 모르겠는 미궁 속으로 빠지는 것을 방지하기 위해서는 비판적으로 작성한 코드를 검토하거나, 혹은 클린 코드의 아키텍쳐를 제안하는 정도의 프로그래밍적 직관이 필요하다. 물론 그것도 맡길 수도 있지만... 내가 아름다운 코드와 구조를 보고 감탄할 수 있어야 나름 현타가 덜 오는 것 같다.
어쨌든 중요한 것은 LLM을 딸깍이는 내 자신을 수련하고 정신을 똑바로 차리는 것이라는 생각을 계속 하고 있다.
'연구 및 프로젝트' 카테고리의 다른 글
| ICRA 2026 방문 후기 (0) | 2026.06.23 |
|---|---|
| ICRA 2026 제출 후기 (3) | 2025.12.07 |
| 2025 ICRA QRC 참여 후기 (9) | 2025.06.11 |
| Diffusion 기반 Navigation 논문 아카이브 (0) | 2025.02.27 |
| 로봇 회사 현장실습에서 한 일 🤖 (3) | 2024.02.29 |
소중한 공감 감사합니다