용어집 (Glossary)

A~Z 순 핵심 용어. `(Ch N)`은 해당 용어가 도입되거나 집중 논의된 챕터.

정의는 모노레포의 공통 마스터(`glossary/master_ko.md`)와 동일하게 유지된다.

A

ACT (Action Chunking with Transformers): Transformer 기반 행동 청킹 — 시연에서 연속 행동 시퀀스를 학습하여 지연 보상 작업을 안정화. (Ch6, Ch7, Ch9, Ch11)

ADR (Automatic Domain Randomization): 자동 도메인 랜덤화 — 학습 진척에 따라 물리/비물리 파라미터 범위를 자동으로 확장하는 sim-to-real 전략. (Ch7, Ch9)

ALOHA: 저비용(<$20K) 양손 원격 조작 하드웨어 플랫폼. Aloha/Aloha 2 모두 포함. (Ch7, Ch11)

C

Canonical representation: 정규 표현 — 센서 독립적인 표준 좌표계로의 데이터 변환. (Ch3)

Capacitive sensor (정전용량식 센서): 두 전극 간 정전용량 변화로 접촉을 측정하는 센서. (Ch6)

Compliance (유연성): 외력에 대한 기계적 순응. 접촉이 풍부한 조작에서 필수. (Ch2, Ch4, Ch7)

Contrastive learning (대조 학습): 유사 쌍을 가깝게, 비유사 쌍을 멀리 배치하도록 표현을 학습하는 방법. (Ch1, Ch3)

Co-training: 사람 데이터와 로봇 데이터를 함께 학습시켜 상호 보완적 표현을 얻는 전략. (Ch8, Ch9, Ch10)

Cross-embodiment gap (교차 체현 격차): 인간과 로봇, 또는 서로 다른 로봇 간의 운동학적·시각적·촉각적 차이에서 비롯되는 전이 간극. (Ch10)

D

DEXOP: 사람 손 데이터로부터 조작 정책을 학습하는 프레임워크. (Ch6, Ch10)

Dexterous manipulation (다지 조작): 다지 핸드를 이용한 정밀 물체 조작 — in-hand rotation, assembly 등. (Ch1, Ch3, Ch4, Ch5, Ch6, Ch7, Ch9, Ch10, Ch12, Ch13)

DexUMI: 인간 시연을 로봇 정책으로 변환하는 프레임워크. (Ch3, Ch6, Ch10)

Diffusion Policy (확산 정책): 조건부 잡음 제거 확산 과정으로 행동 분포를 학습하는 정책 학습 방법. (Ch1, Ch2, Ch3, Ch5, Ch7, Ch8, Ch11, Ch13)

DoF (Degrees of Freedom, 자유도): 관절의 독립적 운동 축 수. 인간 손은 약 27 DoF. (Ch2, Ch4, Ch6, Ch8, Ch10, Ch11, Ch12)

Domain Randomization (도메인 랜덤화): 시뮬레이션 파라미터를 랜덤화하여 정책의 견고성을 높이는 기법. (Ch7, Ch9)

E

Embodiment Retargeting (체현 재타겟팅): 한 체현(예: 인간 손)의 동작을 다른 체현(예: 로봇 핸드)의 관절 공간으로 매핑. (Ch9, Ch10)

E-skin (전자 피부): 촉각 센서가 통합된 유연 전자 기판. (Ch2)

F

FEM (Finite Element Method, 유한 요소법): 변형 시뮬레이션을 위한 수치 해석 방법. (Ch3, Ch9)

Flow Matching: 연속 정규화 흐름으로 행동 분포를 학습하는 방법 — pi0의 핵심 기법. (Ch7, Ch8, Ch9)

ForceVLA: 힘 센싱을 VLA에 결합한 모델 — MoE 라우팅으로 접촉 모드를 분기. (Ch7, Ch8, Ch11, Ch13)

Foundation Model: 대규모 데이터로 사전학습된 범용 모델 — Sparsh(촉각), pi0(VLA) 등. (Ch1, Ch3, Ch6, Ch8, Ch9, Ch10, Ch11, Ch12, Ch13)

F-TAC Hand: 고해상도 촉각 센싱을 통합한 로봇 손 플랫폼. (Ch1, Ch2, Ch4, Ch5, Ch11, Ch13)

G

GelSight: MIT에서 개발된 광도 입체법 기반 비전 촉각 센서. (Ch1, Ch2, Ch3, Ch9, Ch11, Ch13)

I

IL (Imitation Learning, 모방 학습): 인간 시연을 직접 모방하여 정책을 학습. (Ch7)

Impedance control (임피던스 제어): 힘과 변위의 관계를 조절하는 제어 방법 [Hogan, 1985]. (Ch1, Ch5, Ch7, Ch13)

In-hand manipulation (손안 조작): 파지 상태에서 물체의 위치·자세를 변경하는 작업. (Ch1, Ch2, Ch3, Ch4, Ch7, Ch9, Ch11, Ch13)

K

Kinesthetic teaching (운동학적 시연): 인간이 로봇을 직접 움직여 동작을 시연하는 방법. (Ch1, Ch3)

M

MANO: 1,000개 3D 스캔으로 학습한 통계적 인간 손 모델 (778 정점, 16 관절). (Ch3, Ch6, Ch8, Ch10)

Mechanoreceptor (기계적 수용기): 접촉/압력/진동을 감지하는 생물학적 센서 — Merkel, Meissner, Ruffini, Pacinian. (Ch1)

MoE (Mixture of Experts): 여러 전문가 네트워크를 동적으로 라우팅하는 아키텍처 — ForceVLA가 대표적. (Ch7, Ch8, Ch11, Ch13)

O

Open X-Embodiment: 34개 연구실의 1M+ 궤적을 통합한 최대 규모 오픈소스 로봇 데이터셋. (Ch3, Ch8, Ch11, Ch12)

OpenVLA: 오픈소스 VLA 기반 모델 — 7B 파라미터, Open X-Embodiment로 학습. (Ch8, Ch11, Ch12)

OSMO: 사람 손 모션에서 로봇 policy를 학습·전이. (Ch2, Ch3, Ch6, Ch10, Ch11, Ch13)

P

PaLM-E: 구글의 embodied 멀티모달 언어 모델 — 이미지·상태·언어를 같은 토큰 스페이스로 통합. (Ch8)

Particle jamming (입자 잼): 입자 밀집으로 유연→강성 전환을 만드는 메커니즘. (Ch5)

Photometric stereo (광도 입체법): 다방향 조명과 카메라로 3D 형상을 복원하는 방법 — GelSight의 핵심. (Ch1, Ch2)

Physical AI: 물리 세계를 이해하고 상호작용하는 AI — Foundation Models + 시뮬레이션 + 센서의 수렴. (Ch1, Ch4, Ch11, Ch12, Ch13)

pi0 (π₀): Physical Intelligence의 flow-based VLA 기반 모델. (Ch1, Ch7, Ch8, Ch10, Ch12, Ch13)

Point cloud (포인트 클라우드): 3D 좌표 집합으로 표현된 촉각/시각 데이터. (Ch3)

R

RL (Reinforcement Learning, 강화학습): 보상 최대화를 통한 정책 학습. (Ch3, Ch4, Ch6, Ch7, Ch8, Ch9, Ch10, Ch13)

RT-2: 구글 DeepMind의 VLA 모델 — 웹 VQA와 로봇 조작을 통합 학습. (Ch8, Ch12, Ch13)

S

Scaling laws: 데이터·모델 규모와 성능의 관계 법칙 — 로봇 학습에서도 적용 여부 활발히 연구. (Ch13)

Shear force (전단력): 표면에 평행한 방향의 힘 — 미끄러짐 감지에 필수. (Ch1, Ch2)

Sim-to-Real: 시뮬레이션에서 학습한 정책을 실세계로 이전하는 과정·전략. (Ch3, Ch4, Ch6, Ch7, Ch8, Ch9, Ch10, Ch11, Ch12, Ch13)

Slip detection (미끄러짐 감지): 물체가 손에서 미끄러지는 것을 감지 — 전단력 모니터링으로 구현. (Ch1, Ch2, Ch7)

Synergy (시너지): 여러 관절의 협조 운동 패턴 — PCA 기반 차원 축소로 포착. (Ch4, Ch5)

T

Tactile skin: 손·팔을 덮는 대면적 유연 촉각 센서 어레이. (Ch2, Ch7, Ch9)

Taxel: 촉각 감지점(tactile pixel). 예: Digit 360 ≈ 8.3M taxels. (Ch1, Ch2)

Teleoperation (TeleOp, 원격 조작): 인간이 로봇을 원격으로 조작하여 시연 데이터를 수집. (Ch3, Ch6, Ch7, Ch10, Ch11)

Tendon-driven (건 구동): 건(tendon)으로 힘을 전달하는 구동 방식 — SoftHand, ORCA 등. (Ch4, Ch5)

Torque control (토크 제어): 관절 토크를 직접 제어 — contact-rich 환경에서 필수. (Ch4)

U

Underactuation (부족 구동): 구동기 수 < 관절 수인 설계로 수동적 형상 적응 유도. (Ch4, Ch5, Ch11)

V

Visuo-tactile (시각-촉각): 시각과 촉각 정보를 결합한 표현·모델 — Robot Synesthesia, 3D-ViTac 등. (Ch2, Ch3, Ch7, Ch11)

VLA (Vision-Language-Action): 시각·언어 입력에서 로봇 행동을 직접 출력하는 통합 모델. (Ch1, Ch7, Ch8, Ch10, Ch11, Ch12, Ch13)

VSA (Variable Stiffness Actuator, 가변 강성 구동기): 유연↔강성을 능동적으로 전환 가능한 구동기. (Ch5, Ch11, Ch13)