콘텐츠로 이동

야닉 르쿤, 메타에서의 마지막 프로젝트 'LeJEPA' 공개… 스타트업 창업 앞두고 AI 학습 방식 혁신 예고

원제목: Yann LeCun unveils LeJEPA, likely his final Meta project before launching a startup

핵심 요약

  • 메타의 야닉 르쿤 연구팀이 복잡한 기술적 우회 없이 자기 지도 학습을 간소화하는 새로운 방법론 LeJEPA를 개발했다는 점입니다.
  • LeJEPA는 AI 모델이 세상의 근본적인 구조를 예측적으로 학습하도록 설계되어, 인간과 유사한 지능으로 나아가는 강력한 기반을 제공한다는 점입니다.
  • 새로운 정규화 기법인 SIGReg를 통해 기존의 복잡한 학습 안정화 기법들을 대체하고, 뛰어난 성능과 안정성을 입증했다는 점입니다.

상세 내용

메타(Meta)의 저명한 AI 연구자인 야닉 르쿤과 그의 동료 랜달 발레스트리에로는 'LeJEPA'라는 혁신적인 학습 방법론을 공개했습니다. 이 방법론은 현재 AI 분야에서 중요한 부분을 차지하는 자기 지도 학습(Self-supervised learning)을 훨씬 더 간편하게 만들 것으로 기대됩니다. 기존의 자기 지도 학습 시스템들은 학습 과정에서의 실패를 방지하기 위해 다양한 기술적 우회책에 의존해 왔지만, LeJEPA는 이러한 복잡한 절차들을 근본적으로 제거하는 데 초점을 맞추고 있습니다.

LeJEPA는 'Latent-Euclidean Joint-Embedding Predictive Architecture'의 약자로, 르쿤의 더 넓은 JEPA(Joint-Embedding Predictive Architecture) 프레임워크를 간소화하기 위해 설계되었습니다. 이 접근 방식의 핵심 아이디어는 AI 모델이 명확한 수학적 구조를 따르는 내부 표현(Internal representations)을 갖춘다면, 추가적인 인위적인 장치 없이도 효과적으로 학습할 수 있다는 것입니다. 연구자들은 모델의 유용한 내부 특징들이 등방성 가우시안 분포(Isotropic Gaussian distribution)를 따라야 한다고 주장합니다. 이는 학습된 특징들이 중심점을 기준으로 균등하게 퍼져 있으며 모든 방향으로 동등하게 변화한다는 것을 의미하며, 이를 통해 모델은 균형 잡히고 견고한 표현을 학습할 수 있습니다.

JEPA 모델은 원본 데이터로부터 구조를 학습하는 독특한 방식을 사용합니다. 모델에는 동일한 정보의 여러 가지 보기(예: 이미지의 약간 다른 두 부분, 비디오 클립, 오디오 조각)가 제공됩니다. 목표는 이러한 변형이 동일한 의미론적 내용을 반영할 때, 모델이 유사한 내부 표현으로 매핑하도록 하는 것입니다. 이 시스템은 인간의 레이블에 의존하지 않고, 원본 데이터에서 어떤 측면이 중요한지를 스스로 식별하는 방법을 배웁니다. 마치 사람이 어떤 물체의 일부가 가려져 있어도 그것을 인식할 수 있는 것처럼, 모델은 이미 이해하고 있는 내용을 바탕으로 입력의 숨겨진 또는 변경된 부분에 대해 예측하도록 훈련됩니다. 이것이 바로 JEPA의 핵심으로, 원본 픽셀이나 오디오 샘플을 예측하는 것이 아니라 세상의 근본적인 구조를 모델링하는 데 집중하는 예측 학습입니다.

르쿤은 JEPA를 인간과 유사한 지능으로 나아가는 핵심 경로이자, 트랜스포머 기반 시스템보다 더 강력한 기초라고 보고 있습니다. LeJEPA는 이러한 이상적인 특징 분포를 달성하기 위해 'Sketched Isotropic Gaussian Regularization(SIGReg)'라는 새로운 정규화 기법을 개발했습니다. SIGReg는 모델의 실제 임베딩을 이론적으로 최적인 분포와 비교하여 수학적으로 깔끔한 방식으로 편차를 수정합니다. 이 기법은 자기 지도 학습에서 흔히 사용되는 여러 안정화 기법들, 예를 들어 스톱-그래디언트(stop-gradient) 방식, 교사-학생(teacher-student) 설정, 복잡한 학습률 스케줄 등을 대체합니다. 논문에서는 SIGReg가 선형 시간 복잡도로 실행되며, 적은 메모리를 사용하고, 다중 GPU에 쉽게 확장되며, 단 하나의 튜닝 가능한 매개변수만을 필요로 한다고 보고하고 있습니다. 핵심 구현 코드는 약 50줄에 불과합니다.

연구진에 따르면 LeJEPA는 추가적인 메커니즘 없이도 대규모 데이터셋에서 안정적으로 학습되며 경쟁력 있는 정확도를 제공합니다. ResNets, ConvNeXTs, Vision Transformers를 포함한 60개 이상의 모델에 대한 테스트에서 LeJEPA는 일관되게 깔끔한 학습 동작과 강력한 성능을 보였습니다. 특히 ImageNet-1K 데이터셋에서 ViT-H/14 모델은 선형 평가 설정에서 약 79%의 Top-1 정확도를 달성했으며, 은하 이미지를 포함하는 Galaxy10과 같은 전문 데이터셋에서는 DINOv2 및 DINOv3와 같은 대규모 사전 학습 모델보다 뛰어난 성능을 보였습니다. 연구팀은 이를 강력한 이론적 원리를 기반으로 한 방법론이 때로는 기존 기법으로 훈련된 거대 모델을 능가할 수 있다는 증거로 보고 있습니다.


편집자 노트

이번 야닉 르쿤 박사의 LeJEPA 발표는 AI 연구 커뮤니티뿐만 아니라 일반 대중에게도 상당한 의미를 갖습니다. 르쿤 박사는 AI 분야의 선구자로서, 그의 연구는 항상 미래 AI의 방향을 제시하는 중요한 지표가 되어 왔습니다. LeJEPA는 기존의 복잡하고 때로는 이해하기 어려운 자기 지도 학습 방식을 '간소화'했다는 점에서 혁신적입니다. 이는 AI 기술의 발전이 특정 전문가의 영역을 넘어, 더 많은 사람들이 이해하고 접근할 수 있는 방향으로 나아가고 있음을 시사합니다.

핵심 개념인 '수학적 구조를 따르는 내부 표현'과 '세상의 근본적인 구조를 예측적으로 학습'하는 것은 AI가 단순히 데이터를 나열하고 패턴을 찾는 것을 넘어, 인간처럼 세상을 이해하고 추론하는 단계로 나아가고 있음을 보여줍니다. SIGReg라는 새로운 정규화 기법은 복잡한 기술적 장치 없이도 안정적인 학습이 가능하다는 것을 증명함으로써, AI 모델 개발의 진입 장벽을 낮출 가능성이 있습니다. 이는 앞으로 더 적은 자원과 노력으로도 고성능 AI 모델을 개발할 수 있다는 희망을 줍니다.

LeJEPA와 같은 연구가 성공적으로 발전한다면, 우리는 더 똑똑하고 안정적인 AI를 일상생활에서 더 자주 접하게 될 것입니다. 예를 들어, 이미지 인식, 자율 주행, 의료 진단 등 다양한 분야에서 AI의 정확성과 신뢰성이 향상될 수 있습니다. 또한, 르쿤 박사가 이 프로젝트를 마지막으로 메타를 떠나 스타트업을 창업한다는 사실은, 이러한 혁신적인 AI 기술이 앞으로 더욱 빠르게 상용화될 수 있음을 암시하며, 관련 산업 생태계에도 큰 영향을 미칠 것으로 예상됩니다.



원문 링크