화요일, 5월 21, 2024

빛 전파를 프로그래밍하여 생성된 효율적인 신경망

Must read

Ae Dong-Yul
Ae Dong-Yul
"트위터를 통해 다양한 주제에 대한 생각을 나누는 아 동율은 정신적으로 깊이 있습니다. 그는 맥주를 사랑하지만, 때로는 그의 무관심함이 돋보입니다. 그러나 그의 음악에 대한 열정은 누구보다도 진실합니다."

현재 AI 모델은 수십억 개의 훈련 가능한 매개변수를 사용하여 어려운 작업을 수행합니다. 그러나 이렇게 많은 수의 매개변수에는 비용이 많이 듭니다. 이러한 대규모 모델을 교육하고 배포하려면 중형 도시에 필요한 전력만큼의 에너지를 소비하는 항공기 격납고 크기의 데이터 센터에서만 제공할 수 있는 엄청난 양의 메모리와 컴퓨팅 성능이 필요합니다. 연구 커뮤니티는 현재 AI 개발을 현재 속도로 지속 가능하게 유지하기 위해 관련 컴퓨팅 하드웨어와 기계 학습 알고리즘을 모두 다시 생각하기 위해 노력하고 있습니다.

신경망 아키텍처의 광학적 구현은 모듈 간 통신의 낮은 전력 소비로 인해 유망한 접근 방식입니다. 새로운 검색 Advanced Photonics에 보고됨 이는 다중 모드 광섬유 내의 빛 전파를 디지털로 프로그래밍 가능한 소수의 매개변수와 결합하고 프로그래밍 가능한 매개변수가 100배 이상 많은 완전 디지털 시스템을 사용하여 이미지 분류 작업에서 동일한 성능을 달성합니다. 이 계산 프레임워크는 메모리 요구 사항을 단순화하고 전력 집약적인 디지털 작업의 필요성을 줄이는 동시에 다양한 기계 학습 작업에서 동일한 수준의 정확도를 달성합니다.

EPFL(로잔에 있는 스위스 연방 공과대학)의 Dimitri Psaltis 교수와 Christoph Moser가 이끄는 이 선구적인 연구의 핵심은 파면 변조라고 알려진 기술을 통해 다중 모드 광섬유 내에서 초단파 펄스를 정밀하게 제어하는 ​​것입니다. 이를 통해 마이크로와트의 평균 광전력을 사용하여 비선형 광학 계산을 수행할 수 있으며, 이는 광학 신경망의 잠재력을 실현하는 데 중요한 단계에 도달합니다. “이 연구에서 우리는 작은 매개변수 세트를 사용하여 광학이 제공하는 웨이트 뱅크에서 특정 모델 가중치 세트를 선택하고 이를 대상 컴퓨팅 작업에 사용할 수 있다는 것을 발견했습니다. 이런 식으로 우리는 자연적으로 발생하는 현상을 다음과 같이 사용했습니다. 제작 및 작동 문제를 겪지 않고 컴퓨팅 장치를 만들 수 있습니다.” 이 목적을 위한 특수 장치입니다.”라고 해당 연구의 공동 저자인 Ilker Oguz는 말합니다.

이 결과는 더 큰 기계 학습 모델에 대한 수요 증가로 인한 문제를 해결하기 위한 중요한 단계를 나타냅니다. 연구자들은 다중 모드 광섬유를 통한 빛 전파의 계산 능력을 활용하여 인공 지능에서 저전력, 고효율 하드웨어 솔루션을 위한 길을 열었습니다. 보고된 비선형 광학 실험에서 볼 수 있듯이 이 계산 프레임워크는 다양한 고차원 비선형 현상을 효율적으로 프로그래밍하여 기계 학습 작업을 수행하는 데 사용될 수 있으며 현재 AI 모델의 리소스 집약적 특성에 대한 혁신적인 솔루션을 제공할 수 있습니다.

자세한 내용은 Oguz et al.의 Gold Open Access 기사를 참조하세요.효율적인 광학 학습 기계를 위한 비선형 전파 프로그래밍“, Advocate Photon. 6(1) 016002 (2024), doi 10.1117/1.AP.6.1.016002.

/일반 출시. 원래 조직/저자의 이 자료는 본질적으로 연대순일 수 있으며 명확성, 스타일 및 길이를 위해 편집되었습니다. Mirage.News는 기업의 입장이나 당사자를 받아들이지 않으며 여기에 표현된 모든 견해, 입장 및 결론은 전적으로 작성자의 것입니다. 전체 내용은 여기에서 확인하세요.

Latest article