개발된 칩은 기존 AI칩의 과도한 전력 소모 문제를 해소하고, 거대 언어 모델(LLM) 처리 속도도 앞선다.

이번 슬롯 머신의 제1저자로 참여한 김상엽 박사가 지난 2월 19일부터 23일(현지 시간)까지 미국 샌프란시스코에서 개최된 국제고체회로설계학회(ISSCC)에서 시연하고 있다. [사진=과학기술정통부]
이번 연구의 제1저자로 참여한 김상엽 박사가 지난 2월 19일부터 23일(현지 시간)까지 미국 샌프란시스코에서 개최된 국제고체회로설계학회(ISSCC)에서 시연하고 있다. [사진=과학기술정통부]

[WHY? 인간의 뇌 구조 및기능을 본따서 만들었다.]

국내 연구진이 엔비디아A100 대비 소모 전력은 625배,칩 면적은 41배 작은AI 반도체를 세계 최초로 개발했다.

과학기술정보통신부(이하 과기정통부)는KAIST PIM반도체 연구센터와 인공지능반도체 대학원 유회준 교수 연구팀이400밀리와트 초저전력을 소모하면서0.4초 만에GPT 등 거대 언어 모델(LLM)을 처리할수 있는 인공지능 반도체인 '상보형-트랜스포머'를삼성 28나노 공정을 통해 개발했다고 6일 밝혔다.

연구팀은 거대 언어 모델을4.5mm x 4.5mm의 작은AI반도체 칩 한 개에초저전력으로 구현하는 것에 성공했다. 이는그동안다량의 GPU와 250와트의 전력 소모를 통해 구현됐다.

특히 인간의뇌 동작을 모사하는뉴로모픽 컴퓨팅 기술,즉스파이킹 뉴럴 네트워크(SNN)을활용해트랜스포머 동작을 구현한 것이 특징이다.

기존 뉴로모픽 컴퓨팅 기술은합성곱신경망(CNN)에 비해부정확하며 주로 간단한이미지 분류 작업만 가능했다. 연구팀은이것의 정확도를 CNN과 동일한수준으로 끌어올리고, 다양한 응용 분야에 활용할수 있는 상보형-심층신경망(C-DNN) 기술을 제안했다.

C-DNN은심층 인공 신경망(DNN)과 SNN을혼합 사용해,입력 데이터들을 크기에 따라 서로 다른 신경망에 할당하여전력을 최소화하는기술이다.

사람의 뇌가 생각할 것이 많을 때 에너지 소모가 많고, 생각할 것이 적을 때 에너지 소모가 적은 것과 같은 원리이다. 뇌를 모방한 SNN은입력값의 크기가 클 때는 전력을 많이 소모하고, 입력값의 크기가 작을 때에는 전력을 적게 소모한다. 지난해연구팀은 이러한 특징을 활용해 SNN에는작은 입력값만 할당하고, DNN에는 큰 값만할당해 전력 소모를 최소화했다.

슬롯 머신
[사진=과학기술정통부]

과기정통부는 "지난해C-DNN 기술을 거대 언어 모델에 적용함으로써초저전력·고성능의 온디바이스 AI가 가능하다는 것을 실제로 입증한 것"이라며"그동안 이론적인 연구에머물렀던것을세계 최초로 AI 반도체 형태로구현했다"고 말했다.

특히연구팀은뉴로모픽 네트워크 기반 AI가 문장 생성, 번역, 요약등과 같은고도의 언어 처리 작업을 정확도 높게 수행할 수 있는지에초점을 뒀다. 일반적으로 뉴로모픽 시스템은에너지 효율은 높지만 복잡한 작업을 수행할 때정확도가 떨어지는 경향이 있었다.

문제를 해결하기 위해 연구팀은독창적인DNN-to-SNN 등가변환기법을 개발해적용했다.이는 기존의 DNN구조를 SNN로 변환하는 과정에서정확도를 더욱 끌어올리기 위해 스파이크발생 문턱값을 정밀 제어하는 방법이다. 연구팀은 "SNN의 에너지 효율성을 유지하면서도 DNN수준의 정확도를 달성할 수 있었다"고 밝혔다.

또전력 소모량을 GPU(NVIDIA A100)대비 625배만큼 줄이면서,GPT-2 모델을 활용한 언어 생성은0.4초 만에,T5 모델을 활용한 언어 번역은0.2초 만에고속 동작이 가능한 상보형 트랜스포머를 개발할 수 있게 됐다.

유회준 KAIST 전기및전자공학부 교수는 "이번 연구는기존 AI 반도체의 전력 소모 문제를 해소했을 뿐 아니라, GPT-2와 같은거대 언어 모델 응용에 성공했다는 점에서큰 의의가 있다"며 "뉴로모픽 컴퓨팅은 초저전력·고성능 온디바이스AI의 핵심기술인만큼앞으로도 관련 연구를 지속할 것"이라고 설명했다.

한편, 김상엽 박사가 제1저자로 참여한 이번 연구는 지난2월 19일부터 23일까지 미국샌프란시스코에서 개최된 국제고체회로설계학회(ISSCC)에서 발표 및 시연됐다.

상보형 트랜스포머스파이킹 뉴럴 네트워크(SNN)와심층 인공신경망(DNN)을 선택적으로 사용해트랜스포머 기능을 구현한 기술.

뉴로모픽 컴퓨팅인간의 뇌구조 및기능을 모방해설계된 컴퓨팅 시스템.뇌의 뉴런과 시냅스를모방한 회로를 사용해 전통적인 컴퓨팅 시스템 대비 에너지 효율적으로 데이터를 처리할 수 있다.

스파이킹 뉴럴 네트워크(SNN)뉴로모픽 컴퓨팅의 한 형태로, 뇌의 뉴런이 '스파이크'라는시간에 따른 신호를 사용해 정보를 처리하는 방식.생물학적 뇌의 작동 방식에 가까워에너지 효율이 높고, 실시간 처리와 복잡한 시계열 데이터 분석에 적합하다.

합성곱신경망(CNN)심층인공신경망의 한 형태로, 이미지 인식·비디오 분석·이미지 분류와 같은 시각적 데이터 처리에 사용되는 딥러닝 모델. 여러 인공 신경망 계층을 통해 이미지의 특징을 추출하거나, 이미지를 분류·인식하는 데 사용된다.

심층인공신경망(DNN)여러 신경망 층으로 구성돼복잡한 패턴을 인식하고 학습할수 있는 AI 모델.추상적인 특성을 계층적으로 학습하는 딥러닝에 사용된다.

슬롯 머신코리아 이세연 기자 mvdirector@fortunekorea.co.kr

관련슬롯 머신

저작권자 © 슬롯 머신코리아 디지털 뉴스 무단전재 및 재배포 금지