제3세부

“차세대 딥러닝 알고리즘(CNN, RNN, LSTM, GAN, GNN)을 지원하는 범용 신경망 프로세서 개발”

3세부
  • CNN, RNN, LSTM, GAN, GNN을 포함한 차세대 딥러닝 알고리즘의 저전력 고성능 연산을 위한 신경망 프로세서 하드웨어 구조 연구 (연산 효율성 1TOPS/W 이상)
1 단계 : 신경망 네트워크 알고리즘 개발 및 소프트웨어 시뮬레이션
  • 하드웨어 친화적인 알고리즘 확보를 위하여 신경망 네트워크 압축 기법 연구
  • 다양한 심층 신경망 구조에서의 연산 과정에서 발생하는 공통된 데이터 특성 연구
  • 범용성을 가지기 위하여 다양한 심층 신경망 기반의 알고리즘 (CNN, RNN, LSTM, GAN, GNN)을 지원하는 기본 연산 블록 연구 및 소프트웨어 시뮬레이션
  • 심층 신경망 처리 과정에서 생기는 불필요한 연산을 검출할 수 있는 알고리즘 개발 및 소프트웨어 시뮬레이션
2 단계: 고성능 저전력 범용 신경망 프로세서 구조 연구
  • 다수의 기본 연산 블록으로 다양한 신경망 네트워크 모델의 연산을 위하여, 기본 연산을 이용한 확장성 연구
  • 연산 블록, 공용메모리, 캐시메모리를 효율적으로 이어주는 온칩네트워크 상호 연결 및 토폴로지 연구
  • 심층 신경망 처리 과정에서의 불필요 연산의 유무를 결정할 수 있는 하드웨어 블록 연구 및 블록 최적화
  • 연산 블록들의 그룹화 및 데이터를 재사용 및 넓은 대역폭을 가질 수 있도록 공용 메모리를 배치 및 운용하기 위한 연구
  • 불필요한 연산의 예측 및 제거로 인한 유휴 연산 블록 수 최소화 및 하드웨어 자원 활용 최적화 기법 연구
3 단계: 시스템 소프트웨어 개발 및 초고성능 가속기 구조 개발
  • 개발한 신경망 프로세서를 운용하기 위하여 시스템 소프트웨어 개발
  • 가속기가 처리하는 현장의 데이터 정보를 활용하여 현장 데이터에 최적화된 초고성능 처리 기법 연구
  • 현장 데이터의 정보를 실시간으로 습득하기 위한 하드웨어 구조 연구
  • 여러 연산 블록의 동작을 위한 소프트웨어 드라이버의 개발
  • 소프트웨어 라이브러리를 개발하여, 여러 신경망 네트워크 모델의 성능 가시화
  • 현장 데이터에 최적화된 초고성능 처리를 위한 하드웨어 구조 연구