"포스코DX의 인공지능 SW 및 제어 융합 기술과 딥러닝에 최적화된 인공지능 반도체의 연산 능력이 더해져 하나의 통합된 자동화/무인화 시스템을 구성할 수 있는 뜻깊은 협업 기회로 생각한다"며, "이를 통해 GPU에서 탈피한 더 고효율 연산 성능과 신뢰성 있는 솔루션을 제공하며 유연한 분산형 구조의 아키텍처를 제안함과 동시에 전력소비를 줄여 ESG경영에도 기여할 수 있을 것"
본문 요약
- 딥엑스가 인공지능(AI) 반도체 기반 공장 자동화 및 지능화 물류 시스템의 상용화를 위해 포스코DX와 기술 개발을 협력한다.
- 딥엑스는 6일 포스코DX와 AI 반도체를 활용한 제조, 로봇, 물류, 안전 등 산업현장에 적용 가능한 AI 솔루션 기술의 상용화를 위해 업무협약을 체결했다.
- 딥엑스는 포스코DX와 진행된 사전 기술 검증 과정에서 딥엑스의 컴파일러가 포함된 소프트웨어 개발 키트(SDK, Software Development Kit)인 ‘DXNN’을 배포해 자사의 하드웨어와 소프트웨어의 구동성을 검증한 후 딥엑스 기술의 우수함을 입증했다. 특히 전력 대비 인공지능 연산 성능 효율이 높아 산업 현장의 자동화를 위한 AI 솔루션으로 상용화하기에 적합한 것으로 평가받았다.
- 양사는 이번 협력을 통해 포스코DX의 공장 자동화 및 지능화 물류 설비제어시스템인 포스마스터(PosMaster-PLC)에 딥엑스의 AI 반도체 기술을 탑재해 산업현장 설비시스템의 운영을 자동화할 수 있는 대단위 AI 솔루션을 공동 개발할 계획이다.
- 이번 협약을 통해 양사는 스마트 팩토리 구동부에 사용될 AI 기능을 딥엑스의 AI SoC(System on Chip) 제품에 탑재하고 구동성 및 양산 가능성 등을 검증한 이후 적용범위를 확대해 나갈 계획이다.
- 딥엑스는 IPC(Industrial PC, 산업용 PC) 1대 정도의 AI 성능이 필요한 분야에 적용할 수 있는 ‘DX-M1(23TOPS)’ 제품으로 올해 포스코DX와 테스트를 진행하고 공장에 적용할 계획이며, 추가적으로 대규모 단위 AI 연산이 필요한 서버 솔루션인 ‘DX-H1(서버당 22POPS – 초당 2.2경회 인공지능 연산)’도 테스트를 진행할 예정이다.
- 해당 칩 솔루션은 다양한 산업 현장의 설비시스템에 M.2 모듈 및 PCIe 카드 형태로 설치해 수십만대의 카메라 및 센서를 통해 들어오는 데이터를 신속하게 분석할 수 있는 고성능 제품 라인이다.
- 한편, 딥엑스는 모든 곳에 AI 컴퓨팅을 구현하기 위한 AI 반도체를 개발하는 회사로서, AI 기술을 모든 곳에 존재하는 다양한 전자기기에 고성능·저전력으로 구현할 수 있다. 현재 다양한 엣지 및 서버 AI 응용 분야에 맞춰 성능과 기능이 최적화된 AI 반도체 4종을 보유하고 있으며, AI 반도체 원천기술과 관련한 국내외 특허도 150여개 이상 확보한 상황이다. 국내에서는 대표적인 AI 반도체 팹리스로 평가받으며 글로벌 AI 반도체 시장을 목표로 한다.
AI 반도체? 또 새로운 기술에 신기함을 느끼고 DeepX 회사에 관해 조사해 보았다.
DeepX 회사 조사
딥엑스는 AI 반도체를 만드는 회사이다. 반도체 기술 + AI 가 접목되어 GPU 연산 장치가 필요가 없다. 😱
제품은 NPU IP, Chip, Evaluation Board 의 3가지 종류로 각 성능에 따라 8개의 칩셋이 있다.
1. DNN 모델용 NPU 컴파일러
DEEPX 컴파일러는 DEEPX NPU(신경망처리장치)에 대한 이진 파일을 생성하기 위해 훈련된 추론 DNN 모델을 컴파일합니다. 결과적으로 정확성, 대기 시간, 처리량 및 효율성 측면에서 최적화된 실행 코드를 얻을 수 있습니다. 실행 바이너리는 NPU 계산 리소스의 모든 요소를 효율적으로 활용하여 전력 소비, 처리 성능, 메모리 대역폭 및 메모리 설치 공간을 최적화합니다. SW 툴은 NPU 작업의 다양한 일정을 탐색하고 최적화된 런타임을 생성하기 위한 최적의 접근 방식을 선택합니다.
2. 세계 최고 성능의 양자화기
DXNN은 부동 소수점 형식으로 훈련된 DNN 모델의 자동 양자화를 지원합니다. 모델 설명 및 대표 입력을 수신하고 모델을 고정점 데이터 유형으로 자동 정량화하여 실행 시간을 크게 단축하고 전력 효율을 높입니다. SDK의 양자화기는 훈련된 모델을 FP32 비트에서 INT8 이하의 비트 정수 표현으로 변환합니다. DXNN 양자화기는 NPU 솔루션에서 매우 높은 AI 정확도를 제공합니다. DXNN 양자화의 AI 정확도는 GPU의 FP32 비트 표현에 있는 DNN 모델의 수준과 거의 비슷하거나 더 높습니다!
3. 모델 추론 프로세스를 간소화하는 세계 최고의 옵티마이저
DXNN의 옵티마이저는 사용자 DNN 모델의 최적화를 담당합니다.최적화 도구는 기존의 최적화 기술과 새롭게 등장하는 그래프 수준 최적화 기술을 모두 활용합니다.DXNN의 옵티마이저는 AI 정확도 손실 없이 계산량을 크게 줄일 수 있습니다. DXNN의 최적화 도구는 연산자를 융합하거나 연산자 순서를 교환하는 것과 같이 하위 그래프의 최적화된 버전으로 하위 그래프를 공격적으로 대체합니다.
4. 사용자 친화적인 호스트 통신 및 런타임
SDK에는 호스트와 DEEPX NPU 간의 통신을 지원하는 Linux(x86/Arm) 및 Windows(x86) 드라이버가 포함되어 있습니다. DEEPX의 런타임 API는 모델 로드, 추론 실행, 모델 입력 전달, 추론 데이터 수신 및 장치 관리를 위한 일련의 기능을 지원합니다.
3줄 느낀점
1. 인공지능이 성장함에 따라 이를 처리할 수 있는 가속화 처리기, 양자화에 관한 연구 개발도 진행 중
2. 국내에도 연산처리장치 칩을 개발하는 회사가 있어서 놀랐다!
3. 현업에서 인공지능을 빠르게 구동시키 위한 가속화, 최적화에 관심을 갖고 볼 것!
'Artificial Intelligence > AI Tech Trend 🌟' 카테고리의 다른 글
Action speaks louder than words. 하루 하루의 기록을 습관화 합니다 📖
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!