NVIDIA to Purchase ARM

September 16, 2020

2020년 9월 13일, 엔비디아가 ARM을 소프트뱅크로부터 인수하기로 합의했습니다. 주식과 현찰 포함해서 총 400억 달러, 한화로 47조 정도의 금액에 ARM을 인수하기로 합의 했습니다. 소프트뱅크, 정확히 말하면 비전펀드에서 ARM을 4년전에 320억 달러에 인수했으니, 4년만에 소프트뱅크가 80억 달러를 번 셈이네요. 인수 기간 대략 18개월 정도가 걸린다고 하니 5년 반쯤, 연 수익률 4%쯤 되겠습니다. 소프트 뱅크 입장에서 보면 그다지 많은 이득을 보진 않은 셈입니다. 그 5년간 주식에 넣어뒀다면 훨씬 큰 이득을 보았겠죠.

각설하고, 소프트뱅크가 그정도로 손해아닌 손해를 감수하며 팔게 된 계기는 아무래도 최근의 저조한 투자 실적으로 인한 것 같습니다. WeWork에 무리한 투자를 하고 상장을 시도 했으나 상장 실패를 했고 COVID-19으로 공유경제 자체가 심각한 타격을 받았죠. (그 와중에 상장을 시도하는 AirBnB의 배짱도 대단합니다) 그로 인해 투자금 회수가 어려워 지고 현금이 부족해 져서 아무래도 현금을 확보하려고 하는 거라는 의견이 주류입니다. 게다가 소뱅이 ARM을 인수하고 이런 저런 시너지를 노리고 IoT 시장이 커지는 것을 노렸지만, 그게 ARM에게 큰 이득은 되지 않았죠. 그래서 더 흥미가 떨어졌을 수도 있을 것 같습니다.

팔아야만 하는 소프트뱅크의 이유는 잘 이해가 갑니다. 그리고 최근에 난 뉴스는 비전펀드가 주식과, 콜옵션에 투자했다는 말도 들립니다. 마사요시 손 회장의 의중을 이해할 수 없는 행보입니다.

그러면 사겠다는 엔비디아의 입장을 생각해 보면, 선뜻 이해가 가지 않습니다. 이 분야를 잘 모르거나 ARM이 무슨 일을 하는 지 잘 모르시는 분들을 위해 간단히 설명을 해 볼게요. ARM은 테크에 관심있으신 분이라면 몇번 들어봤을 겁니다. 삼성 갤럭시에 들어가는 엑시노스나 애플 아이폰/아이패드에 들어가는 A 시리즈 칩셋, 퀄컴의 스냅드래곤, 모두 안에는 ARM 프로세서가 들어가있습니다. ARM은 자체 칩셋을 만들어서 팔지 않습니다. 삼성, 퀄컴, 애플에 Soft IP형태로 팔거나, 아니면 ARM 프로세서 명령어 셋 (ISA)에 호환되는 코어를 자체적으로 만들 수 있는 권리를 팔거나 합니다.

위에 언급한 세 회사 모두 ARM ISA와 100% 호환되는 자체 코어를 생산해왔습니다. 그 외의 다른 회사는 대부분 Soft IP를 받아서 칩을 제작합니다. Soft IP는 뭐라고 해야 할까요. 소스코드라고 해야 할까요? 그 소스코드를 가지고 컴파일러가 바이너리를 만들어 내듯이, 이 Soft IP (하드웨어 디자인 코드)를 가지고 실제 칩 그림을 그립니다. 즉, 겉으로 보기엔 ARM은 칩을 전혀 제작하지 않습니다. (실제론 내부에서 테스트 칩도 제작하고, 고객사 칩 제작시 문제 생기면 적극적으로 참여하기 때문에 칩 제작 실력이 없다고 볼 순 없습니다)

엔비디아는 전혀 다른 사업을 하죠. 뭐 같은 실리콘 회사이긴 하지만, 엔비디아는 ARM과 비지니스 모델이 다릅니다. 칩을 자체적으로 제작하고, 레퍼런스 보드도 설계해서 고객사에 칩을 팝니다. 그 칩과 레퍼런스 보드를 보고 같은 레이아웃으로 여러 회사, 예를 들면 EVGA, ASUS, ZOTEC 등의 회사에서 비슷한 모양의 그래픽 카드를 만들죠.

그 차이를 이해하실 수 있을지 모르겠지만, 다르게 말하면 ARM은 알고 있는 지식을 파는 곳이고, 엔비디아는 실제 물건을 파는 곳입니다. 그래서 그런지 몰라도, 엔비디아는 코드 공개에 박하다고 알려져 있습니다. 칩 코드는 당연히 공개하긴 어렵겠지만, 그에 따른 드라이버도 자체제작하는 터라 리눅스 커널에 바이너리로만 드라이버를 제공합니다. 리눅스 커널 제작자 리누스 토발즈가 NVIDIA fxxk you! 한 일도 유명하죠.

서로 완전 극과 극인 회사입니다. ARM 또한 프로세서 코드를 보려면 꽤 비싼 로열티를 내야 하긴 하지만 아예 못 보는 건 아닙니다. (돈을 덜 내면 암호화 된 코드만 볼 수 있어요) 게다가 개발 툴도 자체 제작하기도 하지만, 오픈소스 툴도 엄청 많습니다. 서로 상극인 두 회사가 합쳐지면 어떤 상황이 될 지 걱정이 되기도 합니다.

게다가 ARM의 주력은 프로세서인데, 엔비디아에서 프로세서를 쓰고 있는 곳은 모바일 칩 (테그라) 말고는 없죠. 그래픽 카드에도 들어간다곤 하지만, 그닥 성능 높은 건 아니라 RISC-V로도 대체 가능할 수준의 마이크로 컨트롤러가 들어갑니다.

엔비디아가 이미 테그라 칩을 만든 전적이 있는 터라, 모바일을 위해서 ARM을 인수한다고 보기는 어렵습니다. 인수하면서 언급한 내용을 보면, ARM과 협업해서 AI 기반을 다지겠다는 것으로 보이는 데, 개인적인 의견으론 어떻게 시너지가 날 지 의문이긴 합니다.

일단 시너지를 내기 위해선 ARM에 엔비디아의 입김이 많이 작용해서 엔비디아 입맛에 맞는 코어가 나와야 하는 데 인수하면서 ARM의 독립성을 유지하겠다고 했으니, 두개가 서로 상충이 됩니다. 입맛에 맞는 프로세서를 만들어서 Soft IP로 고객사에게 판다고 하면, 죽쒀서 개 준 꼴 되기 쉽죠. 비공개로 진행한다면 처음의 말을 어긴거니 욕 먹을테구요. 제 의견으론 결국 ARM이 엔비디아에 휘둘리게 될 것 같습니다. 비싼돈 주고 샀으니 경쟁사에게 우위를 점해야 할테니까요.

제 의견은 부정적이지만, 예전 RISC-V 글 또한 틀린 전적이 있기에, 시너지를 낼 수 있다고 가정해 봅시다. 그러면 엔비디아가 가장 키우고 싶은 곳은 어디일까요? 전 잘 모르겠어서 지인들에게 물어보니, 이런 저런 의견이 나왔는데, 그 중 가장 그럴 듯 한 의견이, 데이터센터 용 서버 아키텍처를 만들겠다는 의견이었습니다.

올해 초 엔비디아가 하나의 회사를 인수했었습니다. 꽤 이름이 퍼지고 있었던 네트워킹 관련 회사인데, Mellanox라고 하는 회사입니다. 그 회사를 인수하면서 밝힌 포부가 데이터센터용 서버 아키텍쳐를 새롭게 만들겠다는 것이었습니다. Next Platform의 엔비디아 CEO 인터뷰 글에서 언급이 됩니다.

핵심 컨셉은 CPU, GPU, 메모리, 스토리지를 하나의 서버 안에 두는 게 아니라, 서로 네트워크로 연결해서 매우 유연하고 강력한 서버 풀을 만들겠다는 겁니다. 그 시스템의 핵심은 바로 빠른 네트워크죠. 그걸 위해 Mellanox를 인수한 겁니다.

그래픽은 이미 엔비디아가 꽉 잡고 있고, 네트워킹은 Mellanox로 해결할 수 있습니다. 스토리지는 NVMe over Ethernet (NVMoE)으로 꽤 많은 회사가 개발하고 있으므로 그걸 가져다 쓸 수 있습니다. 남은 것은 프로세서와 메모리죠.

메모리는 팹이 필요하므로 쉽게 접근할 수 있는 부분은 아니므로 건너뛰고, 프로세서를 이야기 해 볼까요. 현재 프로세서는 소프트웨어를 동작하기 위해 명령어를 인식하고 실행하는 코어부분보다 주변 장치와 통신하는 부분이 매우 비중이 큽니다. DDR 메모리 컨트롤러, PCIe Root Complex, South Bridge Interface 인 Direct Media Interface (DMI) 등 수 많은 주변장치들이 들어가있습니다. 엔비디아의 아키텍처를 따르면, 이 많은 주변장치를 모두 뜯어내고 네트워킹 컨트롤러 (RDMA)만 들어가 있으면 됩니다. CPU에서 내려오는 모든 메모리 접근은 ethernet을 통해서 네트워크로 전파되고 네트워크 라우팅 알고리즘에 따라 효율적으로 해당 주변장치나 그래픽카드로 전달 됩니다.

꽤 신선한 아이디어죠. 이게 왜 나왔냐면 머신러닝 때문에 그렇습니다. 머신러닝에서 데이터 양이 점점 증가하면서 현재의 메모리 크기론 감당할 수 없는 양의 데이터를 연산해야만 하는 상황이 되었습니다. 알리바바의 경우 광고를 위한 머신러닝 트레이닝 데이터가 10TB라는 말도 있습니다. 하나의 서버에 메모리에 올려두고 연산할 수 있는 양이 아니죠. 그래서 스토리지에서 메모리로 올리고 내리고 하면서 많이 효율이 떨어집니다.

그걸 해결하기 위해 스토리지 쪽에서는 NVDIMM이라는 것도 개발하고 있습니다. 플래시 메모리나 차세대 메모리를 DRAM 인터페이스와 상당히 호환되게 만들어서, 프로세서는 in-memory 데이터에 접근하는 것처럼 만드는 방식인데, 이 또한 많은 데이터를 한번에 메모리에 올릴 수 없어서 나온 아이디어입니다.

만들수만 있다면, 엔비디아의 방식이 꽤 효율적이겠죠. 네트워크로 연결하면 메모리 용량의 제한이 사라지는 셈이니까요. 그래서 이것을 노리고 ARM을 인수하지 않았을까… 하는 지인의 의견이 꽤 타당하게 느껴집니다.

만드는 건 그렇다 치고, 이 시스템을 만든다 치면, 사야 할 곳이 있을텐데, 그게 좀 의문입니다. 아마존, 구글은 자체 ML 시스템을 개발하고 있으니, 엔비디아가 무엇을 만들 든, 그게 표준으로 자리잡지 않는 이상 그 시스템을 주력으로 채용할 수는 없을 겁니다. 마이크로소프트도 들리는 소문엔 자체 ML 칩을 개발하고 있다고 하는 데, 좀 더 지켜봐야죠. 그러면 가장 큰 데이터센터 3곳은 이미 대량으로 팔기 어렵습니다. 그 외의 클라우드라 하면, 애플이나, SAP? IBM? 오라클? 정도인 데, 큰 세곳이 따라주지 않으면, 대세가 되긴 어렵죠.

그러면 엔비디아는 자체 데이터센터를 구축하려는 걸까요? 엔비디아가 데이터센터, 클라우드 산업에서 두각을 나타낼 수 있을 지 사실 의문이긴 합니다. 아마존이나 구글처럼 자체 서비스를 운영하다보니 클라우드가 만들어지는 상황도 아닙니다. Geforce Now가 있긴 하지만 게임 플랫폼이라 위의 새로운 플랫폼을 가져다 쓰기도 어렵습니다.

그래서, 좋은 시스템을 만들었다 해도 그것을 상용화 시키고 대중적으로 만들기가 쉽지 않아보입니다. 그 난관을 어떻게 해결해 나갈 지 지켜보는 것도 흥미로울 것 같습니다.

전제가 틀렸을 수도 있겠죠. 정말 엔비디아가 IoT쪽에 관심이 많아서 암을 인수해서 포트폴리오를 넓히려는 것일 수도 있겠죠. 시간이 지나면 결국 알게 되겠죠. 그때 다시 업데이트 하겠습니다.