안녕하세요, 오늘 리뷰해드릴 TensorDIMM 논문은 PIM(Process In Memory)을 공부하던 중 찾았는데, 좋은 내용이어서 공유하고자 합니다. 이 논문은 Facebook, Netflix, Youtube 등에서 사용되는 추천 모델(Recommendation model)에 주목하고 있습니다. 이러한 추천 모델에 쓰이는 DNN 기반의 머신 러닝에서(흔히 딥러닝으로 알려져 있죠), 사용되는 데이터양이 시간이 지날수록 급격하게 증가하고 있습니다. 그런데 이는 엄청난 "memory wall"에 직면하게 됩니다. 즉, 딥러닝 알고리즘은 엄청난 양의 memory capacity와 memory bandwidth를 동시에 요구하게 됩니다. 쉽게 말씀드리면 사용되는 데이터양도 많지만, 그 많은 데이터가 연산 ..