[Lightweight-Sereis] 0. Intro

2024-12-21 최대 1 분 소요

1. Lightweight Deep Learning

Example Image

Computer Vision, LLM 등의 분야는 높은 성능을 보여주나, 한계점을 지니고 있음.
- 막대한 연산 자원
  - Paramerts가 수입억 ~ 수천억 -> Train & Inference를 위한 Computational Cost가 매우 多.
- 모바일 및 Edge Device에서의 제약
  - IoT 환경 혹은 모바일 Device에서 실행이 어려움.
- 실시간 처리의 한계
  - 자율주행, 실시간 번역 등 응답속도가 중요한 실시간 처리의 경우 Latency가 느리다면 실용성이 떨어짐.
해당 분야가 아니더라도, 가지고 있는 H/W의 사양에 따라 탑재할 수 있는 모델은 제한적.

어떻게 해결할 수 있을까?

2. Lightweight Method

이를 해결하기 위한 Neural Network의 Cost & Size를 줄이는 방법
종류
1. Pruning
  - Connect 된 Network를 잘라 Computational Cost를 줄이는 방식
2. Quantization
  - floating-point의 Weight를 integer로 변환하여 Cost와 Memory를 줄이는 방식
3. Knowledge Distillation
  - Teacher Network(Pre-Traiend)의 지식을 Student Network의 전달하며 Train 시키는 Method.
  - 즉, 더 큰 Network와 Smaller Network의 Loss의 차이를 학습시켜 Smaller Network의 성능을 향상시키는 학습 방법.
4. Low-Rank Adaptation
  - M X N 크기의 Weight Matrix를 M X K, K X N의 저차원 행렬로 분해하여 학습시킨 후, 복원하는 방식.
5. Framework
  - onnx, TensorRT 등 가속 Framework를 활용

이번 Sereis는 이러한 Lightweight Deep Learning 기법들을 분석하고 적용해보는 과정.

공유하기

Twitter Facebook LinkedIn

댓글남기기

참고

[Lightweight-Sereis] 2. Quantization

2024-12-23 2 분 소요

1. Weight Tensor Pytorch, Tensorflow의 Tesnor의 dtype은 float32 여기서 32라는 의미는 해당 Type의 Value를 저장하기 위해 32bit(4bytes)를 사용한다는 의미.

[Lightweight-Sereis] 1. Pruning

2024-12-22 4 분 소요

1. Pruning

ResNet-50

2024-12-20 5 분 소요

1. Vanishing Gradient Problem

[Attention-Series] 1. Self-Attention

2024-10-25 2 분 소요

Self - Attention 자연어를 처리하기 위해선 문맥을 이해하는 것이 필수적. 사람은 문법을 학습하고 노출되어 왔기에, 특정 문장에서 단어 간의 관계를 이해 가능. Ex. The paper was rejected because it wa...