Notice
Recent Posts
Recent Comments
목록양자화 (1)
송민준의 개발노트
양자화(Quantization)
양자화란?딥러닝 모델에서 숫자 표현을 고정소수점 또는 정수로 변환하여 메모리 사용량을 줄이고 연산 속도를 높이는 기술이다. 딥러닝 모델은 일반적으로 32비트 부동소수점(float32)을 사용하여 연산하지만, 양자화를 통해 더 작은 데이터 형식(ex.int8)을 사용하면 효율성을 높일 수 있다.더보기딥러닝에서 실수를 근사하기 위해 가장 보편적으로 사용되는 자료형은 float32(IEEE 754)인데 이는 32비트 공간을 차지하는 부동소수점 방식으로, 32비트의 공간을 할애하되 소수점의 위치를 자유롭게 조절할 수 있도록 한 자료형이다. 부동소수점 방식은 필요에 따라 수의 크기와 정밀도 사이에서 trade-off가 가능하기 때문에 미세한 정보 손실도 최소화하여야 하는 상황에서 특히 강력하다. 그러나 많은 횟수..
인공지능/딥러닝
2024. 9. 10. 00:08