252. AI 추론 비용
Medium
객관식
AICEAI실무객관식
문제 설명
LLM 서비스에서 추론(Inference) 비용을 줄이기 위한 방법으로 적절하지 않은 것은?
보기
- 1모델 양자화(Quantization)
- 2배칭(Batching)으로 여러 요청을 한 번에 처리
- 3캐싱(Caching)으로 반복 요청 재활용
- 4모델 파라미터를 더 늘린다
- 5작은 모델을 단순 작업에 활용
로그인하고 풀기
AI가 자동 채점하고 즉시 정답·해설을 알려줘요. 무료.