gpt-oss-20b Tool Calling 

System Specifications CPU: AMD Ryzen 9 9950X3D 16-Core (32 threads, up to 5.75 GHz) RAM: 60GB GPU: NVIDIA GeForce RTX 5090 (32GB VRAM, CUDA 12.9) Storage: 1.9TB (1.5TB available) OS: Fedora Linux 42 Server Edition Kernel: 6.15.10 이스펙으로 gpt-oss-20b 모델을 구동하고 테스트했다. 그냥 단순 부하 테스트로는 gpt-oss-20b 모델을 vllm 으로 실행했을때 90rps 까지 처리하고 초당 토큰을 생성하는 속도는 4000토큰 정도 생성했다. 4000 token/s 라는 이야기다. 생각보다 준수한 성능에 감탄하고 바로 도구를 사용할 수 있도록 작업을 했다. 홈랩의 구성을 여러번 갈아 엎게된 사연이 이과정에 있었다. ...

September 13, 2025 · 2 min · 📁 linuxer?