AMD GPU + LiteLLM でローカル LLM と ChatGPT を同じエンドポイントに束ねた
AMD Radeon で動く Lemonade サーバーと ChatGPT サブスクリプションを LiteLLM Proxy で束ねて OpenAI 互換 API に統一した話。opencode との組み合わせも検討中。
2 記事
AMD Radeon で動く Lemonade サーバーと ChatGPT サブスクリプションを LiteLLM Proxy で束ねて OpenAI 互換 API に統一した話。opencode との組み合わせも検討中。
VS Code Copilot Chat の commit メッセージ生成などに使われる utility model を、LiteLLM 経由の Gemma-4-E4B に切り替えて GitHub Copilot のクォータを温存した話。