=== Available LLM Models ===
Total models: 159
╭─────────┬──────────────────────────┬───────────┬──────┬────────┬──────────────┬──────────┬────────────┬─────────┬────────┬─────────╮
│ Status │ Model │ Provider │ Size │ Score │ tok/s est. │ Quant │ Runtime │ Mode │ Mem % │ Context │
├─────────┼──────────────────────────┼───────────┼──────┼────────┼──────────────┼──────────┼────────────┼─────────┼────────┼─────────┤
│ -- │ llama-3.3-70b │ Meta │ 70B │ - │ - │ 4bit │ - │ - │ - │ 128k │
│ -- │ llama-3.1-405b │ Meta │ 405B │ - │ - │ Q4_K_M │ - │ - │ - │ 128k │
│ -- │ qwen-2.5-72b │ Alibaba │ 72B │ - │ - │ 4bit │ - │ - │ - │ 32k │
│ -- │ deepseek-v3 │ DeepSeek │ 671B │ - │ - │ Q4_K_M │ - │ - │ - │ 128k │
│ -- │ claude-3.5-sonnet │ Anthropic │ - │ - │ - │ - │ - │ - │ - │ 200k │
│ -- │ gpt-4o │ OpenAI │ - │ - │ - │ - │ - │ - │ - │ 128k │
│ -- │ gemini-2.0-flash │ Google │ - │ - │ - │ - │ - │ - │ - │ 1000k │
│ -- │ mistral-large-2 │ Mistral │ 123B │ - │ - │ Q4_K_M │ - │ - │ - │ 128k │
│ -- │ phi-4 │ Microsoft │ 14B │ - │ - │ Q4_K_M │ - │ - │ - │ 16k │
│ -- │ codestral-25.01 │ Mistral │ 22B │ - │ - │ Q4_K_M │ - │ - │ - │ 256k │
╰─────────┴──────────────────────────┴───────────┴──────┴────────┴──────────────┴──────────┴────────────┴─────────┴────────┴─────────╯