OmniRouter

一个 API,接入全球优质大模型。

OmniRouter 兼容 OpenAI SDK,统一调度 OpenAIClaudeGeminiDeepSeek 等主流模型,稳定、快速、低成本。

企业友好:支持对公转账、开票和额度管理。

连接全球模型生态

从旗舰闭源模型到开源推理、图像、语音与视频模型,统一在同一套 API 下调度。

  • OpenAI
  • Claude
  • Gemini
  • DeepSeek
  • Qwen
  • Mistral
  • Meta AI
  • Grok
  • xAI
  • Perplexity
  • Moonshot
  • Kimi
  • Doubao
  • Hunyuan
  • MiniMax
  • ChatGLM
  • Zhipu
  • Baichuan
  • Yi
  • 01.AI
  • Wenxin
  • Spark
  • Stepfun
  • InternLM
  • SenseNova
  • Gemma
  • LLaVA
  • Cohere
  • Jina
  • Voyage
  • AI21
  • Ai2
  • BAAI
  • Nous Research
  • DeepMind
  • Inflection
  • DBRX
  • RWKV
  • TII
  • DALL-E
  • Sora
  • Midjourney
  • Stability
  • Flux
  • Runway
  • Hailuo
  • Jimeng
  • Kling
  • Kolors
  • Pika
  • PixVerse
  • Luma
  • Dream Machine
  • Recraft
  • Adobe Firefly
  • Ideogram
  • Krea
  • Vidu
  • Haiper
  • Hedra
  • Viggle
  • Suno
  • Udio
  • ElevenLabs
  • Fish Audio
  • AssemblyAI
  • Hugging Face
  • Ollama
  • OpenRouter
  • ModelScope
  • Replicate
  • Together AI
  • Groq
  • Cerebras
  • NVIDIA
  • Fireworks
  • DeepInfra
  • fal
Search models
OpenAI
OpenAI 系列 智能路由 · 即时切换
Claude
Claude 系列 智能路由 · 即时切换
Gemini
Gemini 系列 智能路由 · 即时切换
DeepSeek
DeepSeek 系列 智能路由 · 即时切换

为什么选择我们

智能路由, 极速响应。

自动匹配低延迟、高可用通道,按请求动态选择更合适的模型与线路。

智能 API 路由示意图

硬件适配, 推理引擎优化。

针对不同 GPU 与推理框架持续调优,让模型在真实业务负载下跑得更稳、更快。

硬件适配与推理引擎优化示意图

智能 Cache, 降本提速。

对重复请求和相似上下文进行缓存复用,减少 token 消耗并缩短响应等待。

智能 Cache 降本提速示意图

稳定的基础设施

99.9% 可用性 SLA

多活架构,服务稳定可靠

200ms P99 延迟

全球智能加速,极速响应

10,000+ TPS

弹性扩展,轻松应对高并发场景

开始构建,无限可能

立即接入,体验稳定、快速、低成本的大模型 API 服务。

Contact Sales

联系销售

控制台正在完善中。请添加销售微信并备注企业名称、预计用量、需要接入的模型和开票需求,我们会尽快协助开通。

销售微信 wasd9949

企业采购、对公转账、发票和额度管理均可沟通。