支持的模型

DeepChat

支持的模型

DeepChat 支持多种先进的语言模型,从商业云端API模型到本地部署的开源模型。本页面将提供完整的支持模型列表及其主要特性。

商业云模型

OpenAI 模型

OpenAI 提供的高性能模型,通过 API 使用:

模型上下文窗口主要优势推荐使用场景
GPT-4o128K 令牌最新版本,多模态能力,性能强大复杂任务,多模态交互,需要最高质量输出
GPT-48K/32K 令牌推理能力强,生成质量高学术写作,复杂推理,高要求内容生成
GPT-3.5-Turbo4K/16K 令牌响应速度快,成本较低日常对话,简单任务,原型开发
GPT-4-Vision128K 令牌图像理解和分析能力图像描述,视觉内容分析,多模态任务

API 特性

  • 支持流式响应
  • 函数调用功能
  • 系统提示词优化
  • 向量嵌入生成
  • 使用配额和计费管理

Anthropic 模型

Anthropic 提供的 Claude 系列模型:

模型上下文窗口主要优势推荐使用场景
Claude 3 Opus200K 令牌最高性能,推理能力极强专业研究,复杂分析,高质量创作
Claude 3 Sonnet200K 令牌平衡性能和速度日常工作使用,一般内容创作
Claude 3 Haiku200K 令牌速度快,成本低快速响应,简单任务,高频使用
Claude 2.1100K 令牌成熟稳定需要稳定性的生产环境

API 特性

  • 超长上下文窗口
  • 音频和图像输入
  • 较低的幻觉率
  • 内置道德伦理考量

Google 模型

Google 提供的 Gemini 系列模型:

模型上下文窗口主要优势推荐使用场景
Gemini 1.5 Pro128K 令牌多模态能力强,长上下文理解文档分析,多模态任务,长对话
Gemini 1.0 Ultra32K 令牌逻辑推理能力强复杂问题解决,学术研究
Gemini 1.0 Pro32K 令牌平衡性能和效率一般工作场景,内容创建
Gemini 1.0 Flash32K 令牌高速响应即时回复,简单任务

API 特性

  • 多模态输入支持
  • 流式输出
  • 与 Google 服务集成
  • 安全过滤功能

其他商业模型

其他可通过 API 接入的商业模型:

模型服务代表模型主要优势推荐使用场景
CohereCommand企业级文本生成和理解能力商业文档生成,客户支持
AI21Jurassic-2文本创作和摘要能力出色内容创作,文档摘要
百度文心文心一言中文处理能力强中文内容创作,本地化服务
阿里通义通义千问中文语境理解深入中文对话,行业应用
讯飞星火星火认知垂直领域优化特定行业应用,专业知识

开源模型

本地部署模型

可在本地计算机或私有服务器部署的开源模型:

模型大小变体主要优势资源需求
Llama 38B, 70BMeta最新开源模型,性能接近商业模型8B: 16GB RAM, 70B: 48GB+ VRAM
Mistral7B, 8x7B高效架构,参数利用率高7B: 16GB RAM, 8x7B: 32GB+ RAM
Gemma2B, 7BGoogle开源小模型,效率高2B: 8GB RAM, 7B: 16GB RAM
Phi-3Mini, Small微软小参数高性能模型Mini: 8GB RAM, Small: 16GB RAM
Vicuna7B, 13B基于Llama微调,指令遵循能力强7B: 16GB RAM, 13B: 24GB RAM
Orca7B, 13B对齐优化的Llama模型7B: 16GB RAM, 13B: 24GB RAM
Falcon7B, 40B多语言支持,开放训练过程7B: 16GB RAM, 40B: 40GB+ VRAM

部署选项

  • GGUF 量化格式支持
  • CPU 和 GPU 加速
  • 量化级别选择 (Q2_K to Q8_0)
  • 内存映射优化

专业领域模型

为特定任务优化的开源模型:

领域代表模型主要优势推荐使用场景
代码生成CodeLlama, DeepSeek Coder, WizardCoder代码理解和生成专精编程辅助,代码优化,调试
医疗健康Med-PaLM M, Med42, ClinicalGPT医疗知识丰富,专业术语理解医学教育,临床参考,研究辅助
科学研究Galactica, BLOOM科学文献理解,数学能力强科研辅助,论文写作,公式处理
法律分析LexiLaw, Legal-Bert法律术语和文档理解法律文件分析,合规审查
多语言BLOOM, XGLM多语言支持广泛多语言内容创建,翻译辅助

多模态模型

支持处理文本以外模态的模型:

模型支持模态主要能力推荐使用场景
GPT-4V文本,图像高级图像理解和分析图像内容分析,可视化问答
Claude 3 Vision文本,图像,文档精确文档理解和分析文档处理,图表分析,视觉内容创作
Gemini Pro Vision文本,图像,视频视觉内容处理,实时分析多媒体内容理解,视觉创意辅助
LLaVA文本,图像开源视觉-语言模型本地图像分析,隐私保护应用
CogVLM文本,图像高精度视觉理解细节图像描述,视觉内容理解

模型选择指南

如何为您的需求选择合适的模型:

选择因素

在选择模型时考虑以下因素:

  1. 任务复杂度

    • 简单任务:GPT-3.5-Turbo, Claude 3 Haiku, 本地小型模型
    • 中等复杂任务:GPT-4, Claude 3 Sonnet, Gemini Pro
    • 高度复杂任务:GPT-4o, Claude 3 Opus, 大型专业模型
  2. 响应速度需求

    • 高速响应:Claude 3 Haiku, GPT-3.5-Turbo, 本地优化模型
    • 平衡速度与质量:GPT-4, Claude 3 Sonnet
    • 优先质量:GPT-4o, Claude 3 Opus
  3. 成本考虑

    • 低成本:本地开源模型,GPT-3.5-Turbo
    • 中等成本:Claude 3 Sonnet, Gemini Pro
    • 高成本高性能:GPT-4o, Claude 3 Opus
  4. 特殊能力需求

    • 代码生成:CodeLlama, WizardCoder, GPT-4
    • 多语言:BLOOM, GPT-4, Claude 3
    • 视觉理解:GPT-4V, Claude 3 Vision, Gemini Vision
  5. 隐私与安全

    • 最高隐私:本地部署开源模型
    • 中等隐私:私有云部署
    • 标准隐私:商业API模型(遵循其隐私政策)

性能比较表

主要模型在不同任务上的性能对比:

任务类型顶级性能良好平衡资源效率
通用对话GPT-4o, Claude 3 OpusClaude 3 Sonnet, Llama 3 70BMistral 7B, Phi-3
创意写作Claude 3 Opus, GPT-4Claude 3 Sonnet, Llama 3GPT-3.5, Gemma
代码生成GPT-4, DeepSeek CoderCodeLlama, WizardCoderPhi-3, Mistral
逻辑推理GPT-4o, Claude 3 OpusGPT-4, Gemini ProMistral, Phi-3
多语言处理GPT-4o, Claude 3 OpusBLOOM, Gemini ProXGLM, Mistral
视觉理解GPT-4V, Gemini Pro VisionClaude 3 Vision, LLaVACogVLM, LLaVA-NeXT

模型版本更新

DeepChat 会定期更新支持的模型列表。查看最新支持的模型,请访问我们的模型更新页面open in new window或在应用内查看模型配置面板。

下一步,您可以了解如何配置这些模型,以便在 DeepChat 中使用它们。

支持的模型概览

这里应放置一张展示 DeepChat 支持的各种模型的概览图,显示模型类别和关系。

Last Updated 3/26/2025, 12:44:09 AM