福建论坛|福建发展论坛-汇聚福建人的力量(FUJIANUP.COM)!

 找回密码
 立即注册
搜索
热搜: 福州 厦门 泉州
查看: 715|回复: 6

[转载] DeepSeek-R2大模型或将发布(预计本月5月)

[复制链接]
发表于 2025-5-18 15:34 | 显示全部楼层 |阅读模式

注册成为福建发展论坛会员,为福建发展加油助威!

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

DeepSeek-R2大模型或将发布




2025-05-16 19:44




  4月30日凌晨DeepSeek更新Prover-V2大模型,据多方消息透露,国内AI技术领军企业深度求索(DeepSeek)计划于5月发布新一代旗舰大模型DeepSeek-R2,预计比GPT-4成本下降97%。作为国产AI技术的里程碑产品,R2在推理能力、多模态处理及成本控制方面实现重大突破,或将重塑全球AI竞争格局。




  在权威评测集 GSM8K 和 MATH 等任务中,R2 的推理能力超越了 GPT 系列及 Claude 3.7 Sonnet,尤其在复杂数学题和代码生成等场景中表现出色。例如,R2 支持逐步推导与自主纠错,能够解决类似“7 米甘蔗过 2 米门”这样的逻辑难题。




  此外,R2 结合检索增强生成(RAG)技术,支持图文理解与跨模态内容生成,适用于科研、教育、企业服务等多个领域。其 128K 超长上下文窗口能够解析 50 页 PDF 文档或完整代码库,且多轮对话记忆能力显著提升。通过 Native Sparse Attention(NSA)技术,R2 的解码速度提升了 11.6 倍,推理成本较初代大幅降低,更适配智能手机、AI PC、智能家电等场景。


发表于 2025-5-18 23:35 来自手机版 | 显示全部楼层
干部 发表于 2025-5-18 22:20
等什么时候取个如豆包、通义、文心一言等汉字名称,就是国产的了。

你不知道中文名叫深度思考吗?
回复 支持 2 反对 0

使用道具 举报

 楼主| 发表于 2025-5-18 15:39 | 显示全部楼层

DeepSeek R2的技术突破三大核心:


1.模型架构创新层面,采用自主研制的Hybrid MoE3.0架构,实现1.2万亿动态激活参数(实际计算消耗仅780亿参数),经阿里云实测验证,在处理长文本推理任务时,单位token成本较GPT-4Turbo下降97.3%(数据来源:IDC算力经济模型测算);


2.数据工程,构建覆盖金融、法律、专利等垂直领域的5.2PB高质量语料库,通过多阶段语义蒸馏技术,使指令遵循准确率提升至89.7%(对比测试集:C-Eval2.0);


3,硬件适配突破,其自研分布式训练框架实现昇腾910B芯片集群利用率达82%,在FP16精度下实测算力达512PetaFLOPS,达到同规模A100集群的91%效能(华为实验室验证数据)。


从应用层突破来看,DeepSeek R2在多模态领域实现三大技术迭代:


1)视觉理解模块采用ViT-Transformer混合架构,在COCO数据集物体分割任务中取得92.4 mAP精度,较CLIP模型提升11.6个百分点;


2)工业质检场景中,基于自适应特征融合算法,在光伏EL缺陷检测项目中将误检率压缩至7.2E-6(隆基股份产线实测数据);


3)医疗诊断模块通过知识图谱增强技术,在胸部X光片多病种识别任务中达到98.1%准确率,超越放射科主任医师专家组平均水平的96.3%(北京协和医院双盲测试结果)。



发表于 2025-5-18 22:20 | 显示全部楼层
等什么时候取个如豆包、通义、文心一言等汉字名称,就是国产的了。
发表于 2025-5-19 16:37 来自手机版 | 显示全部楼层
嗯呢
回复

使用道具 举报

发表于 2025-5-19 22:20 | 显示全部楼层
老墨 发表于 2025-5-18 23:35
你不知道中文名叫深度思考吗?

你不知道深度思考只是上面那些AI软件都有的一种功能吗
发表于 2025-5-19 22:30 来自手机版 | 显示全部楼层
干部 发表于 2025-5-18 22:20
等什么时候取个如豆包、通义、文心一言等汉字名称,就是国产的了。

深度求索
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|福建论坛 ( 闽ICP备13019286号 )|闽公网安备35058202000495号

GMT+8, 2025-6-16 00:42 , Processed in 0.037667 second(s), 17 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表