为什么会流口水| 棉花是什么时候传入中国的| 辄是什么意思| 小孩子坐飞机需要什么证件| 夏天可以种什么蔬菜| 攫住是什么意思| 下面流出发黄的液体是什么原因| 负距离接触是什么意思| cmf是什么| 续集是什么意思| 天梭属于什么档次| 马克笔什么牌子好| pv是什么意思| 湖北有什么山| 维生素b2起什么作用| 无常是什么意思| 身体缺钾是什么症状| 孜字五行属什么| 二垒是什么意思| 杨五行属什么| 乳痈是什么病| 10月4日是什么星座| 拘留所和看守所有什么区别| 膀胱炎尿道炎吃什么药| 孕妇不能吃什么| 腰脱什么症状| 陈皮起什么作用| 减肥早餐吃什么最好| 喉软骨发育不良有什么症状| 养胃吃什么水果| 做妇科检查前需要注意什么| 孩子专注力差去什么医院检查| 孺子是什么意思| 有缘无分是什么意思| 红骨髓是什么意思| 生理期可以吃什么水果| 龟苓膏有什么功效| 吃什么对心脏好改善供血不足| 睡久了头疼是什么原因| 不拘小节是什么意思| 办香港通行证要准备什么材料| 新生儿ad滴剂什么时候吃最好| 细菌性炎症用什么药| 梦见自己家被盗有什么预兆| 胸前出汗多是什么原因| 高铁为什么会晚点| 血热吃什么药快速见效| 防小人应该佩戴什么| 独在异乡为异客是什么节日| jsdun是什么牌子的手表| 出汗多什么原因| 梦见打篮球是什么意思| 消化功能紊乱吃什么药| 庭字五行属什么| 腔梗是什么病| 头部ct能检查出什么| 知恩图报是什么意思| 深情款款什么意思| 阴道炎症用什么药| 游坦之练的什么武功| 阿奇霉素主治什么病| 欲望是什么| 女人的胸部长什么样| 指什么为什么| 聪明的女人是什么样的| 情人是什么意思| 刘备的马叫什么| 牛蛙和青蛙有什么区别| 什么什么不舍| 略略略是什么意思| 褥疮用什么药膏| jumper是什么衣服| 桥本甲状腺炎有什么症状| 甜菊糖苷是什么| 腊月十八是什么星座| 学籍卡是什么样子图片| 湿热吃什么食物好| 台阶是什么意思| 什么是杀猪菜| 口腔苔藓用什么药| 王白读什么| 长水泡是什么原因| 生吃洋葱有什么好处| 岬是什么意思| iphone5什么时候出的| 寄居蟹喜欢吃什么| 丫鬟是什么意思| Cr是什么意思医学| 你姓什么| 糖尿病的诊断标准是什么| 常吃南瓜有什么好处和坏处| 草莓是什么季节的水果| 什么运动有助于长高| 85属什么| 高压150低压100吃什么药| 活跃是什么意思| prada是什么档次| 生菜不能和什么一起吃| 胸透是查什么的| 8月11日是什么星座| dsa什么意思| 暴毙是什么意思| 托梦是什么意思| 来月经喝什么汤好| 81什么意思| 吃什么能去湿气| 什么睡姿对髋关节好| 炒锅买什么材质的好| 2029年属什么生肖| 脂肪肝适合吃什么水果| 子字属于五行属什么| 脑萎缩吃什么药| 早起的鸟儿有虫吃是什么意思| 一什么湖水| 1988年属什么今年多大| 家里为什么突然有床虱| 什么动物不长胡须| 内急是什么意思| camel是什么牌子| 肋间神经痛什么症状| c1e驾照能开什么车| 得了幽门螺旋杆菌有什么症状| 出单是什么意思| 美尼尔眩晕症吃什么药| 病理活检是什么意思| 蜂蜜和柠檬一起喝有什么作用| 2月5号什么星座| 一单一双眼皮叫什么眼| 老干局是干什么的| 抽烟头晕是什么原因| 大连机场叫什么名字| 小儿呕吐是什么原因引起的| 腮腺炎吃什么药| 爱好是什么意思| 梦见小女孩是什么意思| 黑色记号笔用什么能擦掉| 血瘀吃什么中成药| 检查前列腺需要做什么检查| 三七粉什么人不适合吃| 万事顺意是什么意思| 毛骨悚然是什么意思| 梦见办酒席是什么意思| 三七粉做面膜有什么功效| 牙周炎吃什么药好| 刚字五行属什么| 气的什么| 20度穿什么衣服合适| 心机女是什么意思| 痛风吃什么水果最好| 老来得子是什么意思| eap是什么| 医学hr是什么意思| 天秤女喜欢什么样的男生| 2024年属什么生肖| 水生木是什么意思| 艾滋病初期皮疹是什么样的| 眼干眼涩用什么眼药水| 羸弱什么意思| 棕色裤子搭配什么颜色上衣| 慢性萎缩性胃炎是什么意思| 猪吃什么食物| 吞咽困难是什么原因造成的| 一个口一个有念什么| 灰指甲是什么样子| 大腿抽筋是什么原因引起的| 女性私处长痘痘是什么原因| 小孩睡觉张开嘴巴是什么原因| 鼻子两侧毛孔粗大是什么原因造成的| iris是什么意思啊| 属相是什么意思| 什么无终| 彪是什么动物| 唇红齿白是什么生肖| 性有什么好处和坏处| 冰箱eco是什么意思| 花中四君子是什么| ccg是什么意思| 睡眠时间短早醒是什么原因| 神经系统是由什么组成的| noon什么意思| 1987年出生属什么生肖| 为什么我的眼中常含泪水| 蛋糕用什么奶油好| 趾高气昂是什么意思| 宋威龙什么星座| 什么叫自慰| 肌酸激酶高是什么原因| 鸟进屋有什么预兆| 天丝是什么材料| 世界大战是什么意思| ol是什么| 如是什么意思| 膝关节疼痛吃什么药好| 专台号是什么意思| bn是什么颜色| 刘邦属什么生肖| 信奥是什么| 耳闷耳堵是什么原因引起的| 门槛是什么意思| 虾子不能和什么一起吃| 心存善念是什么意思| 艾滋什么症状| 做人流吃什么水果| 什么防晒霜效果最好| 女人下身干燥无水是什么原因| 娘惹是什么意思| 尿黄什么原因| 碍事是什么意思| 什么的茄子| 茶卡是什么意思| 晕车的读音是什么| 腿抖是什么病的预兆| 焦虑症是什么意思| 通讯地址是什么意思| 锦衣夜行什么意思| 酸梅汤不适合什么人喝| 户籍地址填什么| 尿蛋白阳性是什么意思| 指甲花学名叫什么| 血红蛋白是查什么的| 身体发凉是什么原因| 2月20日是什么星座| 小棉袄是什么意思| 夏天喝什么汤好| 胃饱胀是什么原因| 放疗与化疗区别是什么| 精液什么颜色| 食伤泄秀是什么意思| 鸿运当头是什么菜| 什么是单反相机| 庸人什么意思| 嘴角周围长痘痘是什么原因| 阳痿挂什么科| 晒太阳有什么好处| 什么人容易得帕金森病| a216是什么材质| 什么是偏头痛| 父亲节什么时候| 银屑病为什么会自愈| 尿红色是什么原因| 多囊卵巢综合征是什么意思| 属龙和什么属相最配| 狮子座后面是什么星座| 什么水果是钙中之王| 喜悦之情溢于言表什么意思| 什么是盆地| 狗头军师什么意思| 55岁属什么| 8.1是什么星座| 眼睛散光和近视有什么区别| 小便尿血是什么原因| 吃什么可以增强抵抗力和免疫力| 荨麻疹吃什么食物好| 手莫名其妙的肿了因为什么| π是什么意思| 宫商角徵羽是什么意思| 线粒体是什么| 宫腔粘连有什么危害| 外阴白斑瘙痒抹什么药| 继承衣钵是什么意思| 送朋友鲜花送什么花| 黄体回声是什么意思| 阿尔山在内蒙古什么地方| 中午一点是什么时辰| 百度

百度腾讯抢滩布局!DeepSeek-R1升级和开源背后,国产AI的逆袭之路

李弯弯
日前,DeepSeek官方宣布DeepSeek-R1模型已完成小版本试升级,当前版本为DeepSeek-R1-0528。次日,DeepSeek-R1-0528正式在Hugging Face平台开源。用户可通过官方网页、App、小程序进入对话界面后,开启“深度思考”功能体验最新版本。API也已同步更新,调用方式不变。
百度 2010年的欧登塞,具备着与这个时代相称的现代元素,但人们却非常固执地要把它想象成在古老的北欧神话迷雾中,或者硬是要把这个城市安放在某个童话故事的浪漫背景下,每走到一处,都不自觉地想从这些现代化的表面下看到欧登塞更原始和沧桑的肌理。

本文来自微信公众号“电子发烧友网”,【作者】李弯弯。

电子发烧友网报道(文/李弯弯)日前,DeepSeek官方宣布DeepSeek-R1模型已完成小版本试升级,当前版本为DeepSeek-R1-0528。次日,DeepSeek-R1-0528正式在Hugging Face平台开源。用户可通过官方网页、App、小程序进入对话界面后,开启“深度思考”功能体验最新版本。API也已同步更新,调用方式不变。

DeepSeek-R1-0528编程能力提升最为显著

DeepSeek-R1-0528仍然以2024年12月发布的DeepSeek V3 Base模型为基座,通过在后训练过程中投入更多算力,显著提升了模型的思维深度与推理能力。

官方称,在数学、编程与通用逻辑等多个基准测评中,DeepSeek-R1-0528取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上接近其他国际顶尖模型,如OpenAI的o3高版本与o4 mini模型、Google的Gemini-2.5-Pro等。

在编程能力方面,DeepSeek-R1-0528能力的提升最为显著。知名代码测试平台Live CodeBench显示,新版本性能可以媲美OpenAIo3模型的高版本。据测试者反馈,DeepSeek-R1-0528能够一次性生成超千行无Bug代码,且在HTML/CSS/JS动态交互实现(如天气卡片动画、数据可视化)中更加精准。另外,在模拟物理碰撞的编程任务中,其表现优于一些其他模型。它还能用Python编写将Word文档中的图片提取到固定路径的小程序,在短时间内完成任务。

在复杂推理任务中,DeepSeek-R1-0528的表现也有显著提升。在AIME 2025测试中,新版模型的准确率从旧版的70%提升至87.5%。这一提升得益于模型在解题过程中进行了更为详尽和深入的思考,旧版模型平均每题使用12K tokens,而新版模型平均每题使用23K tokens。此外,它还能正确回答“9.9-9.11=?”这类难倒其他顶流大模型的数字新难题。

在创意写作能力上,DeepSeek-R1-0528输出的文本更加自然,结构更有层次感,展现出了独特的推理风格,不仅速度很快,而且进行了充分的思考。在旧版R1的基础上,DeepSeek-R1-0528针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。

在其他能力方面,如幻觉改善,DeepSeek-R1-0528针对幻觉问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45~50%左右,能够有效地提供更为准确、可靠的结果。

此外,DeepSeek-R1-0528还支持工具调用功能,尽管不支持在thinking中进行工具调用,但在Tau-Bench测评中表现良好,与OpenAI o1-high相当。API方面,DeepSeek-R1-0528已同步更新,接口与调用方式保持不变,但增加了Function Calling和JsonOutput的支持。

目前,百度智能云千帆大模型平台正式上架了DeepSeek最新的R1-0528大模型。千帆模型开发平台同步支持DeepSeek-R1最新版的批量推理、模型评估、推理日志挖掘分析以及模型蒸馏功能,全流程工具链支持企业构建自己的专属大模型;千帆应用开发平台上的企业级RAG、Agent、工作流、百度AI搜索组件等功能也完成对DeepSeek新模型全链路接入,支持企业基于DeepSeek-R1-0528定制专属应用。文小言App也全面接入了DeepSeek最新模型。

腾讯旗下元宝、ima、搜狗输入法、QQ浏览器等多款产品也已接入了DeepSeek R1-0528版本。用户打开元宝(电脑版、网页版可抢先体验)、ima、搜狗输入法(Windows版侧边栏)、QQ浏览器,选择DeepSeek模型R1深度思考,即可免费不限量使用。

全球AI大模型技术能力持续突破

近些年,全球大模型技术能力持续突破,原生多模态大模型成为技术演进的重要方向,通过打通视觉、音频、3D等模态数据,实现端到端输入输出。例如,百度文心大模型4.5系列实现了文本、图像和视频的混合训练,显著提升了多模态理解能力。

基于长思维链的“慢思考”技术成为提升模型逻辑推理能力的关键。例如,OpenAI的o1模型通过强化学习和思维链技术,在STEM领域的推理能力显著增强,并具备自我反思与错误修正能力。

模型参数量呈指数级增长,例如从GPT-2的15亿参数跃升到GPT-4的数千亿参数。同时,训练数据集规模每八个月翻一番,推动了模型性能的持续提升。

目前全球各大模型呈现多元化竞争态势,国内外模型在不同唯独展开激烈竞争。从技术能力上来看,在国外,OpenAI的GPT系列(如GPT-4)通过大规模训练和计算资源,在生成文本和理解语言方面表现出色,具备强大的语言理解和生成能力,在复杂的文本生成和学术研究领域占据优势。Google的Gemini系列结合了Google Brain和DeepMind技术,追求极致的多模态和推理性能,在多模态支持方面具备最全面的能力,如原生支持文本、图像、音频、视频和代码等多种模态输入输出。

在国内,DeepSeek通过创新的算法优化和高效的资源利用,提供了具备竞争力的选择。其DeepSeek-R1模型在推理速度和计算资源消耗方面具有显著优势,在推理能力、编程表现及交互体验方面实现显著突破,在数学、编程与通用逻辑等多个基准测评中取得了国内领先的成绩。百度的文心大模型在自然语言处理、知识图谱构建等方面技术成熟,广泛应用于智能搜索、智能写作、智能客服等领域。商汤科技专注于计算机视觉和深度学习技术,在图像识别、视频分析等方面的技术实力强劲,其大模型在智能安防、智慧城市等领域有广泛应用。

从应用场景上来看,国外GPT-4适用于跨国智库咨询、新药研发分子关系推理等场景。摩根士丹利使用GPT-4.5生成投行报告,分析师效率提升70%。Gemini系列适用于跨境电商客服、全球舆情监控等场景,沃尔玛定制Gemini客服系统,支持50种语言实时翻译。

国内DeepSeek在智能客服、医疗健康等领域具有强大潜力。文心一言深度绑定政企市场,覆盖98%部委合规标准,在国企流程自动化、医疗病历结构化分析等场景有应用,如国家卫健委疫情政策解读报告生成。通义千问在电商场景表现突出,是电商场景霸主,在直播脚本生成、竞品舆情分析准确率超90%,如天猫双11自动生成百万级个性化商品描述。

从生态方面来看,国外OpenAI凭借其强大的语言理解和生成能力,吸引了全球的开发者和企业。Google依托谷歌TPU算力垄断和搜索数据优势,推动Gemini系列的发展。

国内百度汇聚了大量高端人才,平台技术发展全面且快速,文心大模型在内部和外部应用方面双向发力,积累了较多行业应用案例。阿里电商生态加持通义千问,使其与阿里云无缝集成,可一键调用云计算、支付、物流接口。腾讯整合微信、游戏生态,调用微信社交语料,生成“网感”最强内容,在游戏NPC交互方面,实时生成剧情对话,玩家留存率提升25%。

写在最后

可以预见,随着产业链技术的不断成熟,大模型将在更多行业得到广泛应用,推动各行业的智能化发展。随着生成式模型在图像、视频侧的处理能力提升,叠加推理优化带来的降本,AI超级应用有望出现,改变人机交互方式。从市场趋势来看,全球大模型行业市场规模将持续扩大,头部企业将巩固地位,新兴企业将寻求突破。开源社区、合作伙伴和应用开发者将成为生态竞争的关键。完善的生态系统将增强用户粘性,促进技术创新。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论
念珠菌性阴道炎有什么症状 在五行中属什么 甲胎蛋白高是什么原因 嗯呢什么意思 什么杯子喝水最健康
婴儿便秘怎么办什么方法最有效 鼻窦炎的症状是什么 摩尔每升是什么单位 value是什么意思 医院红色手环代表什么
子宫内膜16mm说明什么 梦见吃月饼是什么意思 慈母手中线的下一句是什么 杯子是什么意思 池鱼是什么意思
心律不齐吃什么药 供奉是什么意思 梦见金蛇有什么预兆 做眉毛有什么危害 炎症是什么引起的
尖锐湿疣是什么hcv8jop2ns9r.cn 微信加入黑名单和删除有什么区别youbangsi.com 敏感水体是什么意思zhongyiyatai.com 1988年什么命hcv9jop1ns7r.cn 鲜花又什么又什么hkuteam.com
痛风看什么科hcv9jop1ns0r.cn 狗狗咳嗽吃什么药hcv7jop5ns0r.cn 天空像什么的比喻句hcv8jop6ns4r.cn 会考没过有什么影响0297y7.com 痛风什么症状hcv9jop5ns3r.cn
茉莉花什么时候开花jasonfriends.com 做空是什么意思啊hcv9jop7ns9r.cn 扁桃体发炎吃什么好得快hcv9jop5ns9r.cn 女人梦见掉头发是什么征兆mmeoe.com 吝啬什么意思hcv8jop9ns0r.cn
梦见自己头发白了是什么意思hcv8jop9ns2r.cn 头皮痒挂什么科hcv9jop6ns1r.cn 劳动法什么时候实施的hcv9jop5ns7r.cn 越什么越什么的词语hcv9jop6ns1r.cn 减肥中午吃什么hcv8jop5ns8r.cn
百度