当前位置:首页 > 技术文章 > 正文内容

暴击GPT-4.5,DeepSeek-V3-0324官方报告出炉,系统提示、最佳温度全放出

arlanguage1个月前 (03-31)技术文章18

只有660B参数的开源模型,在数学和编程性能上击败了GPT-4.5和Claude 3.7。DeepSeek-V3-0324新版本的发布让全球网友为之疯狂,推理能力提升近20%,模型权重已全面开源!

DeepSeek-V3-0324新版本发布,推理能力大幅提升,在数学、代码上超过GPT-4.5!

网友表示,这是OpenAI的噩梦,模型参数量只有660B,100%开源。

进入官网、APP或小程序后,关闭深度思考即可体验。官方建议,非复杂推理任务用V3新版本更好。

模型权重现已开源:
https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

性能全面提升,中文能力更强

DeepSeek-V3-0324全面超越了Claude 3.7!

新版模型借鉴DeepSeek-R1中的强化学习技术,在数学、代码类评测集上超过了GPT-4.5。

推理能力方面,DeepSeek-V3-0324相较于第一代V3,基准测试的准确率最高提升了近20%:

  • MMLU-Pro:75.9 → 81.2 (+5.3)
  • GPQA:59.1 → 68.4 (+9.3)
  • AIME:39.6 → 59.4 (+19.8)
  • LiveCodeBench:39.2 → 49.2 (+10.0)

在HTML等前端开发任务上,DeepSeek-V3-0324生成的代码可用性更高,视觉上也更有设计感:

  • 提升了代码的执行效率
  • 网页和游戏前端界面更美观

多个小球在指定空间范围内运动的p5.js程序:包含若干可以调整重力、摩擦力等参数的滑动按钮,并以赛博朋克风格的HTML呈现

中文写作任务上,DeepSeek-V3-0324基于R1进行了优化,提升了中长篇文本的创作风格和内容质量:

  • 符合R1写作规范
  • 提高了中长篇写作的质量
  • 改进了多轮交互式内容重写
  • 优化了翻译质量和信函写作

中文搜索场景下,DeepSeek-V3-0324提升了对报告的分析能力,输出内容更详实、准确,排版更清晰美观:

  • 增强了报告分析请求功能,提供更详细的输出结果

除此之外,DeepSeek-V3-0324还提高了API函数调用的准确性,修复了之前V3版本中的问题。

国外网友已玩嗨

网友「Haider」表示,新的DeepSeek V3更新比预期要大得多,尤其是编程,赞其为目前最强大的完全免费的AI。

他用新模型构建的「声波可视化器」游戏如下,结果好得难以置信。

@BrainYoung利用DeepSeek-V3-0324的巨大改进制作了以下游戏:

制作一个酷炫的three.js游戏。

官方使用指南

系统提示

在官方网页/应用中,DeepSeek使用带有特定日期的统一系统提示词。

  • 该助手为DeepSeek Chat,由深度求索公司创造。
  • 今天是{current date}。

例如:

  • 该助手为DeepSeek Chat,由深度求索公司创造。
  • 今天是3月24日,星期一。

采样温度

在网页和应用环境中,模型温度参数T_model设置为0.3。

由于许多用户在API调用中会使用默认温度1.0,为此,DeepSeek贴心地设置了一个API温度T_api映射机制——可以自动将输入的API温度1.0调整为模型最优温度0.3。

换句话说,如果是通过API调用V3,那么温度1.0就等同于温度0.3。

本地运行

DeepSeek-V3-0324的模型结构与DeepSeek-V3完全相同,支持函数调用、JSON输出和FIM(填充中间)完成等功能。

参考资料:

https://mp.weixin.qq.com/s/XK6ymJL7y0vo_GQXxmpuBA

https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

https://x.com/deepseek_ai/status/1904526863604883661

本文来自微信公众号“新智元”,作者:英智 好困 ,36氪经授权发布。

扫描二维码推送至手机访问。

版权声明:本文由AR编程网发布,如需转载请注明出处。

本文链接:http://www.arlanguage.com/post/3749.html

分享给朋友:

“暴击GPT-4.5,DeepSeek-V3-0324官方报告出炉,系统提示、最佳温度全放出” 的相关文章

一文说清nginx规则匹配(含案例分析)

概述: 在nginx中,匹配分很多情形,例如:区分大小写匹配、不区分大小写匹配、有强匹配开头、有模糊匹配某些字符、有匹配后重写动作、有匹配反向代理动作、有匹配后终止操作、还有匹配全局变量类型等等,在很多情形中,匹配动作也存在优先策略,来看看下面的案例。案例一、 server { .............

技巧:PHP版本怎样隐藏在Linux服务器

通常情况下,大多数安装web服务器软件的默认设置存在信息泄露,这些软件其中之一就是PHP。PHP是如今最流行的服务端html嵌入式语言之一。而在如今这个充满挑战的时代,有许多黑客会尝试发现你服务端的漏洞。因此,ehowstuff网站一篇简单描述如何在Linux服务器中隐藏PHP信息值得关注。(图片来...

服务器排障nginx 499 错误地解决

问题描述:近期平台对外开放了数据查询接口,在数据量特别大时,返回结果时间可能会超过3秒,接口开放后,系统本身调用没有问题,其他第三方平台接入时,总会报链接超时问题;问题原因:查看tomcat日志无任何错误,一开始以为是tomcat接收参数最大限制问题,对tomcat做了一次整体优化,修改连接数、修改...

网站加载慢?让你的网站腾飞起来,LiteSpeed部署

说起LiteSpeed 还得说起我的小站,<开心洋葱网>,虽然流量不大,但是访问是真的慢,无奈经费有限,那就只能在服务器加速上动起心思来。之前一直听说 QUIC 访问网站的速度会让你感觉飞起来,那就搞下吧。我们先来看下 QUIC 、LiteSpeed都是些做什么的?QUIC(Quick...

nginx+spring boot 微服务实现负载均衡

环境准备项目 JDK1.8 以上版本准备好 nginx 环境nginx 配置nginx 的配置文件在/usr/local/nginx/conf 目录下,配置文件 nginx.conf配置信息如下:upstream web_app { server 192.168.226.150:8089 ma...

Nuxt.js从0到1之入门教程

题外话:近来想把网站做下更新,从框架到内容的更新,但又不想放弃SEO的优势,日常工作用到vue.js在SEO方面劣势较多,果断选择了Nuxt.js,苦于国内文章抄袭的非常严重 如某n 某书,最终在稀土找到一篇像样的文章,以头条为平台记录网站改版全过程。此文章建议在PC端查看,涉及到代码部分,移动端查...