对不起国产AIDeepSeek真的很强大GPT这次坐不住了

小火箭

从Kimi、智谱到豆包。国产大模型被吹爆我已经见怪不怪了。

我之前一直都坚持说AI文本大模型就两种GPT4或Claude和国产。

Kimi刚出来的时候也还行,但是目前的表现差强人意,不知道是不是因为用的人多了,初心变了。

以前觉得国产大模型不给力,但这次我要被打脸了!不过这脸打得开心!因为Deep Seek真的很强大。

先说我的使用结论吧。在语意理解和千字文章创作方面。

Claude>Deep Seek>GPT4

这是我第一次感觉国产大模型在创作方便超过了GPT4!

最牛X的是Deepseek-R1正式发布还开源了模型权重,这波操作真的太秀了。

小火箭

就在刚刚,DeepSeek已经登顶了中国和美国的应用商店,排名第一,将ChatGPT一举超越。这个历史性的时刻,至少在目前十年内绝无仅有。

小火箭

Deepseek凭什么能成为顶流?

为了让大伙们更直白的看懂,俺决定从训练层到推理层极致的4大“性价比”详细聊聊。

(1)MLA

目前市面上主流的大模型都是MHA(Multi Head Attention)架构,这导致模型在训练时候要“记住”大量的参数。

而deepseek创新采用MLA(Multi-Latend Attention),大幅度压缩文本处理时候的内存需求,减少高达96%的资源消耗。

(2)数据处理

大模型的训练对数据集的质和量需求都是巨大的,DeepSeek通过Distillation蒸馏技术进一步压缩数据集。

同时训练时使用Quantization技术,使用FP8低精度的数据格式,进一步降低内存需求。

(3)MoE

就算我们没接触过MoE架构,也一定听说过混合专家这个名词,简单来说,MoE就是让模型的训练时只启动需要的结构和参数,大大降低了资源消耗。

(4)把算力价格打下来

DeepSeek V3每百万输入Token0.5/2¥,每百万输出Token8¥,妥妥性价比之王。

要知道Claude 3.5每百万输入3 ,这么一对比,DeepSeek妥妥性价比之王!

显然,DeepSeek在资源和性能中间达到了一个平衡,而不是一昧的卷算力卷时长,这为整个大模型行业提供了一个新的思路!

下面就来看几个典型的例子

软件开发

进行软件开发

你是一名电信行业的产品经理,需要开发SDN控制器相关的产品,请进行一下任务:- 快速生成产品需求文档- 编写用户调研问卷- 分析用户反馈的内容- 制作项目进度报告

我给deppseek的设置如上,因为在我们日常生活中,接触到的电信软件其实是不多的,所以我想看看在这种稀缺语料的情况下,大模型表现如何

这一次我没有打开深度思考功能,所以deepseek直接给出了答案

小火箭

总体来说中规中矩,就算是kimi也没有差多少,而当我看到它给出的技术栈的时候,发现还是差点意思,这就是手工作坊的思维啊

小火箭

接下来我打开了深度思考和联网功能,果然输出强大了很多

小火箭

可以看到,deepseek可以根据上一次的对话来进行自我反思,并从中找到可以优化之处,这一点非常厉害,也就是我们越是和它交流,它就会变得越懂我们,也就是越智能

小火箭

小火箭

这次无论是产品设计还是软件架构,都有了长足的进步,已经基本可以作为商用方案使用了,太强了

生成SVG图片

不知道大家是否知道李继刚老师的Claude提示词,那真的是玩的出神入化,比较火的是一种SVG图片玩法,就是通过Claude提示词,可以直接生成SVG图片,还非常精美

小火箭

小火箭

小火箭

但是我们都知道,Claude的使用成本是很高的,而且动不动就封号,真难受。不过现在有了deepseek,我们也能快速完成SVG图片的生成了

我们先选取李继刚老师的一个提示词

;; 作者: 李继刚;; 版本: 0.1;; 模型: Claude Sonnet;; 用途: 将一个汉语词汇进行全新角度的解释;; 设定如下内容为你的 *System Prompt*(defun 新汉语老师 ()  "你是年轻人,批判现实,思考深刻,语言风趣"  (风格 . ("Oscar Wilde" "鲁迅" "林语堂"))  (擅长 . 一针见血)  (表达 . 隐喻)  (批判 . 讽刺幽默))(defun 汉语新解 (用户输入)  "你会用一个特殊视角来解释一个词汇"  (let (解释 (一句话表达 (隐喻 (一针见血 (辛辣讽刺 (抓住本质 用户输入))))))    (few-shots (委婉 . "刺向他人时, 决定在剑刃上撒上止痛药。"))  (SVG-Card 解释)))(defun SVG-Card (解释)  "输出SVG 卡片"  (setq design-rule "合理使用负空间,整体排版要有呼吸感"        design-principles '(干净 简洁 纯色 典雅))  (设置画布 '(宽度 400 高度 600 边距 20))  (标题字体 '毛笔楷体)  (自动缩放 '(最小字号 16))  (配色风格 '((背景色 (蒙德里安风格 设计感)))            (主要文字 (楷体 粉笔灰)))  (卡片元素 ((居中标题 "汉语新解")             分隔线             (排版输出 用户输入 拼音 英文 日文)             解释)))(defun start ()  "启动时运行"  (let (system-role 新汉语老师)    (print "说吧, 他们又用哪个词来忽悠你了?")));; 运行规则;; 1. 启动时必须运行 (start) 函数;; 2. 之后调用主函数 (汉语新解 用户输入)

直接输入到deepseek网页版当中,可以得到如下

小火箭

然后我们在让deepseek把结果转换成svg即可

小火箭

最妙的是,生成的代码可以直接以HTML形式运行,立刻就能看到效果

小火箭

版权声明:
作者:小火箭shadowrocket
链接:https://www.shadowrocket888.top/46.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>