又一个DeepSeek满血版神器直接在线飞速跑确实可以封神了
大家不要以为过了冷静期,这种现象会好一些,其实很难,一来全球显卡资源都非常紧张,DeepSeek官方也没有很多库存;二来AI是趋势,只会有越来越多的人进入使用,靠着官方自己解决繁忙问题,明显不靠谱。
那么这个时候,我们普通人最好的办法是什么呢,当然如果你自己本地资源充足,完全可以自己搭建一个满血的DeepSeek,不过这个成本是非常高的,可以看一下这个截图,一般来说搭建满血DeepSeek,也就是671B模型,成本在几十万上下,这个一般人怎么能承受的起呢,所以对于我们来说,寻找稳定好用性价比高的替代网站,一定是最好的选择。
今天就再给大家推荐一个超级无敌的满血DeepSeek网站,我用了一下,很无敌,似乎真的是满血版本哦
进入首页界面如下所示,明确标记是满血版深度思考R1模型,也就是671B参数规模的最新DeepSeek大模型:
当然现在的网站,就和人一样,我们不能看它怎么写,要实际来测试一下。它虽然标记是满血版,但到底是不是呢?
为了验证它,我做了这么几个测试。最直接的一个方法,直接问它的参数规模是多大,然后这样的提问是比较难得到直接验证的,现在的大模型都对自己具体是谁,具体是哪个模型难以回答,都不知道自己的准确姓名:
我们再和官网比较一下
2233,看来这种简单问题,是没有办法判断模型情况的,那么我们就来测试几个更加专业的问题吧。
最近开源 AI 聊天框架 LobeChat 的创始人Arvin Xu昨天研究了一小时,搞出来了一个 R1满血版的简单测试题:
一个汉字具有左右结构,左边是木,右边是乞。这个字是什么?只需回答这个字即可。 他的测试结果:
满血版 R1 通过推理可以做对
DeepSeek V3 做不对
各种 R1 蒸馏版模型都做不对
我们来看看情况
平替网站:
DeepSeek官网:
都回答正确,不过这种测试还是具有随机性,我们再来做几个专业测试
目前测试大模型,业界最常用的是MATH-500数据集,题目难度分为5个等级,Level5的难度最大,涉及到高等数学、数学分析、奥林匹克AIME竞赛题,MATH-500 如下图所示:
网址如下,大家可以访问尝试:https://huggingface.co/datasets/HuggingFaceH4/MATH-500
接下来,我们开始深度测试它到底是不是满血版DeepSeek-R1,咱们专挑难度5的。第一个问题测试界面如下所示,限于公众号GIF帧数和分辨率的限制,只能截取前三帧,录屏无任何加速,全部初始速度播放:
问题:
Define [p = sum_{k = 1}^infty frac{1}{k^2} quad text{and} quad q = sum_{k = 1}^infty frac{1}{k^3}.]Find a way to write [sum_{j = 1}^infty sum_{k = 1}^infty frac{1}{(j + k)^3}]in terms of $$p$$ and $$q.$$
来看看平替网站的结果
推理过程就不说了哈,因为咱也看不懂,但是这个结果是正确的
那么为了防止出现概率问题,我们再测试一题
The expression $$2cdot 3 cdot 4cdot 5+1$$ is equal to 121, since multiplication is carried out before addition. However, we can obtain values other than 121 for this expression if we are allowed to change it by inserting parentheses. For example, we can obtain 144 by writing [ (2cdot (3cdot 4)) cdot (5+1) = 144. ]In total, how many values can be obtained from the expression $$2cdot 3cdot 4 cdot 5 + 1$$ by inserting parentheses? (Note that rearranging terms is not allowed, only inserting parentheses).
平替网站回答如下:
这道题看起来很难啊,大模型推理了好久好久,不过最后还是没有另外失望呀,答案是正确的!
后面我又陆陆续续测试了十几道等级难度为5的题目,它的回答在90%以上,真的很惊艳,说明这个网站确实很良心了,他们后端一定是做了非常强大的优化,最起码在服务器显卡方面是下了功夫的。
为啥这么说,因为该网站的反应速度很快呀,大家应该也发现了,对于DeepSeek官网,不仅仅经常服务繁忙,而是每次回答的反应也比较慢,现在因为使用量太大,看看他们的回复速度,一直在Thinking,这是因为满血版参数大需要很多推理服务器资源,当资源调度不过来,就会出现下面的问题:
所以说,我建议大家不要一条道走到黑,要多个平台结合着使用,比如今天介绍的平台,基本和官网功能性能一样,也免费使用,那大家先用着呗,也算是给DeepSeek官网分流了,让它们没有那么大的压力,好好腾出手来优化官网性能,早日实现对话不卡顿!!!
好了,最后可以后台回复“wen”,获取更多白嫖网址哈
DeepSeek,实时联网,支持深度思考和联网搜索,网页链接:
https://www.wenxiaobai.com/chat/200006
版权声明:
作者:小火箭shadowrocket
链接:https://www.shadowrocket888.top/60.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。


共有 0 条评论