|
- DeepSeek - 知乎
DeepSeek-V3 R1 推理系统的优化目标是:更大的吞吐,更低的延迟。 为了实现这两个目标,我们的方案是使用大规模跨节点专家并行(Expert Parallelism EP)。
- 为什么用 DeepSeek 总是提示「服务器繁忙」?怎么解决?
为什么用 DeepSeek 总是提示「服务器繁忙」? 怎么解决? 最近使用deepseek时,不知道是不是问问题的方式不对还是服务器不稳定原因,很多问题半天也没有一个回答。 所以deepseek到底该怎么与其交流呢? 显示全部 关注者 666 被浏览
- DeepSeek深度思考和联网搜索有什么区别? - 知乎
DeepSeek为大家提供了:深度思考R1和联网搜索,两个功能强悍的按钮,但,在和知乎网友的交流过程中,我发现有很多人,不知道这两个强悍的工具如何搭配使用。 今天就好好聊聊这个问题。 深度思考模式详解
- 哪些平台的deepseek满血版可以上传pdf等附件,或者本地 . . .
由于我电脑配置不行,这里用的DeepSeek-R1不是满血版。 以上的是我最近用到的一些「DeepSeek- R1」电脑版。 很多接入DeepSeek满血版的APP也都具有导入文件的功能,大同小异罢了。 但是在iPhone上,怎么把从微信或者百度云上下载下来的文件,存放本地,让其他app打开
- 如何评价 DeepSeek 的 DeepSeek-V3 模型? - 知乎
尽管DeepSeek-V3展示了per-tile和per-group量化对于模型收敛的重要性,论文中并没有给出对应的FP8矩阵乘法的算子效率。 另外,论文中缺乏per-token加per-channel量化的讨论,不清楚这种实现上更加友好的量化方法对于训练稳定性的影响会有多大。
- deepseek开始会员收费了吗? - 知乎
deepseek开始会员收费了吗? 现在可以下载电脑客户端了,先跳出来的是deepseek下载助手,然后下载客户端需要先登录手机号然后点下载需要支付68元?
- 如何评价DeepSeek和豆包的回复能力、准确度和学术水平?
DeepSeek: 优势:结构化输出能力强(如分步骤解题、论文大纲生成),支持Markdown代码块和公式排版,适合技术文档撰写。 局限:娱乐性交互相对生硬,对网络流行语的响应较少。 2 准确度 豆包:
- DeepSeek算命准不准?有人算过吗? - 知乎
有时候会准到吓人! 我只向Deepseek输入了起测时间的阳历年月日时,以及与这一时间对应的四柱八字,注意:不是人的八字,而是起测时间的八字。还输入了求测者和被测者的性别以及出生年份的年柱两个字,还有起测所在地的城市名称。没有任何其它信息。也就是说:我给出了起测时的时空状况
|
|
|