logo
Feb 28, 2025 · DeepSeek-V3 / R1 推理系统的优化目标是:更大的吞吐,更低的延迟。 为了实现这两个目标,我们的方案是使用大规模跨节点专
Subreddit for the DeepSeek Coder Language Model
DeepSeek V3.2,可以说是算法同学最想要、最符合直觉的top 2048 token的sparse attention了,然而,经历过这场适配才能知道,背后有多少infra的坑
r/AI_Agents: A place for discussion around the use of AI Agents and related tools such as in Auto-GPT, LangChain, LlamaIndex, BabyAGI, etc Join us on…
Jan 31, 2025 · DeepSeek 是一个开源的先进推理和代码优化大语言模型(LLM),专注于提升复杂任务的处理能力。
Jan 31, 2025 · Deepseek在一些不需要很高精度的模块,使用很低的精度FP8储存数据,极大的降低了训练计算量。 当然即便如此,训练Deepseek的
May 13, 2026 · DeepSeek 推荐的Deepcode 到底怎么样? [图片] DeepSeek 推荐的Agent里,出现了Deep Code这个编程工具,这个编程工具到底怎么样 ? 显示
Feb 13, 2025 · 顺带教大家如何在10分钟内零基础地完全本地化部署DeepSeek-R1模型。 1.为什么要自己部署DeepSeek? 最近DeepSeek非常火爆! 它不
Oct 20, 2025 · DeepSeek: 优势:结构化输出能力强(如分步骤解题、论文大纲生成),支持Markdown代码块和公式排版,适合技术文档撰写。
如何看待DeepSeek在2026.5.29晚限制修改输入次数? 在2026年5月29日17点左右的时候,DeepSeek官网与APP端的修改输入次数与重复生成次数上限都