北大出手！解锁DeepSeek潜力，看这些就够了

2025-02-26 20:58:08

　　前几周分享来自清华的五部 DeepSeek 攻略之后，可能有的家友对什么是 DeepSeek？它有什么用？仍感到一头雾水。

　　就让我们回归基础，从大语言模型的基础流程、能力边界与适用场景看起。

　　对了，这次给大家分享的PDF 下载，是

　　第一份秘籍我们常听到的 GPT 一词，其实就是生成式预训练变换器的简写。

　　其基本工作流程是：

　　收到提示词

　　将输入拆分为 token

　　利用 Transformer 架构处理 token

　　基于上下文

　　根据概率分数选择 token

　　看到上面的工作流程后，我们面对大模型“吐”出的结果时，也就不会感到奇怪了。

　　其优势在于，具有语言理解和生成能力、世界知识能力，以及一定的推理能力。

　　相对应而言，其劣势便在于 AI 幻觉、有限的知识库及上下文窗口限制。

　　了解完原理，我们也就能让这些聊天机器人更好地为我所用。

　　我们在使用这些 AI 大模型工具的时候，需要注意其能力边界的限制。

　　比如，GPT-3.5 与 GPT-4 的当需要连续处理长篇幅的文本时，我们就需要使用在文本分析领域，它更擅长文本统计、摘要生成、分类与总结，而面对同样，它的文本润色能力，也体现在错别字识别与修改、语法错误检查与修正、标点符号调整、词汇选择优化、保持写作风格等方面。

　　在面对

　　了解完一些基础之后，我们对于大模型能干什么，会有更加深入的理解。

　　目前面向普通用户开放商用的 AIGC 工具，主要有以下几个方向：

　　图像生成工具

　　音频工具

　　生成工具

　　工具

　　就以目前火热的聊天机器人来看，DeepSeek-R1 的主要优势还在于而豆包则拥有更出众的多模态能力，其语音情感交互能力更适合日常休闲对话。

　　比如当我们想要制作 PPT 时，就可以由于 AI行业日新月异的发展，上面的列表随时都可能发生变化，我们也需要根据自己的需求和目标，

　　来自北大的第二篇秘籍作为一款 CoT 思维链模型，我们可能需要放弃传统的提示词习惯，可以直接“把 AI 当人看”：

　　此外，我们还可以学会这份文档中还给出了市场营销、公文写作、编程开发、数据分析、会议纪要、学术研究等多领域的的用法示例，等待大家去发现。