北大出手!解锁DeepSeek潜力,看这些就够了

2025-02-26 20:58:08

  前几周分享来自清华的五部 DeepSeek 攻略之后,可能有的家友对什么是 DeepSeek?它有什么用?仍感到一头雾水。

  就让我们回归基础,从大语言模型的基础流程、能力边界与适用场景看起。

  对了,这次给大家分享的PDF 下载,是

  第一份秘籍我们常听到的 GPT 一词,其实就是生成式预训练变换器的简写。

  其基本工作流程是:

  收到提示词

  将输入拆分为 token

  利用 Transformer 架构处理 token

  基于上下文

  根据概率分数选择 token

  看到上面的工作流程后,我们面对大模型“吐”出的结果时,也就不会感到奇怪了。

  其优势在于,具有语言理解和生成能力、世界知识能力,以及一定的推理能力。

  相对应而言,其劣势便在于 AI 幻觉、有限的知识库及上下文窗口限制。

  了解完原理,我们也就能让这些聊天机器人更好地为我所用。

  我们在使用这些 AI 大模型工具的时候,需要注意其能力边界的限制。

  比如,GPT-3.5 与 GPT-4 的当需要连续处理长篇幅的文本时,我们就需要使用在文本分析领域,它更擅长文本统计、摘要生成、分类与总结,而面对同样,它的文本润色能力,也体现在错别字识别与修改、语法错误检查与修正、标点符号调整、词汇选择优化、保持写作风格等方面。

  在面对

  了解完一些基础之后,我们对于大模型能干什么,会有更加深入的理解。

  目前面向普通用户开放商用的 AIGC 工具,主要有以下几个方向:

  图像生成工具

  音频工具

  生成工具

  工具

  就以目前火热的聊天机器人来看,DeepSeek-R1 的主要优势还在于而豆包则拥有更出众的多模态能力,其语音情感交互能力更适合日常休闲对话。

  比如当我们想要制作 PPT 时,就可以由于 AI行业日新月异的发展,上面的列表随时都可能发生变化,我们也需要根据自己的需求和目标,

  来自北大的第二篇秘籍作为一款 CoT 思维链模型,我们可能需要放弃传统的提示词习惯,可以直接“把 AI 当人看”:

  此外,我们还可以学会这份文档中还给出了市场营销、公文写作、编程开发、数据分析、会议纪要、学术研究等多领域的的用法示例,等待大家去发现。

下一篇:消息称华为畅享 70X+ 手机 3 月发布,前摄像素提
上一篇:任天堂 Switch 维修项目宣布在日本涨价,3 月 26
返回顶部小火箭