跳到主要内容

AI 时代,应该如何学习?

· 阅读需 4 分钟

2026 年, AI 的发展趋势已势不可挡了. 我们能做到只能顺应趋势, 积极拥抱 AI, 学会如何去驾驭 AI.

对于只是把 AI 当作一个搜索引擎的我来说, 还是有很多需要学习的内容.

要选择 AI 容易理解和操作的技术栈。

设计 AI 产品的时候要以 AI 为中心。 现在的流程都是为人设计的,如果让 AI 模仿人的操作,做出来的东西就会很割裂。

看不懂的名词

这里连的每一个名词都可以单独出一篇文章.

Agent 分为 2 类

  1. 软件工程类 Agent (本质是流程驱动的软件开发,LLM 作为数据处理的后端)
    • Dify
    • Coze
    • n9n
  2. AI 原生 Agent(真正以 AI 驱动的 Agent)

Agent

Agent 的定义:在人工智能领域,智能体被定义为任何能够通过传感器(Sensors)感知其所处环境(Environment),并自主地通过执行器(Actuators)采取行动(Action)以达成特定目标的实体。

  • Environment: Agent 所处的外部世界
  • Actuators: 可以是物理设备或代码(函数,脚本等)

AI Agent 是为了实现某个目标循环调用工具的大语言模型。

开发 AI Agent 挑战?

  1. prompt 工程
  2. 自我修复,要能够自动检测并修复生成代码中的错误。
  3. 上下文:无法全部方法放入 context。

(2026.1.9) 在生生产环境中, 68% 的 Agent 被限制在 10 步以内.

使用的方式:结构化控制流: 任务流程都是人画好的, AI 只能在这里面填空.

Skill

Skill 提出的意义: 简化模型对工具使用上下文处理的困难程度,让它更好的执行任务拆分、检验的工作。

BTAS Budget-Aware Test-time Scaling 预算感知测试时缩放

  1. 预算感知规划
    1. 维护一个树状的 checklist, 每个节点表示一个任务, 包含状态和资源消耗信息。
    2. Agent 不是一次性列出所有步骤,而是动态更新的。
      1. 新的信息可能会创建新的分支,解决待定步骤,废弃无效路径。
      2. 预算足够时扩大搜索深度,预算紧张时深挖验证深度.
  2. 预算感知验证

Agent 目前的困境

目前的问题是需要给上下文减负。(沟通噪音和认知负担消耗了大量的上下文)

  1. 有效工具管理(如 skill 机制)
  2. 内建自我验证能力(如 BATS)
  3. 模型间高效沟通协议(A2A 协议), 未来肯定是会同时执行多个任务的(agent 与 Agent 之间需要沟通)。
    1. Claude Code 采用的是多 Agent 模式,主 Agent 负责与用户交互,并调度子 Agent 来完成特定子任务。