532 词
常用指令记录 起因是发现,现在记忆力越来越不得行了,有些工具没有用到就会慢慢忘记指令,再去相应搜索实在不方便。因此在这里进存档,方便自己查阅。 Git git clone [仓库链接] git add [被修改的文件] (. 表示所有的) git commit git push git status:查看状态,可以看到是否有修改 git log:查看日志(恢复时需要用到) .gitignore:在根目录下创建,对于需要忽视不追踪的文件名,写入 复原 删除的文件:git checkout [文件名.txt] 修改文件(没有add过):git checkout [文件名.txt] 修改且add / commit:git checkout [commitid] [文件名.txt] 分支 git init -b [分支名] git branch:查看分支 git branch [新分支名]:仅用于创建分支,但不会切换到新分支 git branch -m [旧分支名] [新分支名] git branch -d(已修改未合并)/ -D(强制删除)[新分支名] git chec...
4.2k 词
Agent智能体安全 Agent 具备行动、长效记忆、多源外部输入三大特性,风险从文本误导升级为实体业务破坏 原理 受威胁 密钥凭证 私有敏感数据 资金预算 生产系统运维权限 五层攻击面 Prompt 指令层(直接提示注入) RAG / 记忆层(内容投毒、向量检索漏洞) Tool 工具调用层(恶意参数、高危工具诱导调用) 运行环境层(沙箱逃逸、供应链污染) 人机流程层(社工、审批疏漏、权限配置失误) 五步攻击链 外部内容 / 用户输入注入→污染记忆与向量库→诱导高危工具越权执行→依托凭证横向渗透多系统→数据外泄 / 资金损耗 / 生产故障 OWASP 6 类高频风险,覆盖注入、信息泄露、不当输出、过度自主、向量缺陷、资源无节制消耗,是 Agent 安全管控基准清单 防护 工具调用安全:最小权限 + 分级授权 提示注入防护(直接 + 间接) 记忆 & RAG 专项防护(防范记忆投毒、向量漏洞) 资源管控: 预算:设置token 循环限制:限制重试次数 熔断机制:全自动→人工确认→只读→任务暂停熔断 沙箱与密钥管控: 高危工具代码执行置于隔离沙...
6.5k 词
GUI Agent 原理 GUI 智能体(GUI Agent),简单说就是能看懂电脑 / 手机屏幕、听懂人话、自动操作软件干活的 AI,附带配套的工具调用技术。 一、什么是 GUI Agent 以前 AI 只能打字聊天,GUI Agent 突破限制:用户发一句自然指令,AI 自己看懂界面、点按钮、开软件、跨系统完成整套操作,解决人工重复干活、步骤繁琐、各软件数据不通三大麻烦。 靠OmniParser 视觉技术,AI 能截图识别页面按钮、文字、图标,大幅提升界面操作准确率。 二、核心运行原理:ReAct 思考 + 行动模式 模仿人做事逻辑:先动脑想步骤(Thought)→下达操作指令(Action)→看执行结果(Observation),循环往复做任务。 Function Calling:简单单步任务(查天气、调接口),直接调用固定工具接口,速度快; ReAct:多步骤复杂任务(订外卖、退电商货物),边走边根据结果改方案,两者经常搭配使用。 整套执行分五步:用户发需求→AI 思考→调用工具 / 操作界面→接收结果反馈→做完就结束,没做完继续循环。 三、三种落地...
3.1k 词
RAG检索增强生成 是将信息检索与文本生成深度融合的架构 原理 稀疏检索:关键词匹配与词频统计 稠密检索:词义嵌入向量的相似度匹配 嵌入编码:文本转为低维稠密向量 索引构建:存入向量数据库 相似度检索:余弦相似度,召回Top_k 编码融合生成:问题与检索文档一同输入编码器 Prompt拼接生成:将检索片段拼接在用户问题Prompt中 整体架构 挑战 检索准确性问题 稀疏+稠密混合检索 重排序模块 查询扩展与改写 多文档融合难度 系统效率瓶颈 知识时效性与更新 可信度与可追溯性 生成、校验 多源验证、置信度评分 代码 导包 1234import numpy as np, torchfrom sklearn.feature_extraction.text import TfidfVectorizerfrom sklearn.metrics.pairwise import cosine_similarityfrom transformers import AutoTokenizer, AutoModelForSeq2SeqLM 构建知识库 ...
6.2k 词
MoE混合专家模型 用于解决参数规模与计算成本的矛盾: Dense(传统模型):参数变大,计算量线性增长 Sparse(MoE模型):参数量巨大,每次推理只激活其中一小部分 原理 一、MoE 是什么 稀疏激活大模型:总参数极大,但每个 token 只激活Top‑k 个专家,计算量不随参数暴涨。 普通 Dense:参数↑→计算 / 显存 / 带宽全↑ MoE:参数↑→每 token 计算可控 二、结构与位置 只替换FFN/MLP,Attention 保持 Dense 专家 = 独立 FFN 模块 现代 MoE 三件套: 共享专家:所有 token 必走,稳通用能力 路由专家:按 token 选 Top‑k,做专业化 细粒度专家:多而小,分工更细 三、路由 Router(怎么选专家) 给 token 打专家分数 Softmax 转概率 选Top‑k 选中专家权重重归一化 输出加权合并 Top‑1 vs Top‑2 Top‑1:省计算 / 通信,训练易不稳 Top‑2:更稳、防塌缩,成本更高 经验:训练 Top‑2,推理 Top‑1 四、系统核心:...
4.6k 词
量化、蒸馏、部署 原理 量化 从高精度****浮点(FP16/BF16/FP32)转换为更低比特的表示(INT8、INT4等),刻度变少,降低显存内存占用。会导致一定精度下降。 量化权重:模型参数权重进行压缩 量化激活:推理时各层产生的中间激活也转换为低比特 KV缓存:注意力机制中的Key/Value缓存用低比特存储,避免每生成一个新 token 都重复计算之前的注意力信息 PTQ 训练完成后再把权重/激活从浮点转换为低比特,不再训练或只做少量校准 QAT 在训练/微调阶段把量化误差加入前向,让模型在训练中适应低比特噪声 蒸馏 logits蒸馏:匹配输出概率分布,学习概率分配方式 特征蒸馏:中间层 任务蒸馏:把教师当作“数据生成器/标注器”,生成高质量训练数据,训练学生进行SFT 训练要素 温度 损失 蒸馏损失 监督损失 权重 部署 训练框架(PyTorch)完成训练与验证 到处为更合适的形式(ONNX) 推理引擎在目标硬件(GPU/CPU/NPU)高效执行 NPU:低功耗下提供高推理效率,适合移动端与嵌入式 算子融合:将操作合并到一次...
未分类
297 词
2605 总结 五月主要在学习大模型知识,中间也穿插着举办活动和到处逛了逛,总体很充实。 改进 可能是重心可以转一下 计划 这几天给LLM收个尾,把重心转移后端的八股和刷lc学习 开始清理宿舍的东西,寄回家,做好随时回家的准备 存疑 也不算存疑,只是我个人的一个想法。 原本是想找实习的,但是感觉以我目前的储备,还有本科bg可能不太合适。学校这里又暂时不能走,两头跑不了。还有食宿费用,我还得等国家赈灾拨款下来哈哈哈。等一切结束,可能也没剩几个月实习了,就先不想了。 打算先为后面打下一些根基,让大一的时光可以更多从容些,早点去 实习/做RA 看看。希望这个选择没错吧。不过,选择也没有对错之分,之后不合适再修正就好啦。
12k 词
多模态大模型 “视觉编码器对齐到 LLM”的完整流程跑通,并做 ablation(有图 vs 无图)对比 原理 多模态:将其他信号通过模态对齐映射为 tokens,实现 Any-to-Any 发展历程 CLIP:跨模态对比学习,图像-文本对训练,映射,建立联系 BLIP-2 & LLaVA:翻译,预训练好的LLM,通过Q - Forme r(BLIP-2) 或 线性投影层 (LLaVA) GPT-4o & Gemini 1.5 pro:端到端全模态融合,训练初期视为同等信号 架构范式 视觉编码器:常用CLIP-ViT 对齐方案: 线性映射(LLaVA):信息完整,token多,速度慢 1)输入形态:视觉编码器(常见是 CLIP-ViT)把图像切成 patch,输出一串向量 2)投影(Projector):用一个线性层或两层 MLP 把每个 vi 映射到LLM 的维度di 3)拼接进 LLM:把视觉向量当作一段前缀 token,与文本 token 拼在一起 查询提取(BLIP-2, InstructBLIP):抓重点,压缩token,加速,但丢...
4.1k 词
代码生成大模型 原理 任务: 生成代码 代码自动补齐 代码翻译与重构 要求: 语法严格 语义精确 代码大模型:在海量开源代码库(Github等)进行预训练或微调的大型语言模型(Codex和AlphaCode) 发展历史: 预设规则 补全功能 编写转向描述 评估体系: HumanEval pass@k 挑战: 正确性 语法错误 逻辑错误 可靠性 输出不稳定 逻辑不一致 性能波动 安全性 生成漏洞代码 泄露敏感信息 泛化能力 代码 导包 123import ast, builtins, math, re, tracebackimport numpy as np, torchfrom transformers import AutoTokenizer, AutoModelForCausalLM 模型选择 bigcode/tiny_starcoder_py 123AutoTokenizertok.pad_token=tok.eos_tokenAutoModelForCausalLM 数据集构造 name:任务名字 inst:任务说明...
5.7k 词
复杂推理(思维链) 原理 进阶推理 CoT作为草稿提供中间步骤 + 验证机制进行审计 步骤变长后,误差可能累积 事后编造 对提示敏感 为推理:看起来合理但实际不对 token/时延成本增加 结构化CoT A:Plan-and-Solve:列计划再逐步执行,减少跳步。 B:Least-to-Most:先解最简单子问题,逐步递进。先从确定性最强的子问题出发,逐步收缩推理空间,适合多约束任务。 ToT与多路径探索 相当于优化问题:多分支推理 + 分步评估 + 回溯选择 同一个问题同时探索多个候选思路(分支),每走几步就评估质量,不行就剪枝/回溯,再探索别的分支 工具调用 / ReAct思路 推理 - 行动(调用实际工具)- 更新修正 Prompt自动化 数学推理 PoT 把不擅长的环节交给擅长的工具:求 LLM在遇到需要精确计算的任务时,先生成一段可执行的程序(通常是 Python 代码或计算表达式),然后把计算交给解释器/计算器执行,再把执行结果组织成最终答案。 语义理解错误 代码生成错误 解决 强制分两段输出:可执行代码+最终答案 PRM 过程监督...