七月小站 - 路漫漫其修远兮，吾将上下而求索

发表于2026-04-22|AI|AI•入门•YOLO•计算机视觉•目标检测

前言YOLO（You Only Look Once）是目标检测领域最知名的模型系列。它能在一张图中同时检测出多个物体——人、车、猫、杯子——标出位置并给出类别名称。这篇文章的目标是让你半小时内从零到跑通第一个 YOLO 检测程序。一、YOLO 是什么YOLO 的核心思想很简单：只看一次。传统检测方法需要对图片反复扫描（滑动窗口），YOLO 把整张图一次性输入神经网络，直接输出”哪个位置有什么物体，置信度多高”。版本演进版本年份关键变化 YOLOv5 2020 第一个工程化完善的版本，部署友好 YOLOv8 2023 Ultralytics 出品，支持检测/分割/分类/姿态估计/跟踪多任务 YOLOv9 2024 引入 PGI 和 GELAN，精度提升明显 YOLOv10 2024 清华团队出品，NMS-free，推理更快 YOLOv11 2024 当前最新，精度和速度的最佳平衡 YOLOv12 2025 引入注意力机制，小目标检测更好新手推荐直接用 YOLOv8 或 YOLOv11，Ultr...

GB28181 协议解析与国标安防视频监控系统接入

发表于2026-04-09|物联网|GB28181•安防视频•流媒体•SIP•物联网

前言在中国的安防视频监控和智慧城市建设中， GB/T 28181 协议（全称《安全防范视频监控联网系统信息传输、交换、控制技术要求》）是唯一的统治级国家标准。无论是小区的监控摄像头，还是交警的违章抓拍系统，亦或是各级公安机关的“雪亮工程”视频平台，要实现跨厂家、跨区域的视频互联互通，都必须遵循 GB/T 28181 标准。对于开发人员来说，GB/T 28181 几乎是国内“最难啃”的视频物联网标准之一。它融合了电信级信令协议 SIP（会话发起协议），并对多媒体流强制采用了特化的 MPEG-PS（节目流）封装。本文将从 GB/T 28181 的体系架构出发，以手把手的方式，深入底层报文和字节结构，并结合目前业界最火的主流开源框架，为你奉献一份全方位的国标接入与排错指南。一、GB/T 28181 演进与两层分离架构1. 国标版本的演进史GB/T 28181 从诞生至今经历了几次重大修订： 2011 版 (GB/T 28181-2011) ：奠定基石，确立了 SIP 协议控制面 + RTP/...

JT1078 车载视频监控与多媒体传输协议解析

发表于2026-04-01|物联网|流媒体•物联网•JT1078•车联网

前言随着两客一危（旅游客运、包车客运、三类以上班线客运和危险货物运输）安全监管力度的不断加大，单纯的位置汇报（JT/T 808 协议）已经无法满足行业监管和企业主动安全防范（如 ADAS 驾驶辅助、DSM 疲劳驾驶监测）的需求。如何在定位车辆的同时，实时调取车载摄像头画面、进行历史视频回放以及下发语音对讲？为此，交通运输部推出了 JT/T 1078 协议（全称《道路运输车辆卫星定位系统视频通信协议》）。它是 JT/T 808 协议的音视频扩展版。对于车联网开发者来说，JT/T 1078 引入了全新的流媒体处理架构，比 808 协议更为复杂。本文将为你全面剖析 JT/T 1078 的双链架构、控制信令、1078 特化的 RTP 报文结构，以及如何从零设计一个高性能的 1078 流媒体分发网关。一、JT/T 1078 的“信令+媒体”双链架构JT/T 1078 并不能脱离 JT/T 808 独立运行。它的核心思想是：“信令走 808 链路，媒体流走独立 1078 链路”。 123456789101...

JT808 车载终端通信协议解析与应用实践

发表于2026-03-24|物联网|物联网•车联网•JT808•通信协议

前言在车联网与两客一危（旅游客运、班线客运、危险品运输）监管领域，JT/T 808 协议（全称《道路运输车辆卫星定位系统终端通讯协议及数据格式》）是绝对的行业基石。无论是公交车、出租车、网约车，还是重型货车，其车载定位终端（GPS/北斗定位仪）与省级/部级监管平台之间的所有数据交互，几乎都遵循这一标准。作为物联网或车联网方向的开发者，深入理解 JT/T 808 协议的设计理念、数据结构及编解码细节，是开发高性能车辆监控系统的必备技能。本文将从协议基础、帧结构、核心业务交互以及实战开发编解码四个方面，带你彻底攻克 JT/T 808 协议。一、协议背景与通信基础1. 协议定位JT/T 808 是交通运输部发布的推荐性行业标准。主要解决了不同厂商的车载终端如何接入统一的监控平台，并向平台上报位置、速度、报警状态等实时数据，同时接收平台的下发指令（如拍照、参数设置、单向监听等）。 2. 通信方式网络层/传输层：协议支持 TCP 和 UDP 传输，在实际生产环境中，由于定位数据和报警数据的可靠性要求，绝大多数采用...

在具体业务项目中设计与落地 AI Agent 架构

发表于2026-03-16|AI|AI•Agent•ReAct•Python•系统架构•自主智能体

前言：从“拧螺丝的工人”到“全能外包项目经理”大语言模型（LLM）的发展经历了一次明显的范式转变：从“单次问答（Prompt Engineering）”，到“工具调用（Tool Calling）”，再到如今万众瞩目的“自主智能体（Autonomous Agent）”。为了彻底搞清楚这三者的本质差别，让我们把开发场景比喻成一个工地的施工作业：单次问答阶段（听天由命的参谋）：你问他：“墙上螺丝松了怎么办？”他会给你长篇大论列出 10 种拧螺丝的方法。但是他没有手，无法帮你拧，一切还是需要你亲自操刀。工具调用阶段（按一下动一下的螺丝工）：大模型被装上了一只机械臂（Tool Calling 接口）。你对他说：“用 3 号螺丝刀，把那颗松了的螺丝拧紧（Action）。”他会抓起螺丝刀拧一下，然后立刻停下来盯着你，等待你输入下一道口令。如果你不发令，他就永远静止。自主智能体阶段（全能外包项目经理）：你甚至不需要提“螺丝”这两个字。你只需要给他一个宏观的任务总目标：“去把 3 号房间的漏水和设备老化问题彻底修好（Goal）。”这个 Agent 不会马上盲目动手，而是会成为一个极其冷静...

基于 vLLM 与 llama.cpp 的高性能本地大模型推理部署

发表于2026-03-09|AI|AI•vLLM•llama.cpp•推理部署•模型优化

前言Ollama 适合个人使用，但当你要在生产环境提供 API 服务时——高并发、低延迟、高吞吐——就需要专业的推理框架了。目前开源社区主流的两个选择是 vLLM（GPU 推理）和 llama.cpp（CPU/GPU 通用推理）。这篇文章讲清楚它们分别怎么用，以及怎么选。一、vLLM：GPU 高性能推理vLLM 是目前 GPU 推理的事实标准，主打高吞吐、低延迟。核心优势是 PagedAttention 算法——把 KV Cache 像操作系统管理内存那样分页管理，大大减少了显存碎片。安装1pip install vllm 启动 OpenAI 兼容 API123456# 一行命令启动服务vllm serve Qwen/Qwen2.5-7B-Instruct \ --host 0.0.0.0 \ --port 8000 \ --max-model-len 8192 \ --gpu-memory-utilization 0.90 关键参数：参数作用建议 --max-model-len 最大上下文长度根据需求设，越长越吃显存 --g...

利用 Skills 构建高效 AI 辅助开发工作流

发表于2026-02-26|AI|AI•Claude Code•Skills•Cursor•规则文件•工作流

前言：当顶级“外包专家”遇到你的“屎山代码”想象一下，你的团队刚刚通过高薪招募了一位极度聪明的资深软件工程师。他精通几乎所有的现代编程语言，能在几秒钟内理解复杂的算法，并且写代码的速度比常人快上百倍。但是，他有一个致命的弱点：他对你们公司的业务细节、特殊的代码库规范、历史包袱以及部署流程一无所知。如果你直接对他说：“去把我们的商品管理模块的 React 组件重构一下，然后顺便把数据库表更新了，搞完发布到测试环境。” 他可能会写出非常优秀的代码，但极大概率会发生以下灾难：他用了团队早已废弃的第三方状态管理库；他把全局组件的命名空间搞乱了，完全不符合团队的驼峰命名规范；他在修改数据库表时，直接在主库上跑了 DDL 导致锁表，且完全没有准备回滚脚本；部署测试环境时，由于不了解你们的 CI/CD 流程，漏掉了核心的环境变量校验。这正是我们每天调教大模型（LLM）或使用 AI 编程助手（如 Cursor、Claude Code 等）时面临的尴尬现状。AI 的通用能力极强，但它缺乏 “局部约束与企业规范” 。在传统的开发流程中，我们靠什么来约束新员工？答案是 ...

Model Context Protocol (MCP) 开放协议解析与落地实践

发表于2026-02-17|AI|AI•大模型•Claude Code•Cursor•MCP•协议

前言：AI 时代的“万能插座”与 USB 革命在探讨 MCP（Model Context Protocol，模型上下文协议）之前，让我们先回到个人电脑诞生初期的 20 世纪 80 年代。在那个年代，给电脑插上一个外设是所有用户的噩梦。如果你买了一台打印机、一个鼠标或是一个游戏手柄，你必须面对不同厂商各自设计的奇形怪状的物理接口，还要在操作系统中手动安装专属的驱动程序。如果接口不兼容，你甚至需要去买一块专用的扩展卡。这种混乱的局面，直到 USB（Universal Serial Bus，通用串行总线）协议诞生才被彻底终结。USB 定义了统一的物理接口标准和统一的数据传输协议，任何硬件厂商只要遵循 USB 标准，其设备就能插在任何支持 USB 的电脑上即插即用。现在的 AI 应用领域正经历着一模一样的“前 USB 时代”。大语言模型（LLM）能力强大，但它们默认是被困在沙盒里的“信息孤岛”。为了让 AI 能够连接你的代码库、读取数据库、调用 GitHub API 或是浏览网页，开发者们不得不面对极度割裂的局面：针对 OpenAI，你需要按照其 tools 规范写一套 ...

使用 LLaMA-Factory 进行开源大模型 LoRA 微调

发表于2026-02-09|AI|AI•微调•LoRA•LLaMA-Factory•实战

前言前面那篇微调入门讲了概念和决策框架。这篇是纯操作——用 LLaMA-Factory 这个工具，不用写多少代码，就能完成 LoRA 微调。选 LLaMA-Factory 的原因是它把模型加载、数据预处理、训练配置、评估、导出这些步骤全封装好了，支持 Web UI 操作，对新手友好。一、安装123git clone https://github.com/hiyouga/LLaMA-Factory.gitcd LLaMA-Factorypip install -e ".[torch,metrics]" 如果下载慢或者报依赖冲突，创建新的 conda 环境再装： 123conda create -n llama-factory python=3.11 -yconda activate llama-factorypip install -e ".[torch,metrics]" 验证： 1llamafactory-cli version 二、准备数据数据格式（Alpaca 格式）在 data/ 目录下创建 my_data.json：...

基于 Unsloth 降低大模型微调成本的实践

发表于2026-01-31|AI|AI•微调•Unsloth•低成本•Colab

前言Unsloth 是目前最激进的微调加速方案——通过手动优化的 Triton kernel 和一系列工程技巧，把微调速度提升 2-5 倍，显存占用降低 50-80%。最大的卖点是：在 Google Colab 的免费 T4 GPU（16GB 显存）上就能微调 7B 模型。一、安装123pip install unsloth# 安装对应 PyTorch 版本的 unsloth# 它会自动下载适配的 transformers 等依赖如果是 Colab 环境，使用官方一键安装： 12# Colab 安装!pip install unsloth 二、加载模型123456789from unsloth import FastLanguageModelimport torchmodel, tokenizer = FastLanguageModel.from_pretrained( model_name="unsloth/Qwen2.5-7B-Instruct-bnb-4bit", # Unsloth 预量化好的模型 max_seq_lengt...