七月小站 - 路漫漫其修远兮，吾将上下而求索

发表于2025-11-10|AI|AI•RAG•Ollama•本地部署•Open WebUI

前言Ollama 能让你在本地跑模型，但命令行聊天的体验毕竟有限。Open WebUI 是一个开源的 ChatGPT 风格前端，配合 Ollama 可以实现：和 ChatGPT 几乎一样的聊天界面多模型随时切换对比上传文档建知识库（RAG），让 AI 基于你的文件回答多用户管理（给团队用）对话记录搜索这套组合部署在内网服务器上，就是团队自己的私有 AI 平台。一、前提条件已安装 Ollama 并拉取了至少一个模型已安装 Docker（部署 Open WebUI 用）验证 Ollama 运行中： 1234ollama list# 应该能看到至少一个模型curl http://localhost:11434/api/tags# 返回模型列表 JSON 二、部署 Open WebUI123456docker run -d \ --name open-webui \ --restart unless-stopped \ -p 3000:8080 \ -v open-webui-data:/app/backend/data \ ghcr.io/op...

Ollama 入门：一行命令跑起本地大模型

发表于2025-11-05|AI|AI•大模型•入门•Ollama•本地部署

前言想在自己电脑上跑大模型，但看到”CUDA””量化””显存”这些词就头疼？Ollama 把这个门槛降到了最低——安装、下载模型、开始对话，三步搞定，不需要配置任何环境。它在后台自动处理了模型量化、GPU 加速、内存管理这些脏活累活，对用户来说就是在终端里敲几行命令。一、安装macOS：下载 Ollama.app，拖到 Applications 即可。 Linux： 1curl -fsSL https://ollama.com/install.sh | sh Windows：从 ollama.com/download 下载安装包，双击安装。验证安装： 12ollama --version# ollama version is 0.9.0 二、拉取并运行第一个模型12# 拉取并直接运行（没下载会自动先下载）ollama run llama3.2 下载完成后会直接进入对话模式： 12345678>>> 你好，请做一下自我介绍我是 Llama，由 Meta 开发的 AI 助手……>>> 用 Python 写一个斐波那契函数d...

Flask Web 应用的模块化开发与生产环境部署

发表于2025-11-02|后端开发|后端开发•Flask•Gunicorn•部署

前言Flask 是一个轻量级 Web 框架，但微框架（Micro-framework）不意味着只能写玩具应用。很多开发者在面临中大型项目时，因为缺乏工程化架构规范，导致代码耦合严重、循环导入报错频发。这篇文章以工程实践为主线，讲透 Flask 从模块化分层设计到生产环境高可用部署的完整链路。一、模块化架构设计：工厂模式与蓝图在单文件 Flask 应用中，我们通常直接创建全局 app 并将路由和数据库实例绑定其上。但随着业务扩张，这种做法会引发严重的循环导入（Circular Imports）灾难。例如，数据库模型类需要导入全局 db，而全局 db 的初始化又需要 app，这就形成了死锁。彻底解决这一问题的标准方案是采用工厂模式（Application Factory）配合蓝图（Blueprint）。 1.1 项目目录结构规划一个标准且解耦的 Flask 项目结构应当如下设计： 123456789101112131415my_flask_project/│├── app/│ ├── __init__.py # 应用工厂函数，初始化所有插件...

本地 AI 开发环境搭建：Python、CUDA 与 PyTorch 配置实践

发表于2025-10-25|AI|AI•Python•CUDA•PyTorch•开发环境

前言搞 AI 开发，第一道门槛往往是环境——CUDA 装不上、PyTorch 版本不对、显存不够报 OOM、各种依赖冲突。这篇文章把安装步骤和常见坑一次性说清楚。一、Python 环境管理推荐用 Miniconda 做 Python 版本管理和虚拟环境隔离，比系统 Python 省心很多。安装 Miniconda1234567891011# Linuxwget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.shbash Miniconda3-latest-Linux-x86_64.sh# macOS (Intel)curl -O https://repo.anaconda.com/miniconda/Miniconda3-latest-MacOSX-x86_64.shbash Miniconda3-latest-MacOSX-x86_64.sh# macOS (Apple Silicon)curl -O https://repo.anaconda.com/miniconda/Minic...

使用 DdddOcr 识别常见字符与行为验证码

发表于2025-10-17|开发|Python•OCR•验证码识别•ddddocr•网络爬虫•自动化测试

前言在进行网络爬虫数据采集、自动化测试（如 Selenium/Playwright）或者自动化脚本编写时，验证码（CAPTCHA）往往是开发者面临的第一道、也是最头疼的屏障。传统应对验证码的方案通常有两种：接入第三方付费打码平台：按次收费，不仅产生持续的资金成本，且存在网络延迟和接口失效风险。自己训练深度学习模型（CNN+CTC）：需要采集数万张标注样本，配置 PyTorch 环境进行繁琐的训练，技术门槛极高。直到开源项目 sml2h3/ddddocr（中文名：带带弟弟 OCR）的出现，彻底改变了这一切。它是一个离线运行、完全免费、零配置的通用验证码识别 SDK。你不需要懂得任何神经网络知识，只需一行代码，就能实现极高准确率的验证码识别。本文将带你全面了解 ddddocr，并展示如何在真实的 Python 爬虫项目中实际运用它。一、DdddOcr 的核心特点零配置，开箱即用：不需要下载额外的权重文件，也不需要复杂的特征工程，安装后直接加载即可运行。支持超多验证码类型：英数混合验证码：最常见的扭曲、带干扰线、噪点的字母数字验证码。滑块...

Python 核心语法与项目环境管理

发表于2025-10-15|后端开发|Python•基础•环境配置

前言写 Python 的人很多，但能写出符合工程规范、避开底层设计缺陷代码的人并不多。许多人在开始一个 Python 项目时，要么全局乱装依赖导致系统环境崩溃，要么写出诸如“默认参数为可变列表”的低级 Bug。这篇文章从实际工程角度出发，讲清楚最基础但也最核心的环境管理规范，并剖析开发中高频使用的数据结构与语法避坑实践。一、虚拟环境管理与项目隔离在实际开发中，严禁在系统全局环境直接使用 pip install 安装依赖。这会导致不同项目间的库版本冲突，甚至可能破坏操作系统的包管理系统（例如 Ubuntu 或银河麒麟中依赖特定版本 Python 库的系统级工具）。目前最通用且标准的方式是使用 Python 内置的 venv 模块进行项目环境隔离。 1.1 创建与激活虚拟环境进入项目根目录，运行以下命令创建虚拟环境： 12# 创建一个名为 .venv 的虚拟环境目录python -m venv .venv 虚拟环境创建后，必须手动激活才能生效： Windows (PowerShell) :1.venv\Scripts\Activate.ps1 Linux / ...

局域网自建 NTP 服务与多端平滑同步配置实践

发表于2025-10-09|DevOps|Linux•生产部署•故障排查•运维管理•Windows•NTP

前言：被低估的内网“时钟漂移”灾难在进行空气隔离（Air-gapped）的内网服务器集群部署时，工程师们往往把目光投向数据库主从、负载均衡或高可用底座，而常常忽略了一个看似微不足道却致命的基础服务—— 时间同步（NTP）。服务器主板上的石英晶体振荡器受环境温度、电压波动和硬件老化的影响，每天都会产生毫秒级甚至秒级的物理误差。这种现象被称为 “时钟漂移（Clock Drift）” 。在联网环境下，系统会自动向公网 NTP 服务（如阿里源、腾讯源）同步；但在完全物理隔离的私有化内网中，时钟漂移会无限制累积。一旦多台服务器间的时间差超过临界值，将会引发灾难性的生产事故：分布式 ID 生成器失效：基于雪花算法（Snowflake）生成的 ID，一旦遭遇时钟回拨（Time Backwards），会直接抛出异常导致全局主键生成中断，业务服务大面积瘫痪。数据库事务与日志混乱：在 MySQL 主从、双主架构中，时钟不一致会导致数据一致性检查失效、Binlog 写入顺序倒流，极易诱发严重的事务冲突和脏数据。分布式锁与 Token 提前失效：Redis 分布式锁、JWT 授权凭证...

Markdown 完整语法与写作优雅指南

发表于2025-10-02|开发工具与日常效率|Markdown•工具•写作

前言在互联网写作与技术文档开发领域，Markdown 已经成为了当之无愧的“通用语言”。它由约翰·格鲁伯（John Gruber）于 2004 年创建，是一种轻量级的标记语言。许多人在接触 Markdown 之前，习惯于使用 Word 等富文本编辑器。然而，Word 文档在不同设备、不同软件之间经常会出现排版错乱的问题，且作者需要频繁分心去用鼠标点击加粗、调整字号和行距。 Markdown 的核心哲学是：内容与排版分离，让作者专注于写作本身。通过简单的纯文本标记，你可以在几秒钟内排版出一篇美观、结构清晰的文章，并且能无缝导出为 HTML、PDF、Word 或者直接发布到个人博客和 GitHub。本文将带你从零开始，系统地掌握 Markdown 的所有常用语法，并深入探讨一些高级扩展特性和写作排版的美学规范。一、Markdown 基础语法基础语法是所有 Markdown 解析器都 100% 支持的核心规范。掌握这部分内容即可满足 90% 的日常写作需求。 1. 标题 (Headings)Markdown 通过在行首添加 # 号来表示标题，# 的数量代表标题的级别，最多支持六...

基于 GoFrame v2 快速构建企业级 Web API

发表于2025-09-30|开发|Go•Golang•GoFrame•Web框架•后端开发•工业落地

前言在 Go 语言（Golang）的 Web 开发生态中，我们常常面临两难的选择：选择 Gin / Fiber 这样的轻量级路由：虽然启动极快，但它们仅仅解决了路由问题。项目一旦变大，你必须自己挑选并拼装 ORM（如 GORM）、日志、配置、参数校验等数十个异构库。由于缺乏统一的工程规范，团队中每个人的代码结构都千差万别。选择重度 MVC 框架（如 Beego）：虽然开箱即用，但其架构较为传统，解耦性较弱，难以适配现代微服务和高度解耦的业务开发。 GoFrame（官方文档：goframe.org / 中文镜像：goframe.org.cn）的诞生完美解决了这个痛点。它是一款模块化、高性能、企业级的 Go 全栈应用开发框架。 GoFrame 就像是 Go 语言生态中的 Spring Boot 或 Laravel。它不仅提供了统一且开箱即用的高品质核心组件，更制定了一套近乎苛刻但极具工业美感的工程标准规范。本文将带你系统性地认识 GoFrame，并通过一个完整的 RESTful API 案例，展现其在真实项目中的落地威力。一、GoFrame v2 的...

Java 应用的信创环境迁移与多架构（x86 / ARM）部署

发表于2025-09-23|DevOps|Java•部署•信创•国产化•ARM

前言信创（信息技术应用创新）是近年来政企 IT 采购的重要方向。简单说就是把 IT 基础设施从国外的产品替换为国产产品——从 CPU、操作系统、数据库到中间件，全链路国产化。对于开发者来说，信创意味着你可能要把 Java 应用部署在 ARM 架构的鲲鹏/飞腾服务器上，跑在麒麟或统信操作系统上，连接达梦或 GaussDB 数据库。这篇文章从实战角度讲清楚这个链路。一、信创是什么信创的目标是建立自主可控的 IT 基础设施。目前信创生态的主流产品如下：硬件层（CPU）架构厂商代表型号信创场景覆盖 ARM 华为鲲鹏 Kunpeng 920 服务器主流，政务云广泛使用 ARM 飞腾 FT-2000/64, S2500 党政军办公、服务器 x86 海光海光 7000 系列 AMD Zen 架构授权，高性能计算 x86 兆芯 KX-6000 系列桌面办公 LoongArch 龙芯 3A6000 自主指令集，桌面和低端服务器关键结论：信创服务器端目前 ARM（鲲鹏/飞腾）占主流，x86（海光）也在增长。你的 Jav...