$ whoami

你好,我是 ailiheizi

一个以自学为主的软件开发者,2026 届,在初创团队做过比较久。做过去中心化即时通讯、AI 服务平台、AI Agent 平台,也做过软硬件结合的小项目。这个页面把我会什么、做过什么,按真实情况列出来。

2026 届 自学为主 初创实战 Rust Go Python 分布式 AI 基建 软硬结合
01.

关于我

简单说说我的背景和方向。

我的代码基本是自学的。这几年大部分时间都花在做项目上——写过一个纯 Rust 的去中心化即时通讯系统,在公司主导设计过一个 AI 产品的整套架构,也做过软硬件结合的机器人。

这个页面我没怎么修饰,就是把每项能力到了什么阶段、连同证据一起列出来。该是什么水平就标什么水平,没到的地方会直接说"在补"——这样你判断起来也省事。

我的方向是 Rust / Go 后端和分布式系统,以及 AI 基建。比较喜欢从底层把一个系统整个搭起来。现在想找一份能踏实做下去的工作。
02.

能力矩阵

每项都标了真实阶段 + 证据。评分原则:可辩护——面试追问扛得住的水位,不虚高,也不自谦。

L5 主力·能独立交付并讲清取舍 L4 熟练·有完整项目背书 L3 能用·做过可运行的东西 L2 入门·学过基础/按需实践 L1 了解·知道是什么

// 主力语言与方向

RustL4 · ★★★★☆
用它独立做出 1.4 万行、116 测试的去中心化 IM,并主导设计了商业 AI 产品的 Core/Package 架构。能不靠 AI 读懂、改、debug(C++ 出身,生命周期专项学过);部分语法细节按需查文档或用 AI——架构判断是我的,语法交给工具。// NextIM · RELIK
GoL4 · ★★★★☆
全栈后端,写过 AI 信息流工具的服务端、微服务网关。// rss_reader · GlassBox
PythonL4 · ★★★★☆
AI 服务(FastAPI)、大模型原理研究、数据处理。// 多个 AI 后端
Vue / TypeScriptL4 · ★★★★☆
多个项目的前端,前后端通吃。// rss_reader 前端等

// 领域能力

后端 / 分布式系统架构L4+ · ★★★★☆
做得比较深的部分:去中心化架构、端到端加密、DHT、全文搜索、消息转发的整体设计都是我做的。把复杂系统拆清楚、定方案,是我比较有把握的事。// NextIM · RELIK
云计算 / 高可用L3 · ★★★☆☆
在云计算相关的工作里接触过高可用、容灾这类生产级话题,对线上系统怎么保证不挂、出问题怎么兜底有实际认识。// 生产环境经历
AI 基建 / Agent 平台L4+ · ★★★★☆
主导设计 AI 服务编排平台整套架构;做过微服务 Agent 平台(容器沙箱 + VNC + 多 Agent 工作流)。// RELIK · GlassBox
软硬件结合 / 硬件L3+ · ★★★☆☆
YOLO+MediaPipe 做过手势识别夹爪机器人;ESP32 真实接入;玩过 ROS;了解 nRF52840。// 视觉+机械控制
多端 / 应用开发L3 · ★★★☆☆
Flutter 跨端、微信小程序、Electron 桌面、ArkTS 鸿蒙都落地过。// ManagementCloud 等
游戏开发L3 · ★★★☆☆
Godot 做过 2D 交互游戏;杀戮尖塔2 背单词 Mod(9000+ 行,已开源)。// VocabSpire

// 原理 / 底层(自学,按需深入)

操作系统L3 · ★★★☆☆
用 JYY OS 2026 诊断式学习:进程/线程、fork/exec、fd/pipe、mutex/atomic/条件变量、死锁活锁、虚拟内存/MMU/TLB/缺页都建立了可用心智模型;清楚自己的 gap(文件系统、调度)。// 持续推进中
AI 原理L3 · ★★★☆☆
能脑内推演完整 GPT 训练四阶段 + 推理流程;读 DeepSeek/Kimi 源码对照理解模型迭代。原理啃透了,亲手跑完整训练是下一步要补的。// 诚实标注:理解强 > 训练实战
x86 汇编 / 逆向L3 · ★★★☆☆
不只是读:做过单机修改器、人造基址、call 调用——真动手的逆向工程实践。// 逆向实操
C / C++L3 · ★★★☆☆
熟悉 STL、并发、RAII、指针等核心特性,按需能写。// 并发 demo + OS 学习
计算机原理(CSAPP / 网络)L2+ · ★★☆☆☆
按需读过部分,关键概念懂、体系还不完整,持续补全中。// 诚实标注
03.

AI / Agent 这块

AI 时代,这是我花了最多心思的方向。分两层讲清楚——工程落地我做过真东西,原理理解我啃得很透,但训练实战的边界我自己拎得清。

// 第一层:AI 工程 / Agent 系统(做过,能讲透)

AI 服务编排(RELIK)
主导设计了一个商业 AI 产品的整套架构:OpenAI 兼容 API 网关、WASM/Native 包系统、能力注册与调度、Generation 快照(支持复现 / 回滚 / 审计)。老板只给了"陪伴"一个方向,怎么把它变成一个可扩展、可回滚的 AI 能力平台,是我设计的。
多 Agent 平台(GlassBox,已开源)
微服务架构的 AI Agent 平台:AI 在独立沙箱容器(Debian+Xfce)里执行操作,用户通过 VNC 实时观看。用 LangGraph 编排 Planner → Executor → Reviewer 多 Agent 工作流,支持 GUI 操作模式和 Code 模式(VSCode Server)双通道,每用户独立容器隔离。
省 token 的 AI 应用设计(rss_reader)
AI 推荐最大的成本是 token。我的方案:本地 TF-IDF 建用户兴趣画像(零 token)→ 本地多因子初筛出约 15 个候选 → 只让大模型对这 15 个精排、生成中文理由 → 按画像指纹缓存。把 AI 调用压到最低,是个能讲清"成本/效果权衡"的工程案例。
用 AI 做开发(工程化的 vibe coding)
我把 AI 当成开发杠杆:架构和技术决策我定,实现交给 AI 提速,再由我把关、读码、debug。这套方式让我一个人也能做出比较大的系统量——NextIM 的一万四千行就是这么来的。对我来说,会指挥 AI 做出复杂系统,本身也是一种能力。

// 第二层:AI 原理(理解很深,诚实标边界)

能脑内推演整条链路:从 KNN、SVM 一路按需学到 Transformer、GPT。我能在脑子里把 GPT 的训练四阶段 + 推理流程整个推一遍,知道每一步在做什么、为什么。

读源码、对照理解迭代:读过 DeepSeek、Kimi 等模型的源码,对照着看新模型改了哪里、那块负责什么、同样的方法还能用在哪。

诚实的边界:原理我啃得透,但亲手跑完整训练(QLoRA / SFT / RL)是我下一步要补的——目前是设计与理解层面,不是已完成的实战。我不会把"理解"说成"训练过"。
04.

RELIK:一个我主导设计的 AI 平台

RELIK 是我在公司主导设计的 AI 服务编排平台。老板给了"陪伴"这个方向,从技术架构、能力体系、依赖管理到产品形态和商业路线,除 UI 前端外都由我设计。代码归公司、不公开——但设计思路是我的,这里讲讲我做了哪些判断。

这一段没有代码、没有截图,只有设计本身。比起"写了多少行",我更想说明的是:给一个模糊方向,怎么把它拆成一个可扩展、可回滚、能让 AI 安全参与的系统。
01.依赖链管理 —— 把"装了什么"做成可一键回滚的代际
我借鉴 Nix 的 profiles/generations,把传统的"依赖开关"重构成不可变、可验证、可一键回滚的产品代际

核心是声明 / 配置 / 锁三层严格分离:声明只表达"产品想要哪些能力",配置表达"当前环境怎么跑",锁只记录"这次实际装配出的事实"(精确版本 + 内容摘要 + 绑定快照)。三者混在一起,就永远分不清"想要什么"和"实际装了什么"——而这正是可复现的地基。

我把激活做成指针切换而非原地修改:每一代是不可变产物,回滚就是把指针翻回上一个已验证代,不重新解析依赖。于是回滚从"重新求解的风险操作"降级成了"几乎零风险的指针翻转"。

身份用内容寻址:对绑定集合和依赖闭包算规范化摘要,保证相同语义输入产生相同 id、两代之间能做确定性 diff。版本号靠不住(同版本可能被重新发布、本地包可能没改版本但内容变了),所以信任根是摘要,不是版本号。
02.能力原子化 —— Provider → Foundation → Feature → Product 四层
我把系统能力原子化成边界清晰、可独立替换的最小单元,再用四层职责把它们装配成完整产品:原子实现层(Provider)→ 稳定能力面(Foundation)→ 产品语义组合(Feature)→ 产品默认装配(Product)。

关键判断是以"能力"而非"实现名"作为装配契约:产品只声明需要什么能力,平台在解析期路由到具体实现。这样任何底层实现都能被替换升级,而产品声明一行都不用动。

我特意保留了Feature 中间层——这是最容易被省略、但最关键的一层。少了它,要么逻辑全堆回产品包变成单体,要么产品语义散落到底层包里丢失。可变性我做成三级(固定 / 可换 / 条件可换),区分点不是"能不能换",而是"换它的验证门槛和风险级别"。
03.Core 与 Agent —— 让 AI 自由改,又始终稳定可回滚
我把 Core 定位成"强平台而非薄转发层",但严守边界:它只做能力宿主、统一调用协议、解析、验证与切换,绝不吞回产品业务逻辑。对外只暴露一套稳定的 capability 调用协议,由能力注册表路由到具体 provider——让能力持续增长,而内核协议长期不变。

扩展走WASM 沙箱为主、Native 为有限补充:全 WASM 覆盖不了深系统能力,全 Native 又难隔离、AI 难自动生成。让 WASM 承担编排/监管的治理层、通过能力接口访问宿主,Native 只在性能/平台缺口处按需引入。

我自己比较看重的一点:AI 永远是"提议者",不是直接操作运行态的人。它走 propose→resolve→verify→activate 四步,所有改动只作用在候选代上,验证通过才激活、失败一键回滚,不会污染用户正在用的实例。这样"AI 自由定制"和"系统稳定可回滚"就能同时成立。
04.产品与商业 —— 敢加什么,更要敢砍什么
产品上我提出"叙事主体性"原则:把文件入库、多模态检索、会议转写、写作、周期复盘几十项能力,全部收敛进 Companion 的主动行为,而不是堆一排独立按钮。目的是让产品从"AI 工具"跃迁成"AI 助理",不让功能堆砌稀释主线。

商业上我规划了向"积分制 AI + 云 + 知识库 + Agent"四合一平台的演进,用分层架构在统一计费/身份/审计底座上逐级抬升毛利与壁垒。判断依据是"底层能力终将被巨头价格抹平",护城河在上层——Agent 生态的网络效应、知识库的数据锁定、行业深度。

面对上百个功能设想,我用收入、差异化、成本、生态四维打分做减法。我相信好的产品力,一半在于敢加什么,一半在于敢砍什么。
面试可以深聊的:为什么选 Nix 式代际而不是 npm/pip 式 lockfile;规范化身份哈希的工程取舍;Core 边界为何画得这么死(从"离线可复现"硬需求倒推);以及我对"蓝图与落地差距"的清醒认知——哪些已落地、哪些还在设计阶段,我分得清。
05.

做过什么

真实项目。已开源的给链接,公司产品和未上传的讲清角色与设计——代码可应约提供。

NextIM 已开源
Rust · 10 crate workspace · Tantivy · Ed25519 · Olm/Megolm

纯 Rust 的去中心化即时通讯系统。没有中心服务器,每个用户自托管节点直连转发;消息 Ed25519 签名、三档信任模型、中文全文搜索。约 1.4 万行,116 个测试。架构参考 matrix-rust-sdk 的 sans-I/O + Trait 分层。

我的角色:独立从 0 到 1 设计与实现全部后端。完成度诚实标注在 README——核心链路过集成测试,端到端加密运行时联调仍在收口。
RELIK 公司产品 · 未公开
Rust · WASM · Go · 架构设计

一个商业 AI 服务编排平台。除 UI 前端外,整体技术架构、能力体系、依赖管理、产品形态与商业路线都由我设计——是我做过的偏架构和产品设计的一个项目。

详见上方 「一个商业产品的架构,是我设计的」 专区,拆解了依赖链管理、能力分层、Core/Agent 架构、产品商业四块设计。代码归公司,只讲设计不展示代码。
VocabSpire 已开源
游戏 Mod · 9000+ 行 · 杀戮尖塔2

出牌时弹英语单词测验的游戏 Mod。四种答题模式(含在线 TTS 听力)、难度随层数递增、词汇图鉴、篝火复习、联机适配、复用游戏原生 UI。

我的角色:独立开发。体现产品细节打磨和对"把功能做完整"的执着。
GlassBox 已开源
Go · Python · React · Docker · LangGraph

微服务 AI Agent 平台:AI 在独立沙箱容器里执行操作,用户通过 VNC 实时观看。7 个服务、多层隔离、Planner→Executor→Reviewer 多 Agent 工作流、GUI/Code 双模式。

我的角色:独立设计与实现。体现微服务架构 + 容器编排 + AI Agent 基建能力。
ManagementCloud 代码可应约提供
Rust (Axum+SeaORM) · Flutter · ESP32

智能家居系统:Rust 后端 + Flutter 跨端客户端 + 真实硬件。插件系统支持 JS / TS / WASM 三种运行时;规则引擎、多协议适配、WebSocket 实时推送、JWT+Argon2 鉴权。

我的角色:独立开发。软硬件结合 + 后端工程 + 跨端,覆盖面广。
Supermerge 个人项目
Go · PocketBase · CLI/Agent

面向 AI 协作开发的任务与合并控制系统。把 task、progress、commit 证据和 merge readiness 连起来,让人和 AI 在合并前拥有可靠上下文。Task 为唯一主对象,事件 push 架构。

我的角色:独立设计。体现对 AI 协作开发工作流的产品思考。
手势识别机械臂 作品 · AI 辅助
Python · OpenCV · MediaPipe · scikit-learn · TCP

摄像头实时识别手势,经 TCP 把指令发给 Dobot 机械臂,做夹爪开合、上下左右等动作。自建 10 类手势数据集、训练 MLP 分类器,用队列+条件变量做帧批处理和抖动过滤。CV + 机器学习 + 硬件控制 + 网络 + 并发的全链路。

我的角色:整体方案我设计,实现用了 AI 辅助。体现把视觉、模型、硬件、网络几样串起来的整合能力。
06.

更早的时候

我从初中就开始接触编程,AI 普及之前就一直在写。这里放两个那时候自己手写的东西,外加一个我研究过原理的项目——主要想说明:我的底子是自学一行行练出来的,不是这两年靠 AI 速成的。

school_network · 手写
Flutter · Rust · flutter_rust_bridge(FFI)

用 Flutter 调 Rust 实现的校园网认证客户端:自己分析 BRAS 门户认证流程、构造参数复现登录请求。用 FFI 打通 Dart↔Rust,技术点偏冷门,能体现跨语言集成和协议钻研。

PVZ 内存修改器 · 手写
Python · pymem · AOB 特征码扫描

植物大战僵尸的内存修改器:附加游戏进程,用特征码(AOB)扫描定位、做字节级内存 patch。体现 Windows 底层 / 逆向能力,代码把内存管理和 GUI 做了解耦。

Android 上的 Linux 终端 · 研究
Termux · Android/Linux · 原生二进制

这个我没从零做,是出于好奇去研究 Termux 这类工具是怎么在没 root 的手机上跑 Linux 环境的——Android 底层就是 Linux 内核、CPU 架构也和普通 Linux 一致,所以原生程序能跑。这种"把现成的东西拆开、搞懂它为什么能work"是我学系统知识的常用方式。

早年还折腾过 Vue/Web 前端、Godot/Unity 小游戏、Kotlin 安卓、易语言、各种算法练习等等,方向比较杂。大多是练习和半成品,就不一一列了——能说明的是,我从挺早就一直在写代码。
07.

你可能想问

点开看。这些是招聘方最常问、我也最想讲清楚的。

Q.自学出身,没有大厂背景,靠谱吗?
代码基本靠自学,没人带。但东西都做出来了,也扛得住追问——一个人写过 1.4 万行、116 个测试的 Rust 去中心化 IM,主导设计过一个商业 AI 产品的整套架构。能不能干活,看项目比看背景准,这些都摆在 GitHub 上。
Q.你的基础是怎么练的?
基本靠自己啃。Go、C++、Python、Vue、Dart、汇编这些,还有计算机原理、AI 原理、电子——大多是 AI 普及之前一点点练出来的,主修软件,按需深入。底子是自己的,这也是我后来能驾驭工具、把得住方向的根基。
Q.这些项目用 AI 辅助了吗?
用了,不藏着。我的做法是:架构和技术决策我来定,具体实现大量用 AI 提速。NextIM 要不要去中心化、信任怎么分档、RELIK 的 Core 和 Package 怎么切——这些 AI 替不了,是我做的判断。我把 AI 当成一个很快、但需要我把方向的工具。比起单纯敲代码,我觉得做决策、判断方向更重要一些。
Q.哪个项目最能代表你?
技术实现上是 NextIM:去中心化、端到端加密、Trait 分层架构,纯 Rust 独立完成,已开源可查。设计能力上是 RELIK——老板只给了"陪伴"一个方向,整套技术与产品架构由我设计,相当于独立做了一个商业产品的顶层设计。
Q.AI 这块,你到底会到什么程度?
说实话:原理我啃得很透,亲手跑完整训练是我下一步要补的。我能在脑子里把 GPT 的训练四阶段和推理流程整个推一遍,读 DeepSeek、Kimi 的源码对照理解模型改了哪里、为什么。工程侧我做过 Agent 平台和省 token 的推荐系统。我不会把"理解"吹成"实战"——这条边界我自己很清楚。
Q.项目这么多,会不会都是浅尝辄止?
分两层看:Rust、后端、分布式是我做得比较深的部分,有 1.4 万行的系统和商业架构撑着;多端、游戏、硬件是广度,说明我能比较快上手陌生领域、做出能跑的东西。这个页面已经把每项的真实水位标出来了,哪个深哪个浅我自己分得清。
Q.为什么从初创出来找工作?
我在初创做了挺久,独立做过真实的产品,成长比较快。现在想找一个更稳定、能长期做下去的环境,把已经验证过的能力用在更扎实的地方。说白了,就想要一份能安心做事的工作。
Q.遇到不会的怎么办?
项目驱动、按需深挖,这是我的常态。为做 NextIM 现学了 Tantivy 和加密原语;为研究大模型去啃源码。我也做过一个神经压缩的研究,调研后发现方向已经被前人占满,就停了、转成一个教学网页——我觉得会判断方向,和会写代码差不多重要。