为什么现在是个人做机器人的好时机
2024-2026年,机器人领域迎来了自己的”大模型时刻”。
过去做机器人,你需要精通控制理论、逆运动学、SLAM——门槛极高。现在的核心变化是**模仿学习(Imitation Learning)**成为主流:你用手操作一遍,机器人看了就学会。这跟大语言模型的逻辑一样——不是编程让它做,而是给数据让它学。
几个关键技术让这成为可能:
- RT-2(Google DeepMind):视觉+语言+动作统一模型,看图听话就能动
- π0(Physical Intelligence,$56亿估值):通用机器人基础模型,2025年已开源
- LeRobot(Hugging Face):机器人领域的”transformers库”,统一接口、数据集、预训练模型
- OpenVLA:7B参数的开源VLA模型,消费级GPU就能微调
机器人前沿:谁在做什么
Tesla Optimus 的自我迭代方法
Optimus 不是传统机器人,而是”有身体的 AI”。它的训练方法论:
- 人类遥操作:操作员戴上控制设备,操作 Optimus 做任务
- 数据录制:所有动作被录制为训练数据
- 端到端训练:用单一神经网络从视觉直接输出动作
- FSD 迁移:将自动驾驶的视觉模型能力迁移到机器人
- 自我迭代:Optimus 自己执行 → 人类纠正 → 再训练
核心洞察:Tesla 把自动驾驶积累的 AI 基础设施(数据引擎、标注流水线、大规模训练集群)直接复用到机器人上。
其他重要玩家
| 公司/项目 | 形态 | 核心特点 | 价格 |
|---|---|---|---|
| Boston Dynamics Atlas | 人形 | 动态敏捷性标杆,全电动版 | 非卖品 |
| Agility Digit | 人形 | 已商业化部署,仓储物流 | 企业级 |
| Unitree Go2 | 四足 | 消费级,LiDAR+AI | 1.1-2万元 |
| ALOHA 2 | 双臂 | 开源标杆,研究级 | ~20万元 |
| AlohaMini | 双臂+移动 | 平民化ALOHA | ~4500元 |
| SO-100 | 单臂 | LeRobot官方,入门首选 | ~1700元 |
| Koch | 单/双臂 | 模仿学习标杆 | ~3100元 |
机器人大模型对比
| 模型 | 来源 | 参数 | 开源 | 特点 |
|---|---|---|---|---|
| RT-2 | Google DeepMind | 55B | 否 | VLA先驱,泛化能力强 |
| Octo | UC Berkeley | - | 是 | 80万episode预训练 |
| π0 | Physical Intelligence | - | 是 | 通用策略,5倍训练加速 |
| OpenVLA | Stanford | 7B | 是 | 消费级GPU可微调 |
| LeRobot | Hugging Face | 框架 | 是 | 统一接口,多算法支持 |
训练方法选择:模仿学习 > 端到端 > 强化学习(对个人项目而言)。模仿学习数据效率高、训练稳定、有成熟工具链。
三档推荐方案
入门方案:SO-100 + LeRobot(~1,700元)
这是我们的首选方案。SO-100 是 Hugging Face LeRobot 框架的官方推荐硬件,有完整的文档、3D打印文件、组装视频和 Python API。
硬件清单
方案A — Seeed Studio 套件(推荐,省心):
| 组件 | 价格 | 渠道 |
|---|---|---|
| SO-ARM100 舵机套件(STS3215 x6 + 驱动板 + 线缆) | ~1,450元 | Seeed Studio |
| 3D 打印件 | 150-300元 | 淘宝3D打印服务 |
| USB 摄像头 | 50-100元 | 淘宝 |
| 5V 电源 | 30元 | 淘宝 |
方案B — 自行采购(更便宜):
| 组件 | 价格 | 渠道 |
|---|---|---|
| STS3215 总线舵机 x6 | ~900元 | 1688搜”飞特舵机 STS3215” |
| Waveshare 舵机驱动板 | ~60元 | 淘宝 |
| 3D 打印件 | 150-300元 | GitHub免费STL文件 |
| 线缆 + 螺丝 | ~100元 | 淘宝 |
| USB 摄像头 | 50-100元 | 淘宝 |
开源资源:
- GitHub: TheRobotStudio/SO-ARM100
- HuggingFace: LeRobot SO-100 教程
软件栈
# LeRobot 安装(纯Python,不需要ROS)
git clone https://github.com/huggingface/lerobot.git
cd lerobot && pip install -e .
工作流:
python -m lerobot.calibrate— 校准舵机- 用主臂遥操作从臂,录制示教数据
python -m lerobot.train— 训练 ACT/Diffusion Policypython -m lerobot.control— 机械臂自主执行
进阶方案:AlohaMini 双臂(~4,500元)
| 组件 | 数量 | 价格 |
|---|---|---|
| STS3215 舵机 | 16 | 1,600元 |
| Raspberry Pi 5 | 1 | 600元 |
| 舵机控制板 | 2 | 150元 |
| USB 摄像头 | 5 | 700元 |
| Omni万向轮 | 3 | 750元 |
| 锂电池组 | 2 | 450元 |
| 3D 打印材料 | - | 250元 |
双臂+移动底盘,能做叠衣服、整理物品等双手协作任务。兼容 LeRobot。
终极方案:类 ALOHA 2 工作站(~25,000元)
ViperX 300 工业级机械臂 x2 + 多摄像头 + 工作台。接近论文级研究平台。
工作站配置方案
硬件选择
我们选择了 Windows PC (AMD Ryzen 7 5800H + RTX 3070 + 64GB RAM) 作为主力工作站:
| 对比项 | MacBook M2 16GB | Windows + RTX 3070 |
|---|---|---|
| 训练速度 | MPS加速,够用 | CUDA,快3-5倍 |
| 显存 | 共享16GB | 8GB独立 |
| 内存 | 16GB | 64GB |
| LeRobot兼容 | macOS偶有坑 | Ubuntu原生最佳 |
环境架构
MacBook (中枢/写代码)
↓ SSH / VS Code Remote
Windows + WSL2 Ubuntu 22.04 (GPU训练/机械臂控制)
↓ USB
SO-100 机械臂
Mac 做日常开发和远程调试,Windows 当 GPU 服务器。日常体验:坐在 Mac 前操作一切,Windows 无头运行。
WSL2 环境配置(比双系统更好)
为什么 WSL2 而不是双系统?
- 一行命令安装,不需要 U 盘和分区
- Windows 和 Linux 同时运行
- CUDA 完整支持(2022年起)
- USB 串口支持(usbipd)
- 性能约 95%,几乎无损
配置步骤:
- Windows 上开启 OpenSSH Server(设置 → 可选功能 → OpenSSH 服务器)
- Mac SSH 进入 Windows
- 安装 WSL2 + Ubuntu:
wsl --install -d Ubuntu-22.04
- 安装 NVIDIA CUDA(WSL2版):
# WSL2 内执行
wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt update && sudo apt install cuda-toolkit-12-4
- 安装 Miniconda + LeRobot:
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh
conda create -n lerobot python=3.10
conda activate lerobot
pip install lerobot
- USB 直通配置(机械臂连接):
# Windows 端安装 usbipd
winget install usbipd
# 绑定设备到 WSL
usbipd bind --busid <BUS-ID>
usbipd attach --wsl --busid <BUS-ID>
6周学习路径
第1周:准备
- 下单 SO-100 套件
- 3D 打印结构件(外包或自己打)
- 配置 WSL2 + CUDA + LeRobot 环境
- 阅读 LeRobot 文档和 SO-100 组装指南
第2周:组装
- 按教程组装机械臂(主臂 + 从臂)
- 连接电路、舵机校准
- 运行 LeRobot 基础测试
第3周:遥操作
- 用主臂遥操作从臂
- 录制 50 组”抓取物体”示教数据
- 理解 ACT 和 Diffusion Policy
第4周:AI 训练
- 用录制数据训练模仿学习模型
- 部署模型,观察机械臂自主抓取
- 调参优化成功率
第5-6周:扩展
- 加摄像头,训练视觉策略
- 尝试更复杂任务(整理桌面、分拣物品)
- 接入 VLA 模型(如 OpenVLA)实验
需要学什么(和不需要学什么)
需要学:
- 3D打印基础(1-2天)
- 舵机和基础电路(2-3天)
- LeRobot 框架(1周)
- 模仿学习原理(ACT、Diffusion Policy)
不需要学:
- ROS(LeRobot 不依赖 ROS)
- 控制理论(模仿学习绕过了传统控制)
- C++(全程 Python)
相关资源
这篇文章基于一份系统性的调研报告(10,000+ 字),覆盖了机器人前沿全景、大模型技术、项目对比和实施方案。完整报告见下一篇。
相关文章
加入讨论
分享您的想法,与其他读者交流。评论通过 GitHub 管理,确保安全可靠。
请遵守我们的 评论政策,共同维护良好的讨论环境