AI初创公司Hexo Labs于5月28日开源了SIA(Self-Improving AI)系统。这套系统能够自主设定学习目标、执行训练、评估结果并自我迭代改进,无需人类指导。在MLE-Bench上展现强劲性能,公司称可加速超智能进程达350倍。
自进化AI:科幻走进现实
5月28日,AI初创公司Hexo Labs开源了一个名为**SIA(Self-Improving AI)**的系统。它的核心能力令人既兴奋又不安:AI可以自主教导自己新技能,无需人类干预。
SIA如何工作?
SIA的工作流程分为四个阶段:
阶段一:目标设定
AI Agent根据给定的高级目标(例如"提升图像分类准确率"),自主拆解为具体的子任务——"收集更多训练数据"、"尝试新的数据增强方法"、"调整网络结构"等。
阶段二:自主执行
Agent自动编写训练代码、启动GPU训练任务、监控训练过程。如果训练过程中出现错误(如OOM),Agent会自行调整参数并重新运行。
阶段三:结果评估
训练完成后,Agent自动跑测试集、生成评估报告、与历史版本进行对比。它能识别出"这次改进是否有效"。
阶段四:知识积累
Agent将成功经验存入持久记忆库,用于指导未来的改进方向。这意味着SIA的学习能力是累积递进的——每次实验都让系统变得更聪明。
MLE-Bench测试成绩
在OpenAI的MLE-Bench(机器学习工程基准测试)中,SIA展现了令人瞩目的成绩:
- 能够在无人类提示的情况下完成绝大多数ML工程任务
- 在部分任务上达到或接近人类ML工程师的水平
- 完全自主进行了超过650次实验,耗时约48小时
"加速超智能350倍"
Hexo Labs的声明中有一句引起广泛讨论的话:
"SIA可以将从当前水平到超级智能的进程加速约350倍。"
这个说法立刻在AI安全社区引发争论。有研究人员质疑这个数字的计算方式,也有人担忧自进化系统一旦失控将难以遏制。
Hexo Labs随后澄清:350倍是指从"人类手动研究"到"AI自主研究"的效率差异,而非预测超级智能的实际到达时间。
与Andrej Karpathy的"autoresearch"的异同
有趣的是,SIA的工作方式与OpenAI联合创始人Andrej Karpathy今年3月提出的"autoresearch"概念高度相似。
Karpathy当时展示的系统也是让AI自主运行实验、修改训练代码、迭代改进模型。在48小时内,他的系统跑了650个实验,将一个深度12层的模型逐步优化到了新高度。
Elon Musk对此的评论是:"2026年可能是奇点的起点。"
开源意味着什么?
Hexo Labs选择开源SIA,这是一个非常大胆的决定。开源意味着:
- 任何人都可以审查代码,降低安全风险
- 全球开发者可以共同改进
- 但也意味着恶意使用者可能利用这个系统
Hexo Labs CEO表示:"我们相信透明是应对AI风险的最佳方式。与其让自进化技术关在少数实验室里,不如让全世界一起审视和监督。"
自进化AI的风险
这个方向引发了大量关于AI安全的讨论:
支持方观点:自进化AI是解决"如何让AI持续改进"的最有效路径。人类工程师不可能手动优化所有模型参数,自进化是必然趋势。
反对方观点:一旦AI可以在无人类干预的情况下自我改进,"能力失控"(Capability Overhang)的风险将急剧上升。我们可能在某一天突然发现,AI已经悄悄进化到了远超预期的水平。
怡途的观察
自进化AI目前仍处于早期阶段。SIA和autoresearch更多是概念验证,尚未在真实生产环境中部署。
但这个方向的进展需要被认真关注。AI不再只是工具,而开始具有"自我改进"的能力——这条路上每一步都值得我们深思。
对企业的启示是:AI能力在加速进化。今天看起来"还不够成熟"的技术,可能6个月后就足以改变你的行业。保持关注,保持学习,保持行动力。