文章

GitHub一周热点第97期

手机智能助理Open-AutoGLM、AI画架构图工具、AI编码指导agents.md等

GitHub一周热点第97期

视频

本期视频链接

GitHub 一周热点第97期(2025/12/7 - 12/13),本期内容包括自动操作手机的Agent、AI画架构图、AI编程的指导、看板工具、GO语言的游戏引擎和具身智能资料库。 最后还有 2 份资料分享。 如果觉得内容不错,别忘了点赞关注支持一下。

1 Open-AutoGLM

  • 项目名称:Open-AutoGLM – 手机端智能助理
  • 官网链接:https://github.com/zai-org/Open-AutoGLM 对于AI手机大家都会有自己的想象,上周豆包手机发布备受关注,让人们感到AI手机似乎有近了一步,那这周开源方面就跟上了,智谱推出了Open-AutoGLM。 它是一个基于 AutoGLM 构建的手机端智能助理框架,它能够以多模态方式理解手机屏幕内容,并通过自动化操作帮助用户完成任务。 目前可以看到很多操作的示例,比如在美团上点个外卖,也可以做一些购物时候的对比工作。 它是通过 ADB(Android Debug Bridge)来控制设备,以视觉语言模型进行屏幕感知,再结合智能规划能力生成并执行操作流程。感兴趣的可以找个安卓手机来自己试试。 Open-AutoGLM也是短短的一周就暴涨了超过1w star,但其实它背后的AutoGLM并不是一个新项目,2024年10月就第一次发布过自动操作手机的Agent,后来的25年3月,也出过一个AutoGLM沉思,加入到了智谱清言的电脑客户端里,当时我还做了第一时间的体验测评。这次开源手机的Agent,应该也是想蹭蹭热度,但是也是一直在这个方面上有所积累,希望可以把这个项目持续做好。 —

2 next-ai-draw-io

  • 项目名称:next-ai-draw-io – AI画架构图
  • GitHub 链接:https://github.com/DayuanJiang/next-ai-draw-io Next AI Draw.io 是一个基于 Next.js 的开源 Web 应用,它把 AI 与 draw.io 图表编辑器 整合起来,让你可以用自然语言命令来 创建、修改、增强流程图/架构图/技术图 —— 基本上就是从“拖拖拽拽”升级到“有事你说话,AI来干活”。 项目有一个在线的demo可以直接去试试,你可以直接把想设计的架构需求说出来,AI会自动生成,也可以要求做动态连线的版本,比如可以参考项目的例子,画一个带有动画连接器的Transformer架构图,现在这种动态连线架构图现在还挺火的。 我也试了一下画一个HTTPS协议的握手流程图,生成也不错,还可以上传文档或图片来生成。 如果你想在本地运行的话,可以用docker或者通过源码来手动启动,其实也不复杂。本地运行会更适合团队/隐私场景。 说白了,Next AI Draw.io 就像给传统的流程图编辑器装了个 AI 伴侣,当然,它并不是完美的,复杂细节有时候还得自己动动手调整。但对于日常流程图、架构图、拓扑图,甚至一些带动态元素的专业图表,这绝对是个能显著提升效率的好帮手。 —

3 agents.md

  • 项目名称:agents.md – AI编码的指导
  • GitHub 链接:https://github.com/agentsmd/agents.md AGENTS.md 不是一个传统意义上的库或框架,而是一种标准化的 Markdown 格式文件,专门用来为 “AI 编程代理(coding agents)” 提供明确、机器可读的项目上下文和工作指南。用一句你熟悉的话说,它就是 “写给 AI 的 README”,让 AI 工具知道如何构建、测试、编码风格和安全要求等。 为什么需要这个东西呢?你把代码推上 GitHub,然后让 Copilot、Cursor、Google 的编码助手或其他智能体自动理解仓库。没有标准化文档,它们可能像刚上班的实习生一样乱撞;放了 AGENTS.md,它们就像拿到了一份详细的“工程说明书”。它会帮你统一规则,增强自动化,补充readme。 相对来说它会比较适合Monorepo,使用 AI 自动执行构建/测试的工作流。 看到这个你可能会一下子想到Claude.md,我的理解它相当于比Claude.md上一个层次,扩大了使用的覆盖面和包含的内容方向。最近对于如何优化AI编成也是有很多不同的尝试,agents.md也是其中一个值得关注的。 —

4 fizzy

  • 项目名称:fizzy – 看板工具
  • GitHub 链接:https://github.com/basecamp/fizzy Fizzy 是 37signals出的看板追踪工具 fizzy.do 的开源源码,可以用来管理 issue 和想法,那它的竞品就是jira、trello了,都是大名鼎鼎的。 这个项目的技术栈比较有意思,是Ruby / Rails + Hotwire,现在来说算比较小众了,这几年Ruby的东西我看到的确实不多。 项目部署推荐的是它自己的一个工具,感觉比较麻烦,所以可以先到在线的fizzy.do里去看看功能,基础使用也是免费的。使用上它是一个可以满足需要的看板工具,它的欢迎教程,就是一个看板,也算是完全的吃自己狗粮了。总体来说呢,它就是那种“功能不花哨,但流程很讲究”的看板工具——你要的是把事情推进,而不是把看板当装修游戏玩。 使用的时候需要注意一下协议,它不是场景的MIT之类的,而是 O’Saasy License。 另外37signals网站上他们的一些企业介绍很有意思,就像这个Work isn’t war,我非常赞同。 —

5 kaiju

  • 项目名称:kaiju – GO语言的游戏引擎
  • GitHub 链接:https://github.com/KaijuEngine/kaiju Kaiju 是一个使用 Go(Golang)开发的通用 3D/2D 游戏引擎,底层渲染基于 Vulkan API,并且自带可视化编辑器,目标是提供一个“更现代、更易上手”的游戏引擎体验。与很多游戏框架不同,它不是那种你写完逻辑靠另一个引擎跑,而是自己实现渲染/编辑/资源体系 —— 用 Go 这种现在流行的系统语言搞游戏,这本身就是个意思。 Kaiju 力图在场景、渲染、资源管理等方面弹性覆盖2D和3D两种模式,方便做从简单小游戏到复杂场景的原型。 看起来比较有意思的是,它支持本地AI,可以看到直接输入内容,让AI来辅助创建对象。但是咱说,这输入框做的是不是太不有友好了,输入长了以后,前面都看不到啊。 还有就是项目给的一些指标我看着比较懵,比如这个空物体的高帧率,后来我发现hackernews也同样被吐槽了。 整体来说,它不是 Unity 那种一站式高级平台,但就 “自己动手 + 好玩 + 可控制” 这三条来说,它会有比脚本式引擎更原始、更透明的掌握感 —

6 Embodied-AI-Guide

  • 项目名称:Embodied-AI-Guide – 具身智能资料库
  • GitHub 链接:https://github.com/TianxingChen/Embodied-AI-Guide 本项目是一个一份围绕具身智能(Embodied AI)的学习与研究指南, 2025年机器人行业似乎嘭的一下就火起来了,就连马斯克都表示未来人形机器会超过特斯拉,创造超万亿的产值,今年全球机器人市场规模约为5000亿,到2030年就会突破万亿大关,是一个非常值得关注的赛道。 我这周参与了一个机器人的活动,所以对这方面比较感兴趣,就分享一下这个项目。 本项目核心目标很明确:帮你把“机器人 + 感知 + 决策 + 行动 + 学习”这条技术链路系统性地串起来。不是只讲模型,也不只讲硬件,而是从问题定义、算法范式到仿真平台、数据集与代表性工作,尽量给你一张“可导航的地图”。 我相信很多人对具身智能的印象还停留在“机器人很火,但我不知道从哪下手”,这个时候你就需要一份可以帮你找到方向的资料指引了,所以这个时候你需要的就是,关注IT咖啡馆。 —

one more thing

最后还是分享2个资料,第一份《从零开始构建智能体》,Hello-Agents 是 Datawhale 社区的系统性智能体学习教程,希望带你理解如何实现代码开发Agent的整个流程,构建起属于自己的多智能体应用。 第二个是《中美机器人发展深度分析报告》,最近我正好在看一些关于具身智能机器人的内容,然后发现了这个报告,他是从投资的角度来解析机器人企业的商业逻辑,感兴趣的可以看一下。 有需要的可以告诉我,以上就是本周的全部内容,那我们下次再见。

ARR (All Rights Reserved)