文章

GitHub一周热点第111期

Karpathy经验提炼的Claude Code配置、AI Agent团队协作平台、新一代TTS模型、微软文档转Markdown工具和轻量本地搜索引擎

GitHub一周热点第111期

「Github一周热点111期」Karpathy 经验提炼的 Claude Code配置、AI Agent 团队协作平台、新一代 TTS 模型、微软的万能文档转 Markdown 工具,以及 轻量本地搜索引擎

GitHub 一周热点第111期(2026/4/8 - 2026/4/14),本期内容包括 用Karpathy 经验提炼的 Claude Code配置、AI Agent 团队协作平台、新一代 TTS 模型、微软的万能文档转 Markdown 工具,以及 轻量本地搜索引擎

最后还是分享两份资料。

如果觉得内容不错,别忘了点赞关注支持一下。


1. andrej-karpathy-skills

📌 项目名称:andrej-karpathy-skills — Karpathy 经验提炼的 Claude Code配置

🔗 GitHub 链接:https://github.com/forrestchang/andrej-karpathy-skills

⭐ 31.2k stars

本项目说白了就是一个 CLAUDE.md 文件,但这个文件可不一般——它是从 Andrej Karpathy长期使用 LLM 写代码的踩坑经验里提炼出来的。

Andrej Karpathy是谁?我想关注AI圈的人没有不知道的,他是目前 AI 领域非常有影响力的工程师和研究者,曾任特斯拉 AI 总监,也是早期 OpenAI 成员之一。他擅长把复杂的AI技术讲得通俗易懂,很多人都是通过他的课程和分享入门 AI 的。

Karpathy 之前发过一条帖子,吐槽 AI 编程助手最让他头疼的几个问题:模型会擅自做假设、不问清楚就开干、写了一堆不需要的”灵活性”代码、还喜欢顺手改你的其他代码。这些问题相信经常用AI开发的朋友都深有同感。

这个 CLAUDE.md 把 Karpathy 的经验总结成了四条核心原则:

先想再写——不确定就问,有更简单的方案就说出来

简洁第一——不要乱写没用的东西

精准手术——只改该改的代码

目标驱动——任务拆成可验证的小步骤,每一步都有明确的完成标准

使用的话,可以把它安装成全局的skill,也可以只下载单独的CLAUDE.md 放到项目里。如果有自己的项目特殊要求,可以添加到Project-Specific部分里。

说实话,虽然这几条是写给 Claude Code 的,但其实对所有 AI 编程助手都适用。把它复制到你的项目根目录,模型的行为质量会有明显提升。

当然现在我想开发者很多时候都会使用开发的skill,比如像superpowers,其实我觉得还是要比这个claude.md要更好用,当然把这个作为一种补充和思路的参考还是很不错的。


2. Multica

📌 项目名称:Multica — 把 AI Agent 变成真正的队友

🔗 GitHub 链接:https://github.com/multica-ai/multica

Multica是一个开源的托管agent平台,它的slogan是”你未来的10个新同事不会是人类”,这句话听起来有点激进,但如果你用过 AI 编程助手,大概能理解它的意思。

它要把编程agent变成真正的队友——分配任务,跟踪进度,提升技能,比如像 Claude Code、Codex、OpenClaw 这些工具,大部分人的使用基本都是在那儿跟 Agent 对话、复制粘贴 prompt、盯着输出看有没有问题。Multica

要做的则是,你可以像给同事派活一样给 Agent 分配任务,通过一个统一的看板调度,它会自己接活、写代码、卡住了主动报 bug、完成后更新状态。支持 目前主流的各种 Agent工具。

安装很简单,macOS/Linux 直接 brew install 就行,windows也支持一键安装脚本。安装完成以后multica setup做一下配置,就可以到网页中使用了。

和它比较类似的项目有Paperclip、vibekanban等,它们都是希望实现agent的编排和自我驱动,项目里也列出了一下对比的情况。

Multica还有一个比较有意思的特性是”技能积累”——每次 Agent 解决一个问题,解决方案会变成可复用的技能,整个团队都能用。也就是说,你的 Agent 团队会越用越强。这个想法我觉得挺好,但是目前的阶段感觉还并不是完全的成熟。

整体来看,这个项目对于像一人公司的 AI开发场景很不错,但如果你不是重度使用者,那可能暂时还用不上这么重的方案。


3. VoxCPM2

📌 项目名称:VoxCPM2 — 新一代 TTS 模型

🔗 GitHub 链接:https://github.com/OpenBMB/VoxCPM

VoxCPM 是面壁智能 × 清华大学联合研发OpenBMB社区开源的一套 新一代 TTS(文本转语音)模型,主打一个关键词:“Tokenizer-Free”。简单说,它不再走传统“文本 → token → 声音”的流程,而是直接在连续语音空间建模,从根上解决语音合成“机械感”和表达力不足的问题。

这次最新升级发布的是VoxCPM2 ,是基于 MiniCPM-4 基座构建,总计 20亿 参数,在超过 200万小时 的多语种音频数据上训练,支持 30种全球语言。

它具备上下文感知语音生成、零样本语音克隆、连续语音建模等能力,你还通过文字描述来设计音色,并且可以在消费级的显卡去运行。

使用的话可以直接在Huggingface的demo里体验一下。如果想要自己本地尝试,那可以按照文档去安装一下,我看了一下眼还是比较简单的,项目里也带了web demo。但是现在比较遗憾的就是还没有支持Mac的推理加速,所以只能用CPU,我的本地试用还需要再等等。

数据表先方面,VoxCPM2 在公开的零样本和可控 TTS 基准测试中取得了 SOTA 的结果,项目也公开了技术资料可以深入去研究。


4. MarkItDown

📌 项目名称:MarkItDown — 微软的文档转 Markdown 工具

🔗 GitHub 链接:https://github.com/microsoft/markitdown

⭐ 10.8w stars

MarkItDown是一个全能的文档转markdown工具,来自微软 AutoGen 团队,之前我记得也介绍过一次。

MarkItDown 做的事情非常聚焦:把各种文件格式转成 Markdown。PDF、Word、Excel、PowerPoint、图片、音频、HTML、EPUB、YouTube 链接……基本上你能想到的格式它都支持。

为什么要把文件转 Markdown?因为现在主流大模型都非常依赖Markdown,用 Markdown 喂给它们效果最好,而且 token 消耗也最省。所以这个工具本质上是打通了”你的文件”和”AI 能理解的内容”之间的桥梁。我相信经常用AI的朋友都会有这个感觉。

MarkItDown安装事后要注意,需要Python 3.10 以上,然后克隆项目并pip install -e去安装依赖。之后一行命令就能用:markitdown 文件名.pdf,输出就是干净的 Markdown 文本。还支持图片 OCR、音频转文字、YouTube 字幕提取。

在最近的更新里,它还提供了 MCP Server,这样就可以和你自己的AI工具,比如Claude code很容易的集成了。

除了命令行,还有 VS Code 插件,右键点一下就能转。说实话,这种工具虽然不起眼,但日常用起来是真的方便,尤其是做 RAG 或者需要批量处理文档的场景。


5. QMD

📌 项目名称:QMD — 轻量本地搜索引擎

🔗 GitHub 链接:https://github.com/tobi/qmd

⭐ 2.1w stars作者:Tobi Lütke(Shopify 创始人)

QMD 是一个完全在本地运行的 CLI 搜索引擎,专门用来搜索你的 Markdown 文档、知识库、会议记录这些东西。它结合了 BM25 关键词搜索、向量语义搜索和 LLM 重排序三路技术,全部跑在本地。

这个项目的作者来头不小——Tobi Lütke,Shopify 的创始人兼 CEO。他平时用大量 Markdown 文件记录笔记、会议纪要和文档,找不到东西的时候就开始自己造工具,于是就有了 QMD。

最近QMD火起来还有一个助推者,就是openclaw,因为openclaw的记忆模块里,默认的本地搜索引擎是QMD,如果开启过它的高级搜索应该会知道。

使用上也比较容易上手,npm install安装,然后添加要索引的目录,生成 embeddings,然后就可以搜索了。支持普通关键词搜索、语义搜索、以及混合+重排序的 query 模式。还提供了 MCP Server,可以跟 Claude Desktop 和 Claude Code 集成。

我觉得这个项目最有意思的地方是它体现了一个理念:AI 时代,每个人都需要一个”给自己的搜索引擎”。


one more thing

最后分享 2 份资料。

第一份是《具身智能数据行业研究白皮书》,具身智能可以说是人工智能与机器人技术交叉融合的前沿领域,它也是人们对实现AGI的一种期许,这个东西看得到的是机械,而看不到的背后需要大量的数据进行训练。

第二份是《2026年轻人智能家电消费洞察》,这是B站和益普索出的报告,现在年轻人不断成长,现在消费结构正在经历一场变革,更主动、更精明,追求品质与个性,可以看看现在年轻人的智能家电消费情况。

有需要的可以告诉我,以上就是本周的全部内容,那我们下次再见。


1、项目名称:andrej-karpathy-skills — Karpathy 亲授的 Claude Code 使用秘籍

GitHub 链接:https://github.com/forrestchang/andrej-karpathy-skills

2、项目名称:Multica — 把 AI Agent 变成真正的队友

GitHub 链接:https://github.com/multica-ai/multica

3、项目名称:VoxCPM2 — 新一代 TTS 模型

GitHub 链接:https://github.com/OpenBMB/VoxCPM

4、项目名称:MarkItDown — 微软出的万能文档转 Markdown 工具

GitHub 链接:https://github.com/microsoft/markitdown

5、项目名称:QMD — Shopify 创始人做的本地搜索引擎

GitHub 链接:https://github.com/tobi/qmd


1、项目名称:andrej-karpathy-skills — Karpathy 亲授的 Claude Code 使用秘籍

2、项目名称:Multica — 把 AI Agent 变成真正的队友

3、项目名称:VoxCPM2 — 新一代 TTS 模型

4、项目名称:MarkItDown — 微软出的万能文档转 Markdown 工具

5、项目名称:QMD — Shopify 创始人做的本地搜索引擎

ARR (All Rights Reserved)