GitHub Deep Search

用一句产品想法，真实搜索 GitHub，判断哪些开源项目值得复用、借鉴或避开。

上图来自一次真实本地运行，不是内置 Demo、不是预置报告、不是假仓库排行。

它解决什么

你原本要手动做的事	GitHub Deep Search 做的事
在 GitHub 反复换关键词	把自然语言需求拆成结构化搜索角度
点开仓库看 README 和源码	采集 README、文件树、关键源码路径证据
判断项目能不能复用	输出匹配理由、差异、缺口和风险
估算一次调研花了多少成本	展示 GitHub 请求数、LLM tokens 和可选美元估算

15 秒看懂

我想做一个浏览器插件，可以总结网页内容，并把摘要同步到 Notion。

输出块	你会看到什么
Top 项目	最相关仓库、star、更新时间、关联度
复用判断	直接可用 / 参考项目 / 相邻参考
证据来源	README、源码、路径、Topic、Issue 线索
差异缺口	缺什么、哪里不匹配、需要改造什么
消耗记录	本次 GitHub 请求数、LLM 输入/输出 tokens

一分钟跑起来

Clone 后进入项目目录，只需要这一行启动 Web：

python scripts/start_web.py

启动器会自动创建 .venv、安装依赖、创建 config/user_keys.env，然后启动 Web 服务。打开终端输出的地址，通常是 http://127.0.0.1:8001。

真实运行效果

项目	本次真实记录
查询	`Find an open-source Python terminal UI library that supports tables, progress bars, markdown rendering, and rich text styling.`
Top 结果	`Textualize/rich`
报告消耗	输入 `38,236` tokens，输出 `3,386` tokens
完整记录	docs/REAL_RUNS.md

查看完整截图

API Key 与消耗

没有 key 可以打开界面，但不会得到可信的真实调研报告。

GITHUB_TOKEN=your_public_read_token
LLM_API_KEY=your_openai_compatible_key
LLM_BASE_URL=https://api.openai.com/v1
LLM_MODEL=your-model-name
TAVILY_API_KEY=

Key	是否必需	用途
`GITHUB_TOKEN`	基本必需	提高真实 GitHub 搜索额度，建议只授予公开仓库只读权限
`LLM_API_KEY`	必需	需求解析、查询规划、项目比较、最终报告
`TAVILY_API_KEY`	可选	Web 交叉验证和补充发现

Web 默认使用 detailed + continue，优先保证召回质量。

模式	GitHub 请求上限	候选项目上限	Tavily 上限	典型 LLM tokens
`standard`	40	30	最多 4 credits	15k-45k
`high`	72	54	最多 4 credits	30k-80k
`continue`	92	69	最多 4 credits	40k-110k

查看美元估算配置

LLM_INPUT_USD_PER_1M=0
LLM_OUTPUT_USD_PER_1M=0
TAVILY_USD_PER_CREDIT=0.008

input_tokens / 1,000,000 * LLM_INPUT_USD_PER_1M
+ output_tokens / 1,000,000 * LLM_OUTPUT_USD_PER_1M
+ tavily_credits * TAVILY_USD_PER_CREDIT

价格和限额会变化，批量运行前请以自己的服务商控制台为准。

为什么不是普通搜索

自然语言需求
=> 结构化 SearchSpec
=> GitHub repo / code / topic / issue 搜索
=> README、文件树、关键源码证据采集
=> 证据覆盖排序
=> 项目对比报告

普通 GitHub 搜索容易漏掉 README、代码路径、Issue 和 Topic 里的线索。直接问 LLM 很快，但常见问题是结果过时、证据不足、把“看起来像”的项目说成可用。

信任边界

不做什么	为什么重要
不内置 Demo 报告	首次体验不会被预置结果误导
不内置假仓库、假排行或 seeded result data	排名来自当前输入和实时 provider 响应
不使用静态产品同义词表、业务关键词包、仓库白名单或黑名单排序捷径	搜索语义必须来自当前需求和真实仓库证据
测试夹具不会被 Web、CLI、MCP server 或搜索引擎运行时加载	测试数据不会混入真实运行

每份真实报告都来自当前用户输入、实时 provider 响应、仓库证据和配置的 LLM。

CLI

python -m github_deep_search "找一个可自部署的 AI Agent 可视化工作流编排工具，最好有插件机制"
python -m github_deep_search "your requirement" --mode detailed --format markdown
python -m github_deep_search "your requirement" --budget high --format json
python -m github_deep_search "your requirement" --budget continue --format json

Docker

docker compose up --build

然后打开 http://127.0.0.1:8001。

Web 体验

能力	状态
一行命令启动	已支持
API key 配置状态提示	已支持
解析、搜索、证据采集、分析、报告生成进度	已支持
复制 Markdown、下载 JSON	已支持
MCP tool	已支持

项目状态

这是一个早期开源原型，目标是让产品想法和技术选型阶段的 GitHub 调研更快、更有证据感。后续会继续围绕召回质量、报告可读性和成本控制迭代。

Roadmap: docs/ROADMAP.md

MCP

pip install -r requirements-mcp.txt
python -m github_deep_search.mcp_server

MCP tool 名称：github_deep_search。

测试

pip install -r requirements.txt
pytest -q
python -m compileall github_deep_search tests

Web 渲染回归：

pip install -r requirements-e2e.txt
python -m playwright install chromium
pytest -q -m e2e

Live eval 默认跳过：

$env:RUN_LIVE_EVAL = "1"
pytest -q -m live

贡献

欢迎提交真实搜索 miss、复现 query、UX 反馈、Provider 兼容性修复和聚焦的 PR。请先阅读 CONTRIBUTING.md。

如果这个项目帮你节省了调研时间，给一个 star 会让更多正在做产品想法验证的人看到它。

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.github		.github
config		config
docs		docs
github_deep_search		github_deep_search
scripts		scripts
tests		tests
.dockerignore		.dockerignore
.env.example		.env.example
.gitattributes		.gitattributes
.gitignore		.gitignore
CONTRIBUTING.md		CONTRIBUTING.md
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
docker-compose.yml		docker-compose.yml
pytest.ini		pytest.ini
requirements-e2e.txt		requirements-e2e.txt
requirements-mcp.txt		requirements-mcp.txt
requirements.txt		requirements.txt
run_web.py		run_web.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

GitHub Deep Search

它解决什么

15 秒看懂

一分钟跑起来

真实运行效果

API Key 与消耗

为什么不是普通搜索

信任边界

CLI

Docker

Web 体验

项目状态

MCP

测试

贡献

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

GitHub Deep Search

它解决什么

15 秒看懂

一分钟跑起来

真实运行效果

API Key 与消耗

为什么不是普通搜索

信任边界

CLI

Docker

Web 体验

项目状态

MCP

测试

贡献

About

Topics

Resources

License

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages