数据不离硬盘、还能总结播客?开源笔记工具Open-Notebook,让NotebookLM不再是唯一选择

工具推荐 1780972761更新

0

我最近在琢磨一件事。

Google 的 NotebookLM 确实挺好用的,这点得承认。上传个 PDF 或者丢个 YouTube 视频进去,它能自动处理,然后你就能跟它聊天、让它总结、生成播客,体验做得相当顺滑。

但,每当我要把含有敏感信息的文档传上去的时候,心里总有那么一点点不舒服。

不是我不信任 Google 的安全措施,而是,有些东西它就是不应该离开你的硬盘。

你有没有这种感觉?

这其实是个挺普遍的需求。

研究者手上有还没发表的论文,涉及未公开的实验数据。创业者有产品战略文档,内部还没过会。内容创作者有大量素材,有些可能是付费内容,不能随便上传到第三方服务器。

对这些人来说,用 AI 笔记工具最大的障碍,不是功能够不够强,而是总觉得数据不够安全。

那问题就来了,有没有一种方案,既能保留 NotebookLM 这种流畅的 AI 交互体验,又能把数据留在本地?

还真让我找到了。

这个项目叫 Open Notebook,GitHub 上能搜到,地址是 github.com/lfnovo/open-notebook

一句话概括:这是一个开源的隐私优先的 AI 笔记工具,目标是成为 NotebookLM 的替代品,数据完全在你自己的掌控之中。

它的 slogan 很直接——"An open source, privacy-focused alternative to Google's Notebook LM"。翻译过来就是:一个开源的、注重隐私的 NotebookLM 替代品。

那它具体是做什么的?

你可以把它理解为一个本地部署的 AI 研究中心。你上传 PDF、视频、音频、网页,它帮你处理干净,然后你可以跟它聊天、让它总结内容、把内容转化成播客、还能跨笔记本搜索。

你的所有资料都在你自己的服务器上,AI 模型只是调用外部 API,数据不会经过第三方。

这个项目支持 18 个模型提供商,基本上你听过的全涵盖了,而且还有个"OpenAI Compatible"的选项,意味着任何兼容 OpenAI API 格式的 endpoint 都能接进来,包括那些本地部署的模型。

不过这里有个细节值得注意,这 18 个提供商并不是"平等"的。有的只支持 LLM(文本对话),有的只支持 TTS(语音合成),有的只支持 STT(语音转文字)。举个例子,ElevenLabs 只做 TTS,Deepgram 只做 STT。如果你想要完整功能(聊天 + 搜索 + 播客),OpenAI 是最省心的选择。

还有个细节挺有意思的,它用的是 Esperanto 这个库来做多模型支持的。

这个库的定位是一个轻量级的统一 AI 接口。你可能听说过 LangChain 做 AI 集成的思路,但 Esperanto 走的是完全不同的路线,它直接通过 HTTP 调用各家的 API,不依赖那些笨重的官方 SDK,所以性能更好、依赖更少。而且,切换 provider 的时候代码不用改,一套接口全搞定。

在 AI 编排层面,项目用的是 LangChain——负责 RAG(检索增强生成)、分块(chunking)、embedding 等工作。简单说:Esperanto 负责"怎么把请求发出去",LangChain 负责"怎么处理你的数据"。

这个项目支持的 Content 类型也值得说一下。

PDF,没问题(但如果是纯扫描件没有文字层,处理能力会大打折扣)。YouTube 视频,可以,丢链接它会尝试提取字幕(依赖视频本身开启了字幕,如果没有字幕或者视频年龄限制就处理不了)。网页,没问题,支持 URL 抓取(但复杂 JS 渲染的页面可能失败)。音频文件,支持常见格式。Office 文档,Word、PPT 这些也能处理。

对比一下的话,NotebookLM 支持的它基本都支持,甚至有些格式 NotebookLM 还不支持。

还有一个我个人比较感兴趣的功能——播客生成。

你可以选择 1-4 个发言者,每个发言者可以设置声音、性格、口音和专业知识,然后它会自动生成播客脚本和音频。

说实话这个功能在内部 demo 演示的时候特别有用,让 AI 播客帮你过一遍文档,比自己看文字稿有意思多了。

但有一点得提前说清楚——播客涉及到语音合成(TTS),这个是要花钱的。ElevenLabs 质量最好但也最贵,Google TTS 便宜很多,如果你实在不想花钱,项目也支持本地 TTS,但效果就"基本是机器人声"。另外,生成一次播客大概需要 10-20 分钟,不是实时的。

部署的话,项目本身是 Docker 优先的设计,文档里最推荐的安装方式就是一条命令 docker compose up -d 搞定。

然后访问 localhost:8502 就行。

不过有几个前提你得知道:

  1. 你得自己准备 AI 的 API Key。项目本身不提供 AI 能力,它只是个中间层,把你的 AI API 聚合起来,提供统一的笔记和聊天界面。
  2. Docker Desktop 必须运行着。在 Windows 上这意味着 Docker Desktop 要常驻后台。
  3. 如果你在国内,首次启动可能会遇到网络问题——pip 下载超时、容器起不来。文档里有解决方案,换清华镜像就行。

整体用下来,我的感受是,这个项目是认真的。

不是说它已经完美了,但它在解决一个真实存在的问题:对隐私有要求的用户,也想要一个类似 NotebookLM 的体验。

如果你正好是那个「对隐私有要求但又想要 NotebookLM 体验」的人,这个项目值得一试。

尤其是如果你本地有 Ollama 环境的话,基本上零成本就能用上。

项目地址再发一遍:github.com/lfnovo/open-notebook

文档写得很详细,英文阅读无障碍的话可以直接看官方文档,遇到问题 Discord 社区也挺活跃的。

对了,如果你部署过程中遇到问题,文档里的 Troubleshooting 部分值得仔细看看。我扫了一眼,常见的坑基本都有覆盖。