想做语音AI应用?谷歌Gemini 3.1 Flash Live来了,延迟更低、噪音过滤更强、上手超简单
Google最新发布的Gemini 3.1 Flash Live彻底颠覆了传统语音交互体验,将响应时间压缩至150毫秒以内,在嘈杂环境中仍保持90%以上的识别准确率,原生支持90多种语言。
工具推荐
官方API太贵?普通人用不起?全网免费 AI API 汇总,这篇文章拯救你的钱包
26 个免费 AI API 平台,100+ 可用模型,亲测手把手教学,一分不花搞定 AI 开发。
阿里开源CoPaw,脚踩Openclaw,可「白嫖」英伟达免费API,“免费的”,就问你用不用?
OpenClaw爆火但配置劝退、API太贵、飞书钉钉还不好使?阿里开源的CoPaw来了——三条命令搞定,NVIDIA免费API随便接入,钉钉飞书QQ原生支持。这才是普通人该用的AI助手。
开源免费!Agent Reach:给AI装上「眼睛」,轻松读取YouTube、Twitter、小红书
一个开源工具,让任何 AI Agent 都能直接读取 YouTube 字幕、搜索 Twitter、刷 Reddit、看小红书——完全免费。
Vercel开源Chat SDK:一套代码,支持六个平台,跨平台机器人开发效率提10倍
Vercel最新开源了Chat SDK。Chat SDK是一个"万能翻译器"和"统一调度中心"的结合体。它让开发者只需要写一套代码,就能同时支持Slack、Microsoft Teams、Google Chat、Discord、GitHub和Linear这六大主流平台。
告别反爬虫噩梦,比传统工具快774倍!Scrapling让AI智能体自由获取网络数据
Scrapling内置的StealthyFetcher可自动绕过所有类型Cloudflare Turnstile验证,无需人工干预。它能模拟真实浏览器指纹特征,让网站把你当成普通用户。传统方案需要手动配置代理、轮换IP、与验证码斗智斗勇,而Scrapling装上就能用,隐身模式全自动。
谷歌发布Lyria 3音乐生成模型:支持多模态输入与SynthID水印验证
谷歌在其AI助手Gemini中正式推出最新高保真音乐生成模型Lyria 3 Beta版,支持用户通过文字、图片或视频输入快速生成30秒高品质原创音轨。
月之暗面推出Kimi Claw,一键部署OpenClaw,5000+技能即调即用
月之暗面(Moonshot AI)正式发布Kimi Claw Beta版本,这是一款原生集成于kimi.com的云端AI智能体服务。该产品无需服务器配置,用户通过浏览器即可拥有24小时在线的个性化AI助手。
京东开源JoyAI-LLM Flash:480亿参数,30亿激活,推理吞吐量提升1.7倍
京东开源发布JoyAI-LLM Flash混合专家模型,总参数480亿、激活参数30亿,在代码生成和智能体任务上优于同级别竞品,但基准测试数据尚未经过第三方独立验证。该模型提供vLLM和SGLang两种部署方案,可通过京东云API调用。
MiniMax M2.5发布,追平Claude Opus 4.6,价格便宜十倍
MiniMax 发布了最新的 M2.5 模型。
GLM-5发布:智谱AI新一代旗舰模型,开源Agent的转折点,能直接生成Word/Excel
智谱AI正式发布GLM-5,这是其截止目前规模最大的开源模型,参数总量达744B(活跃参数40B),预训练数据从23T提升至28.5T tokens。
Obsidian推出CLI工具,Claude等Agent工具可直接调用,这不起飞了!
Obsidian 正式推出 CLI 工具,这对于所有用它构建个人知识库的朋友来说是个大消息。更重要的是,它解决了 AI Agent 工具无法直接操作本地笔记的痛点。
Claude Code还被困在终端?这个开源项目把它“解放”到了浏览器
The Vibe Companion,并没有造一个新 Agent,而是做了一件更重要的事:把 Claude Code 变成一个人类可控、可视、可恢复的工具。
OneContext:AI编程助手的「记忆胶囊」,让代码协作像发链接一样简单
OneContext,它被称为「AI Agent 的自管理上下文层」,能让你的 Claude Code、Codex 等编程助手跨会话、跨设备记住一切,甚至可以通过链接分享上下文,让别人直接接手你的工作。
Anthropic旗舰模型Claude Opus 4.6发布,1M上下文时代到来,能否成为开发者新标配?
Anthropic 发布了全新旗舰模型 Claude Opus 4.6,在编程、推理和长上下文处理方面实现了显著突破。