初创公司Midpage让律师“调教”AI,效率提升超八成,提示词管理系统立功

工具推荐 1756977320更新

0

在法律科技领域,初创公司Midpage摸索出了一套独特而高效的人工智能开发方法:他们让律师和工程师并肩协作,把专业知识的把关权交给法律专家,实现了AI应用质量和迭代速度的双重提升。

Midpage的定位是通过AI极大提升法律研究和写作的效率,减少法律专业人员的重复劳动。其业务模式基于SaaS订阅,主要服务于律师事务所和法律部门。该公司已完成多轮融资,最新一轮2025年5月获得400万美元种子轮投资,总融资额达620万美元。

Midpage可不是一个简单的法律问答机器人,他们的平台更像法律界的“学术搜索引擎”,律师可以在上面检索案例、查看案例之间的关联、添加批注,整个产品已经部署了10项AI功能和约80个生产级提示词,每一项都针对具体场景做了细致优化。

从摘要生成到案例分类,不同任务对响应速度和准确率的要求各不相同。为此,Midpage几乎为每个功能都选择了不同的大模型,有的任务需要4o-mini这样的轻量模型保证实时响应,有的则依赖Gemini 2.5 Flash提供更深度的分析能力。

而就在两年前,情况还远没有这么顺利。工程师需要花大量时间手动调整提示词,法律专家被隔绝在开发流程之外,每次修改都要重新部署代码,严重拖慢了产品迭代速度。

“我们不可能每次改提示词都让工程师改代码,”Midpage首席执行官奥托(Otto)回忆道,“团队规模小、目标高,必须找到更高效的方式。”

转机来自于他们引入了专业提示词管理工具PromptLayer,并由此建立了一套“律师深度参与”的工作流程。如今,曾担任出庭律师的产品负责人詹姆斯·柯博(James Curbow)全面负责系统中所有提示词的优化,工程师只需完成初始配置,剩下的改写、测试、评估和上线全部由詹姆斯独立完成,再也不用写一行代码。

这样一来,法律专家每周花5-15小时迭代提示词,工程师的监督时间却压缩到不足2小时。既解放了开发资源,也保证了质量的专业把控。

他们的评估流程也极具特色:律师会先整理现实中容易出错的边缘案例,用ChatGPT统一转换成标准格式后,上传到评估系统。之后借助“大模型作为评判者”的模式,用GPT-4o自动对答案进行评分,实时生成准确率和召回率数据。

更关键的是,Midpage设置了自动化“回归检测门禁”,一旦发现新版本效果下降,系统会自动阻止发布,该团队会集中复查差异,这从流程上杜绝了质量倒退。

对于一些特别复杂的任务,仅靠提示词优化还不够,微调模型就成了更好的选择。例如在优化搜索结果解释功能时,团队合成了50-100组训练数据,分别对4o-mini和Gemini 2.5 Flash做了微调,最终在响应速度和智能水平之间找到了更佳平衡点。

回首这两年,奥托坦言:“如果没有现成的工具,我们就得自己从头搭建一整套系统。”从提示词版本管理、评估流程到多模型支持,这些功能缺一不可。尤其是在法律这样高度依赖专业知识的领域,只有让懂行的人亲自上手,才能真正做出可信赖的AI产品。

Midpage的实践表明,将专业判断交给领域专家,用工程化工具保障迭代效率,或许是AI落地关键行业的一条可行路径。

PromptLayer介绍:https://www.jvyan.cn/detail/621?search=PromptLayer

参考资料:https://blog.promptlayer.com/lawyers-in-the-loop-how-midpage-uses-promptlayer-to-evaluate-and-fine-tune-legal-ai-models/;