
前沿资讯
1723283664更新
0
智谱AI推出的GLM-4-long模型是一款专为处理超长文本和记忆型任务设计的200万字长文本模型,现已在智谱AI开放平台BigModel上开放API调用。
GLM-4-long模型支持高达1M(约150-200万字)的上下文长度,相当于大约两本《红楼梦》或者125篇论文的容量,能处理非常长的文本数据,并且具备复杂的推理任务能力。开发团队采用了一些关键技术,比如逐步扩展模型的上下文长度,从4096逐步训练到1M,并使用batch sort方法和指令合成数据来提高训练效率。性能指标方面,输入50万字时首次响应时间约为50秒,输入100万字时首次响应时间约为140秒,输入150万字时首次响应时间约为280秒。
GLM-4-long的应用场景非常广泛,包括长文本分析、文档摘要生成、信息检索、自然语言推理以及内容创作辅助等。例如,它可以处理和分析长达数万字的文本,适用于需要深入理解大量文本数据的场景,如学术论文、法律文件、历史文献等的分析和总结。此外,GLM-4-long还能生成简洁且包含关键信息的摘要,快速定位并提取大量文档中的特定信息,处理复杂的逻辑关系和推理任务,以及在创作长篇文章、故事或剧本时提供创意支持和写作建议。
智谱AI开放平台提供了统一的API接入,开发者可以通过该平台利用GLM-4-long模型的技术潜力,创造多样化的智能应用。平台还支持开发者整合特定领域的专业知识,开发符合特定需求的智能解决方案,并提供了互动体验平台和全面的基础服务,包括API密钥管理与财务管理工具,确保开发过程的便捷与安全。
2024年1月,智谱AI发布了全新自研的第四代多模态基座大模型GLM-4系列,性能全面提升接近60%,模型性能直接逼近GPT-4,尤其是中文能力可比肩GPT-4。GLM-4模型系列具备强大的多模态能力,能够处理文本、图像、音频等多种模态的数据,非常适合跨媒体信息处理和交互。
智谱AI由清华大学计算机系知识工程实验室团队2019年创立,致力于AI大模型的研发和应用落地。在商业化方面,智谱AI已经与2000多家合作伙伴建立了合作关系,其中包括200多家企事业单位,涵盖了金融、能源、制造等不同行业。截至2024年1月,该公司已完成四轮融资,估值达到200亿元人民币,成为国内AI领域的独角兽企业。