Enable javascript in your browser for better experience. Need to know to enable it? Go here.
发布于 : Nov 05, 2025
Nov 2025
评估 ?

LangExtract 是一个可根据用户定义的指令,使用大型语言模型(LLM)从非结构化文本中提取结构化信息的Python 库。它可以处理领域特定的材料——例如临床记录和报告——并在识别和组织关键信息的同时,让每个提取的数据点都能追溯到其来源。提取的实体可导出为 .jsonl 文件,这是一种语言模型数据的标准格式,并可通过交互式 HTML 界面进行可视化,以便进行上下文审查。我们的团队评估了 LangExtract 在实体提取以填充领域知识图谱方面的能力,发现它在将复杂文档转化为结构化、机器可读的格式方面卓有成效。

Download the PDF

 

 

 

English | Español | Português | 中文

Sign up for the Technology Radar newsletter

 

 

Subscribe now

查看存档并阅读往期内容