Technology Radar
Published : Sep 27, 2023
NOT ON THE CURRENT EDITION
This blip is not on the current edition of the Radar. If it was on one of the last few editions, it is likely that it is still relevant. If the blip is older, it might no longer be relevant and our assessment might be different today. Unfortunately, we simply don't have the bandwidth to continuously review blips from previous editions of the Radar.
Understand more
Sep 2023
Assess
promptfoo 是一款测试驱动的 prompt engineering。在应用程序中集成 LLM 时,调整提示词为生成最佳回答并保证输出的一致性,往往会耗费大量时间。你可以将 promptfoo 作为 CLI 和库使用,根据预定义的测试用例对提示词进行系统测试。测试用例和结果断言则可通过简单的 YAML 配置文件完成设置。 这个配置文件包含需要测试的提示词、模型提供者、断言以及将会在提示词中被替换的变量值。promptfoo 支持多种断言,包括相等性、JSON 结构、相似性、自定义函数检查,甚至支持使用 LLM 对模型输出结果分级。如果你想对提示词和模型质量进行自动化反馈,请务必体验 promptfoo。