Meta 开源水印与污染检测工具 Text Seal
meta ai研究团队近期正式开源了text seal工具包。该工具包专注于为大语言模型(llm)提供两类文本水印能力:生成过程中的实时嵌入与生成完成后的后处理加水印,并支持识别因训练数据污染所引发的“水印放射性”现象。

具体来说,Text Seal隶属于Meta Seal多模态开源水印框架体系,致力于构建高鲁棒性、低感知性的文本水印解决方案。


Text Seal的主要功能涵盖:
- 支持事后水印机制,即对已存在文本调用LLM进行语义保持型重写,并同步集成多种生成时水印技术(如Green-list/Red-list、Gumbel-max、DipMark、SynthID、MorphMark、WaterMax)实现隐蔽嵌入;
- 具备污染溯源能力,通过在模型训练阶段主动注入含水印的基准数据集,再分析模型输出中是否呈现异常水印信号(即“水印放射性”),进而判断训练语料是否存在被污染风险;
- 提供完整的训练支撑模块,适配科研场景下的分布式预训练及监督微调(SFT),并支持可控的数据污染注入实验配置。
开源仓库地址:https://www.php.cn/link/e183dde3c3fa843af4b8882d9edfe2a6
源码下载地址:点击下载
<< 上一篇
网友留言(0 条)