生成模型评价指标是用于量化评估生成式人工智能 […]
事实核查(Fact-checking)是一种 […]
内容审核,亦称内容审查,是指在数字平台中对用 […]
水印(Watermarking)是一种在数字 […]
内容过滤(Content Filtering […]
偏见检测(Bias Detection)是人 […]
毒性(Toxicity)在人工智能领域,特指 […]
对抗性攻击(Adversarial Atta […]
越狱(Jailbreaking)在人工智能领 […]
模型安全评估(Model Safety Ev […]