模型能力评估基准是指用于系统衡量人工智能模型 […]
人类评估(Human Evaluation) […]
CIDEr分数(Consensus-base […]
METEOR分数(Metric for Ev […]
ROUGE分数(Recall-Oriente […]
BLEU分数(Bilingual Evalu […]
Perplexity(困惑度)是自然语言处理 […]
生成模型评价指标是用于量化评估生成式人工智能 […]
内容审核,亦称内容审查,是指在数字平台中对用 […]
事实核查(Fact-checking)是一种 […]