软件测试(Software Testing):用于评估软件质量和功能的过程,包括单元测试、集成测试和系统测试等。 数据库(Database):用于存储和管理数据的系统,常见的数据库包括MySQL、PostgreSQL和MongoDB等。 服务器运维(Server Administration):负责管理和维护服务器的工作,包括安装、配置和监控服务器等。
Software testingNatural Language Processing (NLP)Systematic literature mappingSystematic literature reviewContext: To reduce manual effort of extracting test cases from natural-language requirements, many approaches based on Natural Language Processing (NLP) have been proposed in the literature. Given the ...
今天分享一篇ACL 2020的paper(怀旧老番),这也是一个AI Testing的经典work,将Software Engineering的insights引入了NLP领域,截至到写这篇分享时已经有近1000 cites。我觉得这是一篇非常好的SE4AI的例子,也是…
Software testing is an important and cost intensive activity in software development.The major contribution in cost is due to test case generations.Require... A Mustafa,WK Wan,N Ibrahim,... - 计算机,材料和连续体(英文) 被引量: 0发表: 2021年 A Systematic Literature Review on Regression Test ...
用于评价的统计检验 (Statistical testing for evaluation) (二十)语义学:词汇层面 (Semantics: Lexical) 一词多义 (Polysemy) 词汇关系 (Lexical relationships) 文本蕴含 (Textual entailment) 语义合成性 (Compositionality) 多词表达 (Multi-word expressions) ...
先行词消歧(anaphora resolution): 这个方向研究如何在文本中确定一个代词或指示代词指代的是什么。 共指消歧(coreference resolution): 这个方向研究如何在文本中确定两个或多个名词指代的是同一个实体。 连接消歧(bridging resolution): 这个方向研究如何在文本中确定一个名词指代的是什么,特别是当这个名词在文本中并...
5. 大型语言模型(LLMs)的出现为NLP在同行评审中的应用带来了新的可能,但同时也引发了关于自动化评审...
用于评价的统计检验 (Statistical testing for evaluation) (二十)语义学:词汇层面 (Semantics: Lexical) 一词多义 (Polysemy) 词汇关系 (Lexical relationships) 文本蕴含 (Textual entailment) 语义合成性 (Compositionality) 多词表达 (Multi-word expressions) ...
用于评价的统计检验 (Statistical testing for evaluation) (二十)语义学:词汇层面 (Semantics: Lexical) 一词多义 (Polysemy) 词汇关系 (Lexical relationships) 文本蕴含 (Textual entailment) 语义合成性 (Compositionality) 多词表达 (Multi-word expressions) ...
Behavioral Testing of NLP Models with CheckList!也即用CheckList对NLP模型做行为测试。 上图是论文一作Marco Tulio Ribeiro在大会上做的展示,我们以此展开对CheckList的介绍。 1、We should test NLP models 训练NLP模型的主要目标之一是泛化,虽然Accuracy是评价泛化的主要方法,但它往往高估了NLP模型的性能,用于评估模...