词项

  • 奥卡姆和布列丹对指代划分的比较
    语言讨论命题中的词项与其所指对象的关系的理论。在中世纪,许多逻辑学家提出指代理论并对指代做出详尽的划分,并且不同的学者有不同的观点。威廉·奥卡姆和琼·布列丹是中世纪重要的逻辑学家,“中世纪晚于奥卡姆的最著名的逻辑学家大概只有布列丹(1300-1358)一位”[1]。作为奥卡姆的追随者,布列丹也是一名唯名论者。布列丹在许多逻辑学的研究领域都颇有建树,诸如命题的真值条件理论、推论理论和悖论等,虽然布列丹对指代也有详尽的论述,但是他的指代理论并没有超越奥卡姆,两

    科学咨询 2022年19期2022-11-24

  • 基于语料库的大学英语近义动词语义韵研究
    被发现的,英语中词项的搭配行为显示着一定的语义趋向,靠人的知觉难以察觉语义韵的存在[1]。语义韵是指一定的词项会习惯性地吸引某一类具有相同语义特征的词项,这些搭配词项在文本中高频共现,使整个语境中弥漫了某种语义氛围[2]。语义韵分为积极语义韵或褒韵(favourable prosody)、消极语义韵或贬韵、中性语义韵或混合语义韵(mixed prosody)三类。各种语义氛围均通过核心节点词与周围搭配词项来体现[3]。语义韵的研究可以采用定位检索软件Ant

    晋中学院学报 2022年4期2022-06-28

  • 正式性的测量方法和描写路径*
    性、实证的方法把词项(lexical item)归入各正式性层次(Rickford&McNair-Knox 1995:265),进而指导语篇正式性的功能描写成为一个难题(Heylighen&Dewaele 1999;Li et al.2016)。第一,如何用客观数据和主观直觉相平衡的方法(Halliday 2004:23-24;Sinclair 2004),把词项归入各正式性层次,进而评测语篇正式度?从研究现状看,直觉和数据两种取向各自为政。前者多从研究者

    外语研究 2022年2期2022-05-31

  • 奥卡姆和柏力对简单指代划分的比较*
    语言讨论命题中的词项与其所指对象的关系的理论。在中世纪,许多逻辑学家提出指代理论并对指代做出详尽的划分。威廉·奥卡姆(William Ockham)和瓦尔特·柏力(Walter Burley)是中世纪同时代重要的逻辑学家,对简单指代都做出了较为详尽的论述。但是,他们对简单指代的定义和划分存在差异,通过比较可知,较之柏力,奥卡姆对简单指代的划分则更加明确,笔者将进一步探究产生差异的原因。一、简单指代的定义奥卡姆在《逻辑大全》中把简单指代定义为:“当一个词项

    苏州科技大学学报(社会科学版) 2022年5期2022-03-15

  • 论指代的作用
    《逻辑大全》上篇词项理论部分对指代做出了详尽的说明,提出著名的指代理论。指代理论是讨论命题中的词项与其所指对象间关系的理论,在这一理论中,中世纪的逻辑学家们说明了命题中的词项以什么样的规则标准代表其所指对象。我们在清楚地把握指代理论①的基础上不禁要问:指代有什么作用?中世纪指代理论受到西方学者的广泛关注,概括来讲,西方学者主要从两个方面来探讨指代的作用。一方面,人们普遍认为指代的作用是在命题中精确地使用概念、语词,避免诡辩;另一方面,中世纪逻辑学家们提出指

    信阳师范学院学报(哲学社会科学版) 2022年2期2022-03-03

  • 一种基于多任务学习的方面级情感分析方法
    ysis)和方面词项情感分析ATSA(Aspect Term Sentiment Analysis)两个子任务。对于ACSA,上述细粒度情感分析定义中的“评论对象”指的是方面类别词;对于ATSA,其中的“评论对象”指的是方面词项。ACSA任务例如:“The boiled fish is delicious, but the price is too expensive.”,boiled fish对应的food类是积极的情感极性,而price对应的price

    计算机应用与软件 2022年2期2022-02-19

  • 模态语境下的指称暧昧问题及其解决
    昧是指如下情形:词项的指称在普通语境下原本非常明确,但在模态语境下却会变得游移不定,可能指称这个对象,也可能指称另一个对象,用蒯因的话说就是变得“暧昧”。指称暧昧会导致在正常语境下为真的命题,在模态语境下却为假,具体表现为两种失效:单独词项同一替换原理失效和模态表达式量化存在概括原则失效。同一替换原理是指“给定一个关于同一性的真陈述,可以用它的两个词项中的一个替换另一个出现在任一真陈述中的词项,而其结果将是真的”[2]129,是支配同一性的基本原理之一。但

    北京印刷学院学报 2021年7期2021-08-13

  • 形式逻辑学中的概念与词项辨析
    式逻辑学中概念—词项部分的理论存在诸多问题。概念与词项的混用现象严重,内涵与外延的说明有失偏颇,概念或词项的语言学内涵式分类显得多余,定义的方法始终存在理论缺陷。而在形式逻辑当中讨论概念是否恰当?对此,可以在确立词项而非概念作为形式逻辑研究的基本对象的基础上,肯定一切词项的外延与其内涵具有同等程度的“存在”,不主张对词项从内涵层面进行分类,对定义方法的正当性继续存疑。这些问题本来不必成为形式逻辑的问题,事实却是被当作形式逻辑的问题进行说明。[关键词]概念;

    大学教育 2021年2期2021-03-08

  • 上古“问”类词义 场特征及其历时演变
    问”类义场的主要词项:问、谘、询、讯1、讯2、诘、访、谋。文章对上古文献中“问”类语义场各词项进行全方位的测查、归纳和整理,考察分析该义场各词项的异同及其历时演变并探讨变化的原因。研究发现,该语义场上古前期词项丰富而后期词项减少。词义的变化不仅仅是其自身发展的结果,还常常是由于处于聚合关系或组合关系中受到其他词语的变化影响所致。[关键词]“问”类动词;语义场;词项;组合关系;聚合关系[中图分类号]H13   [文献标志码]A    [文章编号]2095-0

    哈尔滨师范大学·社会科学学报 2021年6期2021-03-04

  • 上古“问”类词义场特征及其历时演变
    还是对义场内各个词项的义位变化以至于义场演变的研究,尤其对常见词项演变轨迹的追寻以及词义引申规律的探求,我们都会用到语义特征分析法。根据语义特征的有无和组合来进行义场归纳以及研究义场之间的联系,也根据语义特征的差别来进行义场内部的比较,从而描写岀“问”类动词范畴的意义系统,同时进行纵向的演变规律的探讨。当然,对上古词语的语义特征分析,我们要借助于训诂学的优秀成果,“词以类分,同类而聚集,这就是一种聚合,因而,在早期训诂材料的纂集里,就已经存在着西方语义学所

    哈尔滨师范大学社会科学学报 2021年6期2021-03-02

  • 隐喻理论在词项习得中的应用
    以期将隐喻理论在词项(lexical items)学习中得到应用,并进一步应用于外语的教学过程。【关键词】隐喻;认知隐喻;词项;外语教学在学习一门外语的过程中,学习者将遇到并且必须克服记忆单词和表达这一障碍。词项的缺乏或词汇量的不足制约了学习者语言能力的提高,另一方面,对词汇认知上的分歧和差异往往会导致母语者和外语学习者之间语言的使用会有间隙。而学习隐喻可能有助于克服或者至少缓解这些困难。隐喻这一概念不仅是一种修辞手段/修辞格,其在本质上与形态学、语义学和

    科学导报·学术 2020年82期2020-11-08

  • Sinclair语料库语言学视阈下的语言教学难题及解决途径
    280)主张“对词项的描述最好采用最大途径,而不是最小途径”。上面提到的词项(lexical items),是贯穿于Sinclair意义单位研究的一个核心概念,他在最早的一篇词汇研究的文章中就提到了词项(Sinclair 1966)。宽泛地讲,一个词项就是一个意义单位,由一个以上的单词共同构成。确切地讲,词项是指一种向心式结构(endocentric structure),包含了两个或多个邻近型符,它们彼此在意义上关联,并由一个单一的核聚在一起,共同构成一

    语料库语言学 2020年2期2020-02-22

  • 基于语料库的英汉近义词语义韵对比研究 ——以ANNOUNCE,DECLARE和宣布为例
    究者所研究的某个词项)总是习惯性地与某类具有相同或相似语义特征的词项共现,构成显著搭配。受搭配词的影响,节点词被‘传染’上了有关的语义特征,在语境内形成一种语义氛围”[2]。在词汇学习过程中,由于近义词在语义上的相似性,总是被等同化,出现近义词替代现象。事实上,近义词仅是在语义上相近,它们在搭配和语义韵方面均存在差别。鉴于此,本研究选取了ANNOUNCE,DECLARE和宣布这三个常见近义词,利用语料库及相关工具,对三者的搭配和语义韵进行分析,比较异同。这

    巢湖学院学报 2019年5期2019-12-10

  • 大数据背景下文档关键词抽取方法的探讨
    的文档集。(2)词项(词组)集为了对N个文档赋予关键词,对所有文档逐一地进行分词。分词是按照一定的规范重新组合成词项的过程。中文分词是文本挖掘基础。对于输入一段中文,成功的中文分词,可以达到电脑可以自动识别语句含义的效果。对所有N的个文档进行分词后,我们获取了“词项(词组)”集合。在这个词项(词组)集合中的每一个词项(词組)可能成为某一文档的关键词。当然,并不是在词项(词组)集合中的词都能称为关键词。一个词项(词组)能不能成为关键词,就要看这个词项(词组)

    新教育论坛 2019年34期2019-09-10

  • 亚里士多德的显示法的扩展应用
    I(2)选取显示词项N,从S中选出N,N满足所有N是P,所有N是R(3)所以有SAP→NAP,SAR→NAR(4)通过换位法NAR→RIN2.2 运用显示法证明第三格OAO(2)选取显示词项N,从S中选出N,使N满足所有N不是P。(3)所以有SOP→NEP,SAR→NAR(4)通过换位法NAR→RIN图4 SEP关系图图5 POS关系图第一个证明的意义不大,只是运用了显示法,但核心的思路还是与亚里士多德书中给出的化归法证明方式相同。第二个证明凸显出了显示法

    海外文摘·艺术 2019年3期2019-05-15

  • 关于信息检索方法的探讨
    索过程。1.1 词项——文档关联矩阵给出搜索词及多个文档,以传统思想进行思考,要得到索引文件,最直接的方即为枚举法,对每个文档进行遍历只对文档中是否存在某一词项进行判断,建立矩阵,以词项为行,以文档为列,记录结果。若存在记为“1”,不存在记为“0”。但词项——文档矩阵的不足之处也是显而易见的,当遍历文档集规模过于庞大时,建立的矩阵可能已经超过所能承载的极限,这种方式显然已经不合适再进行下一步的检索。1.2 倒排索引那么当解决大容量文档集时,需要用到的是倒排

    数码世界 2019年4期2019-05-10

  • 论编辑如何提高逻辑素养
    原因很多,既有对词项概念、词项种类认识不透彻, 也有内容违背逻辑规律、推理违反逻辑规则等。编辑应具备一定的逻辑素养,在逻辑意识和逻辑思维中编辑, 以有效避免逻辑性差错的存在。提高逻辑素养的前提是夯实逻辑知识,在此基础上,于长期的编辑工作中逐步锤炼逻辑能力,使理论与实践相互滋养。【关 键 词】传媒中差错;编辑工作;逻辑因素;逻辑意识;逻辑思维【作者单位】吴键,《南海法学》杂志。【中图分类号】G232 【文献标识码】A 【DOI】10.16491/j.cnki

    出版广角 2018年20期2018-11-16

  • 融合词语共现距离和类别信息的短文本特征提取方法*
    度稀疏的特点。从词项共现角度来看,两个词项的关联性可从词项共现的角度体现,且短文本所包含的词语稀少,两词项之间相隔词项的距离对语义信息的计算也造成了一定的影响;从类别信息的角度来看,特征词在类间的分布以及在类内部文档中的分布情况可以考虑进来进行综合加权。一方面,若特征词在各个类间分布比较均匀,这样的词对分类基本没有贡献,若特征词比较集中地分布在某个类中,而在其它类中几乎不出现,这样的词就能够很好地代表这个类的特征。如何将这种词语的类别信息挖掘出来是至关重要

    计算机工程与科学 2018年9期2018-10-08

  • 基于改进相似度与类中心向量的半监督短文本聚类算法*
    习,提出一种依据词项类别区分能力的强弱,按类别抽取并构建强类别区分度词项集合的策略,并且将其应用到短文本相似性度量方法中,使短文本之间相似性的度量更加有效和准确。同时,提出利用短文本与类中心向量之间的相似程度来决定它们的类别,从而形成基于改进相似度和类中心向量的半监督短文本聚类算法ISaCV(Improved Similarity and Class-center Vector),来提高聚类性能,算法结构如图1所示。Figure 1 Algorithm s

    计算机工程与科学 2018年9期2018-10-08

  • “黄”字职用演变研究
    联系的引申或派生词项。“黄”字在记录形义密切相关的本用词项{黄病之人}的基础上,记录了如下兼用词项。(一)记录词项{黄2},表示“热病、马病”“黄”字的本义词项{黄1}(黄病之人)自然派生出表示“热病”的词项义。由人及马,又可以表示“马病”的词项义,笔者将这两种词项义合并为一项,记作词项{黄2}。(1) 我马玄黄。(《诗经·周南·卷耳》)(2) 岂能然艾灸頞,瓜蒂歕鼻,治黄不差,而卧死儿女手中乎!(《资治通鉴·隋炀帝大业八年》)(二)记录词项{黄3},表示

    安顺学院学报 2018年3期2018-01-01

  • 亨普尔对经验主义意义标准的一种探析 ——从逻辑的观点看
    6,从构成语句的词项、语句间的相互关系及语句系统(科学理论)3个维度对经验主义意义标准重新进行了考察,指出了经验主义意义标准所面临的一些困境。一、语词经验意义刻画的狭隘性和局限性“逻辑实证主义者认为理论名词本身没有意义,因为理论对象纯粹是有用的虚构,但是作为能够使思维经济、方便的概念工具,它们可以从有关观察名词那里获得部分意义。”[3]71在经验主义者当中还存在一种用满足某些特定条件的词项来刻画有意义语词的做法,所谓的特定条件是指这些词项的意义能够通过观察

    重庆理工大学学报(社会科学) 2017年11期2017-12-15

  • 应用于问答系统的Lucene相似度检索算法改进
    行扩展,分析检索词项的语义相似度以及将词项位置关系的特征应用到Lucene中。在Lucene的基础上,对其语义相似度算法进行改进,提出了一种新的语义相似度评分算法。该算法考虑了词项位置关系和语义理解,能够更好地应用于问答系统。实验结果表面,提出的相似度算法能有效地提高自动问答系统的回答准确率。Lucene;相似度;问答系统;语义0 引 言Lucene是用Java语言实现的开放源代码的全文检索引擎工具包,是Apache软件基金会Jakarta项目组下的一个子

    计算机技术与发展 2017年11期2017-11-20

  • 先秦—唐诗歌中“向下看”概念场研究
    向下看”概念场;词项属性分析在先秦—唐诗歌中,表“向下看”概念的词项共19 个,即:临、临睨、览、瞰、下视、下看、俯视、俯察、俯观、俯看、俯览、俯眺、俯临、下见、下瞰、下望、俯望、俯见、俯瞰,它们具有共同的语义属性,均指“施事把目光投向下方”,因此构成了“向下看”概念场。为便于论述,下面从先秦两汉、魏晋南北朝、隋唐三个时期分别阐述“向下看”概念场的发展演变。一、先秦两汉时期先秦两汉时期的诗歌,我们主要以《诗经》《楚辞》和逯钦立辑校的《先秦汉魏晋南北朝诗》①

    贺州学院学报 2017年3期2017-11-07

  • 融合词向量的多特征问句相似度计算方法研究
    词向量距离,结合词项权重、句子长度等因素的问句相似度计算方法。该方法综合考察两个句子的语义信息,句法信息,词的表层信息来测量问句的相似度。实验部分设计四种问句相似度计算方法,结果表明该方法提高相似度计算的准确率。词向量;依存关系;问句相似度;词项权重0 引言常见的句子相似度算法有基于关键词表层信息、基于句法信息以及基于语义信息等的计算模型[1-2]。基于关键词表层信息的方法,考虑了词形、句长、词序等信息,但该方法没有考虑语义、句法信息。同时在关键词抽取过程

    现代计算机 2017年17期2017-08-10

  • 利用主题内容排序的伪相关反馈*
    增加与其语义相近词项的方式,将用户初始查询中未充分表达的内容展示出来。QE按照是否考虑初检结果文档集,分为全局和局部两种技术。在局部QE技术中,按照是否考虑初检结果文档集中与用户查询真正相关的文档,又可以分为相关反馈(relevance feedback,RF)和伪相关反馈(pseudo relevance feedback,PRF)两种方法。RF方法利用与用户查询真相关文档对用户查询进行重构。然而,这种方法要求用户将初检结果标注为相关或不相关,这在用户的

    计算机与生活 2017年5期2017-06-05

  • 形式逻辑教学中需要深究并辨识的几对概念
    。可以从选择集合词项与非集合词项、反對关系与矛盾关系、相容选言命题与不相容选言命题、推理的有效性与真实性等四对非常重要又容易混同的概念加以辨析和探讨,以供形式逻辑课程主讲教师教学时参考。[关键词]形式逻辑;词项;命题;推理[中图分类号] B812 [文献标识码] A [文章编号] 2095-3437(2017)05-0120-03概念是最基本的思维形态,是构成命题和推理的基本单元。在形式逻辑教学中讲概念、讲命题,最终是为了讲推理,以增强学生的推理能力——逻

    大学教育 2017年5期2017-05-10

  • 一种改进的向量空间模型的文本表示算法
    df算法仅考虑了词项特征与文档之间的关系,没有考虑与类别关联性的问题,引入数理统计卡方分布方法,以此改进了tf-idf算法,构成为新算法tf-idf-cθ。该算法将词项的卡方分布值c作为文本表示的一个因子,用该c值来衡量词项在文本类中分布的差异,并且引入词性因子θ,得到改进向量空间模型的表示文本。对改进前后的2个算法进行文本分类实验,结果表明:改进后的算法得到了提升,部分解决了词项特征与类别的关联性。文本表示;向量空间模型;卡方分布;tf-idf近年来互联

    重庆理工大学学报(自然科学) 2017年1期2017-02-09

  • 词项之间的关系在公务员考试中的运用
    学效果。关键词:词项;关系;逻辑普通逻辑学中词项间关系只有全同关系、真包含关系、真包含于关系,交叉关系和全异关系五种。公务员考试中类比推理词项间关系可以涵括为词项间的概念关系、词义关系、相关类关系、逻辑类关系和语法类关系及常识类关系。词项间关系在在公务员考试中的运用主要以类比推理的形式出现,它是根据两个或两类对象有部分属性相同或相似,从而推出它们的其他属性也相同的或相似的推理。类比推理是国家公务员录用考试的必考题型之一,在“行测”中,题型有三种:二项式、三

    东方教育 2016年15期2017-01-16

  • 基于伪反馈的有效XML查询扩展*
    中挑选有用的扩展词项,是解决伪反馈中查询主题漂移的两个重要方面。对此,针对XML(extensible markup language)文档,提出了一个解决框架:一方面,研究了XML伪反馈文档查找方法,在充分考虑XML内容和结构特征的前提下,提出了基于检索结果聚类和两阶段排序模型相结合的高质量XML伪相关文档查找技术;另一方面,针对CO(content only)查询,对词项扩展进行了研究,提出了带结构语义的词项权值计算方法。一系列的相关实验数据表明,所提

    计算机与生活 2016年12期2016-12-19

  • 基于词项关联关系的FCM微博聚类算法
    6133)基于词项关联关系的FCM微博聚类算法程玉胜,黎康,王一宾,任勇(安庆师范大学 计算机与信息学院,安徽 安庆 246133)针对微博内容的稀疏、高维等特征,提出了一种基于词项关联关系的模糊C均值聚类算法。该算法通过挖掘词项间语义的关联程度,将文本特征最大化,并用提前标注部分同类文本的方式来指导模糊C均值算法在初始聚类中心上的选择,从而达到优化效果。实验结果表明,该算法一定程度上克服了微博本身存在的数据稀疏性问题,能高效地进行微博聚类。微博;词项

    安庆师范大学学报(自然科学版) 2016年3期2016-11-01

  • “干”字的职用演变* 1
    在汉语史上记录的词项数量较多,其涉及的字词、义值等关系复杂多变。运用李运富先生的字用学理论,从历时性的角度全面考察“干”字记录的19个词项,分析其本用、兼用、借用的使用职能;通过探讨其职能的扩展和减缩,发现“干”字在先秦时期共出现18个词项,并为后世沿用,只在宋代新增1个词项,表示“关联”义。“干”字的使用职能发展缓慢,具有很强的稳固性,在现代汉语中才出现了大幅减缩和转移的现象。关键词:字用学;“干”字;词项;职能李运富先生强调应立足“三个平面”,建立汉字

    楚雄师范学院学报 2016年1期2016-05-10

  • 基于词重要性的信息检索图模型
    建模中,确定索引词项在文档中的重要性是一项重要内容。以词袋(bag-of-word)的形式表示文档来建立检索模型的方法中大多是基于词项独立性假设,用TF和IDF的函数来计算词项的重要性,并未考虑词项之间的关系。该文采用基于词项图(graph-of-word)的文档表示形式来捕获词项间的依赖关系,提出了一种新的基于词重要性的信息检索图模型TI-IDF。根据词项图得到文档中词项的共现矩阵和词项间的概率转移矩阵,通过马尔科夫链计算方法来确定词项在文档中的重要性(

    中文信息学报 2016年4期2016-05-03

  • 语料库驱动下的外语词汇教学
    词:语料库驱动;词项;建构主义摘要:语料库语言学的研究成果更新了人们对语言本质和语言教学的观念。语料库语言学对语言运用的重视为语言描写带来了概率分布的视角,从而揭示了语言的概率性特点;语言的习语原则以及词项中心语言观推动了对意义单位的认识,并且消除了语言中词汇—语法的二分对立;语料库驱动方法推崇的“探索/描述”法也符合现代教育理论认为的教学的建构主义观点。基于此,语料库驱动下的外语词汇教学体现在教学设计和教学实施两方面。在教学设计上,语料库可以辅助外语词汇

    西南交通大学学报(社会科学版) 2015年4期2016-03-29

  • 文献知识网络的节点度变化对领域热点的影响
    择m个词作为种子词项集A,其中A取训练网络与测试网络中共同拥有的词项,即A∈N1∩N2。在训练网络G1中,以种子集A中的节点为起点提取其间接节点,得到间接节点集C,计算所有关系链(A-Btrain-C)的一个分值SAC,对结果集C按SAC值从大到小排序,取有序结果集CSorted中前L个词项,得到CSorted_TopL={c1,c2,…cL}。在测试网络G2中,以种子节点集A中的节点为起点提取其直接关联节点,得到关联节点集Btest。计算有序结果集CSo

    中华医学图书情报杂志 2016年11期2016-03-25

  • 奥康语言哲学思想解析*
    亚里士多德的古典词项逻辑与斯多亚学派的命题学说完整地带入中世纪。在中世纪后期,古代逻辑理论的相关应用发展到了登峰造极的程度。这种知识工具成为了奥康语言哲学思想发展不可或缺的组成部分。其三,中世纪晚期的思想交锋。奥康时代托马斯的理性主义承认哲学家可以按照自然赋予的理性探索真理,为哲学的解放开辟了道路,深远地影响着中世纪后期经院学者对真理的认识和判断。与奥康同时期的司各脱意志主义强调意志高于理智,但却是在理智所能够提供的范围自由活动,司各脱的归纳科学知识成为了

    武汉理工大学学报(社会科学版) 2016年4期2016-03-15

  • 基于词项语义映射的短文本相似度算法
    方法主要包括基于词项比较的方法和基于HowNet语义词典的方法[7]。因为文本的特征主要是通过词项来反映,因此采用词项比较来量化文本之间相似度是一种常用的方法,诸如提取文本之间共有词项的比例[8]、比较文本之间词项间的逆序关系[9]、统计词项词频填充文本向量度量余弦相似度[10]。这种词项比较方法相对适用于长文本,长文本的信息量能够通过规模较大的词项数量得到较为全面的反映。对短文本而言,通过数量稀疏的词项难以全面地体现短文本的含义,因此衍生出基于HowNe

    计算机工程与设计 2015年6期2015-12-23

  • 一种基于公共词块的英文短文本相似度算法
    词块信息,在基于词项重合的关键词重叠相似度算法基础上,集合公共词块在文本中出现的次序,提出一种利用公共词块作为计算单元的短文本相似度的算法——公共词块相似度算法(common chunks similarity algorithm,CCS)。该算法主要是将两个文本中所有连续出现的相同关键词看做一个词块单元,利用所有公共词块中的关键词计算重叠相似度,并考虑这些公共词块在两个文本中的出现次序对短文本相似度的影响,做加权处理,以提高文本相似度计算的算法性能。1

    重庆理工大学学报(自然科学) 2015年8期2015-08-01

  • 基于词项共现关系图模型的中文观点句识别研究
    篇文档表示成一个词项向量或特征向量。这种文档特征向量的表示方法基于词项间强独立性假设,并未考虑词项词项之间的顺序和依赖关系。在英文观点句识别中,采用基于VSM的有监督机器学习的分类方法可以取得不错的识别性能。然而,由于中文微博、论坛、贴吧等评论信息都是口语化的文本,表达方式多样,而且评论的长度一般有限,这些缺点导致手工构建语法库不仅工作量大,而且与日常口语的表达方式仍然存在差异,采用基于SVM的有监督机器学习方法进行中文观点句识别并不能取得较好的性能。基

    中文信息学报 2015年6期2015-04-12

  • 一种新的微博短文本特征词选择算法*
    合匹配规则,根据词项的TF-IDF、词性与词长因子构造综合评估函数,结合词项与文本内容的语义相关度,对微博短文本进行特征词选择,以使挑选出来的特征词能准确表示微博短文本内容主题。将新的特征词选择算法与朴素贝叶斯分类算法相结合,对微博分类语料集进行实验,结果表明,相比其它的传统算法,新算法使得微博短文本分类准确率更高,表明该算法选取出来的特征词能够更准确地表示微博短文本内容主题。微博短文本;特征词选择;统计与语义信息;词性组合;朴素贝叶斯分类算法1 引言随着

    计算机工程与科学 2015年9期2015-01-09

  • 当代汉语类推词使用情况研究
    有较高的知晓率。词项“X 奴”、“X族”、“X 门”、“X秀”、“低碳X”的知晓率100%;“X霸”、“X 哥”、“X二代”、“山寨X”、“X 团”、“X 套餐”等词的知晓率也很高,均达到了 92.5%;“晒 X”、“X 贴士”、“裸X”等词的知晓率是80%;“X客”、“X 帝”、“X 控”、“雷X”、“X党”等词的知晓率是70%;知晓率最低的词项是“她X”,仅有50%。访谈得知,教师对“房奴”、“上班族”、“艳照门”、“服装秀”、“低碳生活”这些词语非常

    华北水利水电大学学报(社会科学版) 2014年1期2014-12-16

  • 数据源敏感的多源XML 数据相似度量方法*
    发现文本中的相似词项.文献[8]最早提出了利用编辑距离来度量两棵树的相似度.文献[9]提出,两个XML 文档的距离可以通过计算它们的索引树来测定.文献[10]基于文档的分类提出对词项权重进行修正.文献[11]在预处理的基础上,通过建立属性对象表,提出了Max-merge 算法对XML 重复对象进行检测.文献[12]用树编辑距离的上下限优化基于树编辑距离的相似检测算法,降低了相似检测计算的复杂度,提高了运算效率.文献[13]提出了一种递归相似度计算方法计算X

    华南理工大学学报(自然科学版) 2014年7期2014-08-16

  • 语词运用中的逻辑问题
    又都是表达概念的词项,因此,必须明确逻辑概念含义,这是明确语词含义并准确恰当地运用语词的先决条件与基本条件。有时,人们没有真正明确某词项含义,就大胆地运用起某词项来,结果犯了用词不当的错误。例如:(1)我们应当感谢老师对大家无所不至的关怀。(2)在这次烹饪训练班的学习过程中,大大提高我的烤制各种花色面包的技术。例(1)错误地将“无所不至”理解为“无微不至”的意思(实质上是没有真正明确语词的含义),因而犯了用词不当的错误。例(2)没有真正明确“烹饪”这个语词

    语文学刊 2014年4期2014-03-13

  • 基于词项—句子—文档三层图模型的多文档自动摘要
    口大小的方法得到词项间的共现关系,若两个词项同时出现在窗口内,则可以看作这两词项之间有边相连,构建词项的无向无权图,然后采用类似PageRank算法的随机游走方法根据词项顶点的入度和出度计算词项在文档中的权重[13-14]。Rousseau等也是通过同样的方法得到词项的共现关系,同时还根据词项出现的位置关系得到词项间的顺序关系,从而构造出关于文档词项的有向无权图,不同于Blanco等确定边的权重方法,这里的边的权重仅仅由该词项节点的入度数来确定[15]。虽

    中文信息学报 2014年6期2014-02-28

  • 一种基于类别先验信息的问题检索语言模型
    ly)进行一种在词项层次上(at the word level)的简单的线性插值。语言模型建模的方法因其在信息检索中具有非常不错的检索性能,已经成为一个非常具有吸引力的研究方向。因此,在本文中我们将尝试将类别信息融入到一元语言模型的建模过程中。我们的基本出发点是这样的: 同一个词项w在不同的类别中应该具有不同的词项权重。即,一个历史问题Q中的一个词项w在其所属的类别Cat(Q)中应该与该词项在其他类别Cat′(Q)中具有不同的词项权重。例如,词项“Chin

    中文信息学报 2014年4期2014-02-28

  • 搜索引擎用户查询的广告点击意图分析
    [7]发现不同的词项(term)在引发广告点击的可能性上具有特定的差别.例如“数码相机”和“人脑结构”的广告意图是不同的,前者引发广告点击的可能性高于后者.因此,在论文中提出通过词项的点击率来反映这种固有的差别.A.Ashkan等[7]意识到更好地理解用户查询的意图有助于提供个性化的搜索结果并且提高用户满意度,他们利用历史点击信息、查询自身的特征以及搜索结果页的内容分析预测用户查询的商业意图,研究表明将这3 组特征结合起来可以有效检测出用户的查询意图.在国

    哈尔滨工业大学学报 2013年1期2013-09-16

  • 上古“欺骗”类动词的演变规律
    国初期、晚期均有词项进入该义场;有的词项退出,如战国晚期“谖”便退出该义场。但该义场的中坚力量——“欺”和“诈”,一直比较稳定,致使整个义场在上古都处于稳步发展的状态。另外,我们还可以看出,战国晚期是义场内词项比较丰富、发展比较稳定的一个时期。战国中期之前均有不同词项进入义场,而这一时期各个词项在自己特定的位置上体现自己特有的价值,显得井然有序,有条不紊。之所以在战国晚期各词项得到丰富发展,可能是由于战国晚期,社会比较动荡,各种思想剧烈撞击,因此人们也就需

    中国校外教育 2013年21期2013-08-15

  • 网络交际中语气语调运用的性别差异考察
    工智检索通对某些词项进行筛选,穷尽搜索出共61个表示语气语调的词项。去除“哗哗”“唰”“呼呼”(其中的2个)等在聊天过程中用以描述别的事物的拟声词,同时对一些词项进行适当的归并,如将“嗬嗬”合并到“呵呵”(“嗬嗬”共出现1次,众所周知,其意思和“呵呵”一样),合并“呜呜”和“呜”“嗯”和“恩”“嘿嘿”和“嘿”等相同字节不同音节数的语气词或者感叹词,将“啊呀”“哎呀”“唉呀”“哎唷”并为一个统计词项“啊呀”。在分析过程中,我们把所观察的具有语气语调表达功能的

    绍兴文理学院学报(哲学社会科学) 2013年1期2013-08-05

  • 词项语法评析
    50028)引言词项语法(Word Grammar)于20世纪80年代由英国语言学家理查德·哈德森(Richard A.Hudson)创立。国内首位研究该语法的学者杨炳钧(2001)将Word Grammar 译为“词项语法”,本文沿用这一中文译名。词项语法涉及句法学、语义学、形态学、认知语言学、神经语言学、社会语言学、历史语言学以及言语加工等多个学科和研究领域。其理论目标是通过整合语言各方面建立有关语言结构的普遍理论,理论假设是可以像对其他知识和行为进行

    黑龙江教育学院学报 2013年3期2013-05-12

  • 汉语级差词项“一些”的语义-语用解读*
    ,不存在所谓单个词项的默认意义(Sperber&Wilson 1986/1995,Carston 1998);默认论的观点认为级差含义的产生与语言结构密切相关且不依赖语境(Levinson 2000,Chierchia 2004),同经典格赖斯理论划分的意义相比更偏向于语义范畴(Geurts&Pouscoulous 2009)。实际上这两种不同理论都是对语义和语用之间关系的不同解释,但它们大都基于语言学家的内省式分析而难以得到足够的具有实证性质的客观支持。

    外语学刊 2012年6期2012-09-05

  • 基于向量空间模型附加词义特征的句子相似度研究
    关键词权重表示的词项向量,最后通过计算两个句子向量的夹角余弦,得到句子相似度。传统的向量空间模型没考虑到词语的语义,没考虑到词语之间的相似度。论文在向量空间模型的基础上增加了词义特征,通过在传统的向量空间模型中引入词语之间的相似度,从而使计算出的两个句子的相似度分数更加准确。1 向量空间模型在向量空间模型中,把每个句子都表示为一个 n维词项向量的形式,然后在计算两个句子的相似度时,将其转换成向量空间中的向量夹角计算问题。使用向量空间模型计算句子相似度的时候

    成都信息工程大学学报 2012年3期2012-01-05

  • 杜威逻辑体系中的命题理论
    对于命题的构成即词项进行了多方面的阐述。杜威的命题理论为理解逻辑的起源、基础和应用提供了一条值得参考的研究路径。杜威;命题;逻辑杜威对命题的讨论中涉及大量关于传统逻辑理论、形而上学和语言哲学方面的阐述,尤其在对命题分类和组成部分即词项的讨论上提出了与传统逻辑学和现代逻辑学都不太相同的见解。本文拟阐明杜威的逻辑思路,对比现代逻辑学的基本观点,以便更清楚地理解杜威的立场。一、命题的分类在杜威的逻辑体系中,命题和判断都是基于它们在探究活动中的地位和作用来分析的,

    河南科技大学学报(社会科学版) 2012年2期2012-01-04

  • 英语词项搭配范围及可预见度
    郑立信英语词项搭配范围及可预见度郑立信(上海海事大学外国语学院,上海 200135)搭配范围受到词项的语义特征、语义范围、搭配限制、适合性等诸多因素制约;搭配可预见度则受到开放选择原则、成语原则、固化过程、语义韵等诸多因素制约。词项的搭配可预见度在很大程度上取决于词项的搭配范围,两者之间的关联需从多种角度分析考量。搭配范围;搭配可预见度;语义范围;固化过程;语义韵笔者在与朱永生、苗兴伟合著的《英汉语篇衔接手段对比研究》一书第10章中讨论了英汉两种语言中词

    上海理工大学学报(社会科学版) 2011年4期2011-09-26

  • 依据语篇中多层次信息的句法分析方法
    析依据主要是句内词项间的信息,尤其是句内两个直接关系成分间的信息,因此出现许多歧义现象。这种分析的缺陷就是寻找句法分析依据的范围只局限在句内,只局限在一个单一的层次,因此出现不足分析现象。而语言的实际情况是某个词项的句法语义地位在语篇中可能受到各种不同层次的因素的选择限制作用,因此需要依据语篇中多层次的信息进行句法分析,以找出句内词项间句法语义关系上的确定性。语篇 多层次信息 句法分析 方法一、句法分析的目的句法分析主要是确定句内词项间在结构、语义上的关系

    大家 2011年9期2011-08-15

  • 一种改进的Lucene语义相似度检索算法*
    检索,很少有考虑词项语义的Lucene检索研究。此外,对于Lucene词频分析检索函数的性能也很少被讨论。因此,如果能对Lucene的检索函数加以改进的话,则能够有利于各种基于Lucene的应用,如业界广泛使用的开源搜索引擎Nutch[2]。本文基于上述观察,提出了一种结合检索词项语义的检索函数,该函数改进了传统基于词频的方法对语义忽视所造成的检索不够精确的问题,同时也给出了一个初步判定文档相似性的算法。通过这些改进,实验结果表明,对比传统的基于词频的方法

    中山大学学报(自然科学版)(中英文) 2011年2期2011-07-24

  • 基于权重标准化SimRank方法的查询扩展技术研究
    语料资源中挖掘各词项与原始查询之间的某种关联属性,进而选择较好的词项作为扩展词。查询扩展技术的两个关键之处在于扩展资源的选取以及词项间关联属性的挖掘。在扩展词资源方面,大规模真实的搜索引擎日志通常包含了用户的原始查询、浏览页面、点击链接以及对应的时间等非常丰富且有价值的信息,作为扩展资源,其质量相比于传统的伪相关文档更具有优势。同时,在真实的搜索引擎日志中,也包含了大量的噪声数据,因此,需要有效地挖掘词项关联属性以求更好地筛选出与原始查询相关的扩展词项。本

    中文信息学报 2011年1期2011-06-14

  • 论克里普克与普特南自然类词项语义学观之异同
    克与普特南自然类词项语义学观之异同□朱建平 [苏州大学 苏州 215123]虽然哲学家们一直使用克里普克-普特南理论来称谓他们关于自然种类词项的语义学学说,但这是两个很不相同的理论,其差别不仅表现在理论提出的最初动机方面,更体现在理论的最终内容方面。本文的目的不在于详细说明两位哲学家关于自然类词项的理论特点,而是试图对他们关于自然类词项的学说做出应有的区别。自然种类词项;指称;因果的历史说明;本质克里普克(Saul Kripke)和普特南(Hilary P

    电子科技大学学报(社科版) 2011年1期2011-04-01