主持人:韩朋
参会老师:杨矫云
参会学生:赵春阳、程坤、丁会通、郭思伊、哈山、殷越、贵芳
时间:2019年11月13日
本次例会学习讨论了文章:Research On Measuring Semantic Corrrelation Based On the Wikipedia Hyperlink Network.
1、介绍
语义相关计算在自然语言处理领域中占有非常重要的地位,是信息检索、文本分类等相关领域的基础。人们早就认识到,为了更有效地处理自然语言,计算机需要访问大量的常识和特定领域的知识库来获取背景语义知识。作为最大的免费在线百科全书,维基百科不仅是一个庞大的语料库,更是一个有着大量人类背景知识和语义关系的知识库。
这对维基百科的开源数据进行了归一化处理,利用信息挖掘技术和自然语言处理技术提取出含有丰富信息的网络链接,实现了基于语义关联计算应用的智能信息处理。与以往的方法不同,作者在Wikipedia超链接网络中获取语义信息是通过将页面网络和类别网络相结合的方式来计算概念之间的语义相关性,而不是将页面网络和类别网络分开考虑。