内容简介:
《中文领域本体自动构建理论与应用研究》的主要研究内容包括:一是在综合现有本体构建方法和技术的基础上,提出了一种领域本体自动构建分层体系,从而可逐步实现中文领域本体的自动构建,其中包括术语自动抽取、概念抽取、实例学习和分类关系学习和非分类关系抽取等多种关键技术。在对现有本体构建学习方法做大量改进的基础上,完全实现了本体自动构建全过程的无缝集成。二是开发了多语种领域本体自动构建平台GOLF,采用Web文档作为本体学习源,进行了多个领域、多个语种的实验。同时,实现本体自动构建过程中的本体演化管理,并对结果本体进行评价和反馈。三是在领域本体自动构建中引入多策略学习方法,以提高本体抽取的效率和质量。各种学习算法的组合框架采用概率组合分布,能根据不同的语料特征为每个算法设定权值,由此增强了平台对多种领域语料的适应性。课题实验对比分析Text2Onto果本体的准确率和召回率两个指标方面,GOLF系统比著名的Text2Onto系统要好一些。四是探讨了本体自动构建方法GOLF在数字图书馆等实际领域的应用,通过该方法可以有效地对网络信息进行组织,实现海量信息资源的高效检索、元数据的自动生成及个性化服务等内容。