相关文章  
  • AVL657型内燃机测试仪用改进计算机系统
  • 数码虎符双向防伪网络系统
  • 基于Net技术的烟叶行业信息集成系统
  • 客运综合信息管理系统KMIS
  • 金地地理信息管理系统
  • 综合网络监察管理系统
  • 华安台式PC操作控制器
  • 峰峰矿区有线电视综合信息网
  • 网络计算机
  • 人工智能技术软件
  •   推荐  
      科普之友首页   专利     科普      动物      植物        天文   考古   前沿科技
     您现在的位置在:  首页>>专利 >>专利推广

    基于信息抽取技术的搜索引擎<%=id%>


    所属分类: 计算机及信息技术 项目来源: 自创
    技术持有方姓名: 浙江大学 所在地域: 浙江
    是否中介: 否  是否重点项目: 否 
    技术简介:
    该搜索引擎利用机器学习的方法,对含有同类信息且布局基本一致的HTML页面样本集进行学习,从而得出对此类HTML页面进行信息抽取的规则。应用这些规则,结合一个特定领域的搜索引擎,对网络上的相关信息进行大量的获取,并从半自由的HTML文本中获取结构化的信息。通过训练和学习,调整规则数目和抽象程度,使其满足精度要求,然后基于学习提炼后的规则集对样本集以外的文本进行信息提取。对用搜索引擎获取的特定内容的页面,利用规则进行信息提取。
    该成果将信息抽取技术与搜索引擎技术有机地结合在一起,是一种非常有效、准确的信息获取工具,它能够较大范围地提高人们的工作效率。
         

          设为首页       |       加入收藏       |       广告服务       |       友情链接       |       版权申明      

    Copyriht 2007 - 2008 ©  科普之友 All right reserved