您当前位置: 首页 数字化专栏 案例分享 好用又实惠,知识图谱必备|海量商业版分词5.3免费使用中! ​

好用又实惠,知识图谱必备|海量商业版分词5.3免费使用中! ​

海量中文智能分词V5.3的“新”5.3版海量分词的“新”有三个重…

海量中文智能分词V5.3的“新”


5.3版海量分词的“新”有三个重点:


1、高准确率!

      切分准确率达到99.76%

2、高性能!

      分词效率较上一版提升8倍

3、重要的话说三遍:

      免费!免费!免费!






关于海量分词不得不说的事情



自然语言处理(NLP)是人工智能领域一个最重要最艰难的研究方向,分词则是中文自然语言处理的的根基,相对成熟的中文分词算法能够达到更好的自然语言处理效果,帮助计算机理解复杂的中文语言。


海量(Hylanda)自1999年介入分词领域以来,秉承着对分词技术的独特理解及精益求精的技术研发要求,开发出了海量智能分词基础件产品,与国内外知名厂商如微软、Autonomy等多家公司已经集成了该产品,获得了用户及合作伙伴的认同。


近20年,海量(Hylanda)一直专注于中文信息处理技术领域的基础性研究工作。中文智能分词是其重点研发的技术之一,对该项核心技术具有完全的自主知识产权。


而今在极客、极品、极致的价值观的指引下,海量(Hylanda)不断打磨技术,旨在贡献出多年分词技术相关积累,推出诚意之作——海量中文智能分词V5.0,并且经过不断的迭代已经升级到5.3版本。






海量分词5.3版功能特点

  • 词形切分

对给定的字序列文本,自动切分为词序列文本。


  • 支持自定义词典功能

对于新词、专业词汇等可加入到自定义词典中,同时支持自定义词属性及设置IDF值。


  • 支持三种颗粒度的分词结果

为适应两个不同应用场景下,支持输出不同颗粒度的分词结果。海量系统现在提供了三种颗粒度的分词结果:

一是普通颗粒度,也是默认颗粒度,主要常规的各种应用情况;


二是大颗粒度,通常用于自动分类、信息挖潜、机器翻译、语音合成、人工智能等领域,用于提升信息分析的有效性和准确性;


三是小颗粒度,主要用于信息检索领域,用于提升查全率;


例如:

对"天津海量信息技术股份有限公司"进行分词:


普通颗粒度的结果为:

天津 海量 信息 技术 股份 有限公司


大颗粒度分词结果为:

天津海量信息技术股份有限公司


小颗粒度分词(检索优化)结果为:

天津 海量 信息 技术 股份 有限 公司


  • 支持计算一段文字的关键词

可提取跟文字内容相关的词

 
  • 支持计算一段文字的语义指纹

计算一段文字的语义指纹,唯一标识这段文字,用于进行文字内容的消重。


  • 支持词性标注

可为每个分词结果标识分词的数据,如:判断某个词是名词还是动词。从5.1.11版开始,词性标注时默认不使用成语(i)、习语(l)和简称略语(j),用户可以通过分词选项修改该设置。


  • 支持面向检索的结果优化

若需要提升检索的召回率,可以采用小颗粒输出,我们针对检索的业务情境对分词结果进行了优化。


若希望不输出检索停止词,可以通过SegOption中的选项进行控制,停止词表则通过自定义词典进行定义。




海量分词5.3版算法特点

海量中文智能分词的算法采用复方概念,通过多种途径解决同一个问题。发展了受限的隐马尔科夫过程, 使知识库的冗余大幅降低。


未登录词识别与切分歧义一直是分词的两个重大挑战,海量利用多年积累的经验,采用半监督学习的方式通过对大规模未标注语料的统计,有效地提升了未登录词的识别准确率和召回率。


同时切分歧义的准确率也得到了大幅提升,使得海量新版分词的准确性高达99.76%,并且速度为350万字/秒,稳定性高且资源占用率低。



欢迎试用

中文智能分词的经济价值是不可估量的,海量免费贡献给大家多年的积累,更多考量的是它的社会价值!


欢迎大家登陆我们的演示页面测试新版分词的效果,我们期待与您共同打造最好用的海量中文智能分词,以助力于大数据分析。


海量本次发布的免费版分词主要面向通用场景,如果您需专业分词词典、领域分词优化、新词发现或构建知识图谱等个性化定制的分词版本,欢迎与我们联系。


下载链接:

http://www.hailiangxinxi.com/smartCenter2018/download


演示地址:

http://www.hailiangxinxi.com/smartCenter2018/index

电话:400-005-0958     邮箱:nlp@hylanda.com

image.png

关于免费的声明概述

▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼
海量中文智能分词免费版的使用,请使用者遵循以下声明:

一、本软件为免费软件,用户可以非商业性、无限制数量地下载、安装及使用本软件。用户可以免费使用本软件用于商业目的,但须与海量(HYLANDA)签署使用许可协议。


二、如果使用海量分词免费版进行商业活动,海量(HYLANDA)被允许使用使用者商标LOGO进行宣传活动。


三、该软件如涉及在线服务中使用或引用请标注“引用海量(HYLANDA)分词”或者“Powered by HYLANDA” 或者“海量inside”。


四、海量(HYLANDA)在法律允许最大范围内对本协议拥有解释权与修改权。

▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲


发布需求