人工智能 > 正文
人工智能网热度:

易联众NLP自学习平台,打造更“走心”的机器人

自然语言理解是人脑科学与机器神经学的一场革命,自然语言处理( Natural Language Processing,以下简称NLP)作为人工智能三大关键技术之一,被誉为人工智能领域皇冠上的明珠。眼下,NLP持续在语言分析、理解和处理等方面取得突飞猛进的发展,并赋能更多行业实现智能化转型升级。基于“以场景驱动技术”的全新解题思路,易联众健康大脑团队开发出健康大脑“NLP自学习平台”(以下简称“易联众NLP自学习平台”),率先发力医疗健康领域,为寻求NLP技术的突破提供了新思路

破局三大难题,打造医疗健康领域的中文NLP

事实上,相比国外成熟的英文NLP的高歌猛进,国内中文NLP的研究却屡遭瓶颈。要让机器学习博大精深的中文,首先要面临三大难题:一是中文自然语言环境复杂,很难进行词性标注;二是中文分词困难;三是中文字词一词多义的特点难以正确解析。

目前,已有的、相对成熟的深度学习模型多为英文NLP,中文的语言学基本无法迁移,且中文NLP比英语要相对困难和复杂,需要专业团队从零开始训练合适的语言处理方法和模型。

 

image.png

 

 

依托易联众在医疗健康行业深耕多年的产业经验与业务积累,易联众健康大脑团队“以场景驱动技术”,为打造“更懂”中文的新一代NLP、提升中文NLP研究在国际话语体系中的地位做出贡献。易联众NLP自学习平台,以医疗健康领域为突破口,基于海量健康医疗数据,通过神经网络学习算法训练模型,打造NLP自学习平台。平台借助数据多模态录入、语言的结构化录入、场景下实体提取与文本分类等功能,破局三大难题,探索中文NLP的新发展,让机器“听得到”更“听得懂”中国话。

已知反哺未知,让人工智能更懂你

易联众NLP自学习平台是一款覆盖模型构建全流程的一站式机器学习平台,用户仅需标注或上传适量数据,即可通过平台的自监督预训练算法、特征表示学习算法及自训练系统,训练出可进行自优化、自迭代的优质算法模型。易联众NLP自学习平台的四主要功能:

(1)实体提取

实体即某一概念的实例,以“时间”概念为例,“中秋节”“4月1日”便是“时间”的实体。易联众NLP自学习平台的实体提取功能,就是将用户想要的实体信息,从一句话、一篇文章、一系列文本中筛选出来并进行实体关联。这是AI理解“自然语言”的基石,也是NLP实现信息提取、问答系统、句法分析、机器翻译等众多任务的重要基础工具。

 

image.png

 

 

(2)文本分类

文本分类是机器理解语言的重要手段,即通过对语义、词意的解析,判断其分类归属。中文语境下,文本的准确分类是非常复杂的任务,一是因为有些文本之间差异过小;二是有时需要综合多方面因素进行分辨。平台自主研发量化学习迭代的训练方法支持语言处理与模型设计:由机器结合词性和上下文总结规律并生成模型,使模型参数向真实情况贴合,从而更精准解析语义、词意乃至句式。

(3)文本生成

文本生成对技术要求较高,应用场景广泛,包括报告生成、对话系统、自动摘要、关键词AI创作等。易联众NLP自学习平台采用可控文本生成模型,通过全面分析语句并进行核心意图识别,产出多维特征构建出的智能文本量化模型,帮助用户通过模版扩宽文本数据量,对输入内容进行分析纠错,辅助训练独属于用户的智能模型。

(4)自学习预训练算法

结合实际业务场景与需求,NLP自学习平台开发出自监督、自学习的预训练算法。用户可通过上传适量数据或标注,实现最大限度的模型训练;通过训练出的标签样本特征,让模型深入学习到领域内的知识,挖掘潜在内嵌信息,应用到未知标签数据上,减少人工干预,提升学习效率,解决标注数据不足、数据缺少标签的问题。

 

image.png

 

 

“有客户戏称我们的平台是‘炼丹炉’,原材料丢进去,‘药单’跟‘制作工艺’就出来了,之后就可以简单套用和自行调试,甚至可以拿来对未知文本进行检测。”易联众个人健康云团队AI技术负责人洪晶瑾博士说道。

极简化操作,赋能产品与企业智能化变革

让机器像人一样理解语言、掌握知识的NLP技术,是人工智能中认知智能的核心。易联众NLP自学习平台向个人与企业用户提供简单高效的模型开发能力,帮用户可在极少人工干预的情况下,让不懂AI算法的人员训练出属于自己的AI模型,极大提高了NLP算法的通用程度。此外,平台结合神经网络学习训练,实现了自监督学习能力,通过自动标注、标签升级等方法反哺数据维度,不断完善数据对话能力,实现NLP系统动态升级。

易联众NLP自学习平台能满足多种实际应用场景的NLP服务。在健康医疗相关场景中,可以识别疾病实体并标准化、构建基于联合实体和关系提取的医疗健康知识图谱、自动提取报告和句子级模板生成准确的临床医学报告;在日常生活中,可能够实现拼写检查、自动摘要、手写体与印刷体识别、文语转换、自动问答问句分类、垃圾邮件判定、预定餐位、查天气、订机票等应用;在研究机构中,可以辅助论文文本分类、有效翻译、专业术语实体提取;在电商行业,可用于商品评论分析、用户画像标签提取、用户情感分析等。

以医疗健康领域为切入点,健康大脑“NLP自学习平台”也将与易联众独立开发的C端产品结合,实现饮食、运动、行为、体征、心情五大类型的语句解析,初步实现和机器的“智能对话”,打造创新互动方式,帮助用户快捷录入,只需运用简单的语句输入,就可以告别打字,直接与手机“沟通”,轻松记录日常点滴,增强用户体验感。最终,通过多方角色联合,以及各种技术能力库的调用和集成,打造健康场景综合解决方案闭环,赋能医疗健康领域的数字化和信息化发展。同时,易联众NLP自学习平台也正在尝试帮助医生实现快速转录处方、录入电子健康记录、生成健康报告与健康指导。通过NLP结构化数据输入方式,帮助医疗健康从业人员从繁重、枯燥的记录中解放出来。在不久的将来,平台也将为临床试验提供无缝和自动化支持能力、帮助个人定制合理的医疗保健套餐、定制化问答系统与健康生活服务管家等功能。

基于上述服务功能,易联众NLP自学习平台将与个人健康云体系内的多种AI产品自主搭配,提升AI产业落地能力。与易联众自研C端健康服务产品“嘻陪伴”结合,帮助用户实现语音录入与语音指令查询两大核心功能,让“嘻陪伴”成为用户的贴身智能管家,实时反馈用户关心的健康问题;与“C.Health数据开放平台”结合,帮助数据平台实现“小知识+大数据=大知识”的质的飞跃;与“个人健康画像SanCore引擎”结合,解决人机对话难题;与知识图谱组成“黄金搭档”,打造“JAQ(Just ask a question)机制”,通过智能问答和语义搜索技术,让用户的知识获取与问题解答不再是大海捞针。

 

image.png

 

 

易联众自研C端健康服务产品嘻陪伴,一键录入每一刻生活

NLP集中体现了人工智能的最高任务与境界,只有当计算机具备了处理自然语言的能力时,机器才算实现了真正的智能化。洪晶瑾博士表示:“我们一直在探索如何将抽象的技术以降维、细化、拆解、整合等形式,融入到具体的整体解决方案中。未来,我们期待易联众NLP自学习平台可以让冰冷的机器更有温度,全面释放人工智能的价值,让人类更好地享受人工智能的创新成果。”

欢迎关注微信公众号:dcwlcm666;合作及投稿请联系:1519329887@qq.com

赞助商