当前,人工智能作为新一轮产业变革的核心驱动力,已逐渐成为了引领科技发展的关键要素,并加速推动企业数字化转型。自然语言处理(NLP)作为人工智能的一个分支,是计算机科学领域与人工智能领域中一个重要方向。以智能文字识别应用为例,结合深度学习、模块识别等新技术,围绕商业办公场景,可以一站式解决企业纸质文档录入、合同审核、票据归档等业务需求。
智能文字识别技术的落地构建了面向金融、制造、零售、服务等多行业的通用全产业链数字化解决方案,为企业数字化转型提供了关键技术支撑。
产品简介
NLP能力平台采用微服务架构,以NLP基础能力为支撑,支持众多业务场景应用搭建及定制化需求,便于产品封装,实现连接产品、客户、合作伙伴和相关领域,构建循环发展生态,产生规模化效益。除基础能力外,平台还提供了含模型数据标注、训练、评估、预测及应用等管理工具的一站式服务,助力企业加快构建智能化“新基建”体系。图片
功能介绍
分词、词性分析
该功能实现对文本进行分词,词性展示服务。将连续的自然语言文本切分成具有语义合理性和完整性的词汇序列,同时保持对数据、模型的不断迭代更新。包含基本语义粒度,更小的检索粒度以及扩展检索粒度,通过大量语料及算法研发,可在短时间内分析海量文本,帮助客户更好更精确的挖掘出文本价值。
名词提取
专有名词提取功能,识别自然语言文本中具有特定意义的实体,主要包括人名、地名、机构名、时间日期。结合细分领域,构建细粒度标签,支持构建自动的专名识别机制,定期增量更新。
相似句提取
相似句提取服务用于比较文章相似句子的相似度,相似句提取。提供不同文本之间相似度的计算,并输出分值帮助用户快速实现推荐、检索等应用。通过词语间语义相关性计算快速定位人名、地名、机构名等词的相关词,扩大专有名词的词典。
词向量表示
通过模型训练,将语言词表中的词映射成一个长度固定的向量,词表中所有的词向量构成一个向量空间,每一个词都是这个词向量空间中的一个点,利用这种方法,实现文本的可计算。如下展示词向量在n维空间的位置。
文本摘要
结合传统语义特征和深度学习模型,充分考虑段落分布和篇章结构,准确计算语句的重要性,对内容进行全面的语义理解与分析,能根据需求灵活控制摘要长度,自动抽取关键信息,形成摘要结果。可用于内容理解、内容分发、智能写作等多种应用,是智能媒体等行业必备AI能力之一。
关键词提取
通过给每个词计算一个相关性分数来衡量每个词与句子的相关性程度,进而识别并提取出句子的中心词。快速分析词语与主体相关性,找到相似度最高或相近的内容。如下为提取一篇文章中的关键词。
产品优势
★开箱即用
提供多智能文本处理能力,包括智能分词、词性标注、实体识别、文本纠错、文本分类、关键词提取、文档摘要等,全方位覆盖从词、句到篇章级别的语义、结构分析任务。
★多种管理工具
提供算法管理、数据管理、模型训练、模型测试、模型管理、服务发布。
★支持定制开发
可训练模型、可配置算法,快速修复bad case。
应用场景
光大科技NLP能力平台已广泛应用到档案管理、对话摘要生产、划款指令、文本关键要素提取、应聘简历筛选及智能客服常见问题分类等金融业务场景。
客户案例——智能化合同管理助手
以档案管理场景为例,该产品已在某大型金融控股成员机构投入使用,有效提升了该机构合同审核及合同档案管理效率,进一步降低了人力成本和人为操作风险。
业务痛点
解决方案
基于平台基础功能,并利用NLP自然语言处理领域的机器学习、深度学习等智能手段和规范化的数据训练,结合合同审核相关业务规则,实现对电子合同的比对功能,合同信息的抽取以及电子化归档。
信息提取
适用多样化合同文本,通过自然语言处理、深度学习算法技术,对合同文本中如:客户名称、金额、签约时间、产权主体等信息结构化抽取,提取关键信息。
合同归档
支持专业化合同管理,自动化摘要建档,文件关联映射,高效满足日常业务检索、信息获取等场景的需求,所搜即所需,大幅降低企业员工检索合同及关键信息的时间成本。
合同对比
对文本按行切割,利用文本相似性算法对比,快速定位合同的修改区域与原版差异,降低合同审核难度。
文本纠错
有效识别文书存在纰漏并给出纠错建议和提示,如错别字、敏感信息等;提高文书表达准确度,避免低级错误、保障文书质量。
价值体现
★效率提升
软件比对结果辅助人工审核,自动标识合同差异。
★质量提升
智能识别、自动比对,避免操作风险。
★价值提升
代替机械性体力劳动,提高人才价值。