作为未来科技发展的前沿领域,人工智能在技术应用方面有很多细分领域,比如深度学习、推荐引擎、计算机视觉、智能机器人、自然语言处理、实时语音翻译、视觉内容自动识别等。其中的自然语言处理,是人工智能领域中的一个重要方向。从整体来看,人工智能自然语言处理推动着语言智能的持续发展和快速突破,并越来越多地应用于各个行业。
综合来看,自然语言处理是人工智能的一种应用程序,它为需要快速可靠地分析文本数据的公司提供了各种各样的应用程序。这有效地实现了人机交互,并允许对以前未使用的大量数据进行分析、格式化。
从2008年到现在,在图像识别和语音识别领域的成果激励下,人们也逐渐开始引入深度学习来做自然语言处理研究,由最初的词向量到2013年word2vec,将深度学习与自然语言处理的结合推向了高潮。
近两年,人工智能自然语言处理已实现的应用包括机器翻译、信息检索、智能问答系统。在智能问答方面,借助人工智能自然语言处理,人们能够精确地分析用户所需要的知识,通过与用户交互,为用户提供个性化、实时性的信息服务。例如,浏览知乎时,会有相关问答推送、热点词、焦点问题排行等。
企业进军人工智能自然语言处理领域,也为相关产业发展注入了更多活力,百度就是其中之一。当前,百度不仅在自然语言处理技术和产业应用中取得丰硕成果,更秉承开源开放、合作共赢的理念,构建了以飞桨深度学习平台为基础、集成语言与知识核心技术及多样化场景解决方案的开源开放大生产平台,这就为广大开发者技术创新提供了相应支持。
放眼国外,在阅读理解领域,斯坦福大学于2016年通过Amazon众包平台建立了基于维基百科的数据集SQuAD,Microsoft亚洲研究院于2016年开放了基于必应搜索记录的数据集MSMARCO。
在医疗领域,基于云端平台,使用人工智能和自然语言处理,实时为患者护理过程中的关键算法提供支持。基于集成电子健康记录的软件,并直接在照顾病患的当下使用预测建模、机器学习、临床NLP和人工智能就可以辅助医疗人员进行实时决策。
有分析人士指出,面对当前人工智能自然语言处理模型规模与计算机算力需求的日益增长,软件和计算机硬件层面的协同创新具有重大意义。多模态融合的核心模态,应由具体的任务所决定,自然语言可视为符号系统。但如果不探究符号所表示的实际对象,将很难学习符号潜在本质。
随着人类进入智能时代,智能设备和各类数据数量都快速增长。自然语言处理领域经过多年发展,虽然取得了长足的进步但同时也面临很多挑战,其中最主要的主要问题有两个:即语义理解(知识、常识的学习问题)和低资源问题。
面对标注数据资源贫乏的问题,比如客服系统、小语种的机器翻译、特定领域对话系统、多轮问答系统等,自然语言处理尚无通用的高效解决办法。而要想攻克相关难题,还需要一定的时间。
自然语言处理是人工智能礼帽上的明珠,而填补语言鸿沟的机器翻译则是自然语言处理十分典型的应用技术之一。机器翻译的发展从刚开始运用规则系统,到统计的机器学习方法,后又解决算法、算力等各方面的问题,不断迈上新台阶。
随着技术的快速发展,人们会越来越深入地理解自然语言、掌握知识,推动人工智能技术发挥更大的价值,以此为社会进步和产业发展提供更多的推动力。
关键词: