AWS自然语言处理服务新功能!从复杂文本中提取内容并客制化分类

Carly Feng

前瞻经济学人

本周,亚马逊网络服务(AWS)详细介绍了自然语言处理服务Comprehend的新功能,可以从非结构化文本中提取内容,即短语、地点、人名、品牌、事件和人类情感。

AWS是亚马逊所创建的云计算平台,提供许多远程网络服务、其他网站及客户端的服务。其在2002年7月首次公开运作,目前总部在华盛顿西雅图。Amazon EC2与Amazon S3都架构在这个平台上。现在AWS在全球19个地理区域中提供57个可用区,同时计划在2018年底和2020年上半年之间,在巴林、香港特别行政区、南非和瑞典共推出12个可用区和4个区域。

Comprehend新推出了无代码定制工具,客制化字段和客制化分类功能(Custom Entities and Custom Classification)可以允许开发人员“识别自然语言术语并对专门针对其团队、业务或行业的文本进行分类”。亚马逊网络服务公司学习及人工智能(AI)总经理Matt Wood博士,在博客文章中提到这个新的功能。

Matt Wood表示:“许多客户告诉我们他们拥有过剩的数据,特别是包含非结构化、自然语言的数据。客户很难在这些复杂的信息里面找到想要的潜在信息,而处理复杂数据却是机器学习特别擅长的东西。”

为此,客制化字段允许客户让Comprehend特定地了解垂直或某个领域的术语。从一小部分示例比如政策编号列表和使用它们的文本,客制化字段就可以生成一个能够识别任何给定片段中的目标文本的定制模型。

Comprehend的一个补充新功能是客制化分类,开发人员能够将文档分组到自己所命名的不同类别。只需50个示例,客制化分类就可以生成一个能够对电子邮件、社交媒体帖子、分析报告和其他文档进行分类的模型,或者根据其内容对其进行分类。

客制化字段和客制化分类一般都可用于各种情况。Matt Wood博士写道,律商联讯集团已经使用客制化字段功能从超过2亿份文档中提取法律字段,准确率超过92%。

博士表示:“自从AWS成立之初,我们的目标就是开发传统上只有大型、资金充足的组织才能获得的技术,让它们适合所有开发人员。Comprehend将负责建立、培训和主导定制的机器学习模型,并通过私人应用程序接口提供这些模型和工具,这些新的功能是这种精神的完美体现。我们很高兴看到用户运用这些功能来建造不同的东西。”

AWS之前在美国东部开设第二个高安全性GovCloud数据中心,旨在满足政府和其他受到严格监管的行业要求。客户可以享受到更好的服务,以减少延迟,增加数据持久性和弹性,实现更强大的灾难恢复能力以及跨多个区域扩展的能力。

同时也宣布计划于2020年在意大利米兰开设数据中心,再增加一个云服务区域,更好地为意大利客户提供服务。意大利将成为AWS欧洲排名第六的区域,仅次于法国、德国、爱尔兰、英国和瑞典,预计将于今年年底上线。

Comprehend也陆续推出新的功能或者改进的工具。本月初,AWS成功让翻译、转录和Comprehend服务符合《健康保险流通与责任法案》的标准。

可行性研究报告

广告、内容合作请点这里:寻求合作

咨询·服务

相关阅读

精彩推荐