注册 / 登录

从学术前沿到工业领先:阿里小蜜机器阅读的实践之路

分会场:  人工智能/AI驱动/AI实践

 

案例来源 :

案例讲师

赵中州

阿里巴巴 算法专家

阿里巴巴智能服务事业部算法专家,多年来专注于自然语言理解及智能人机交互领域的算法研究和业务落地,作为核心骨干搭建了阿里小蜜、店小蜜、企业小蜜等小蜜问答体系,沉淀多篇专利与顶会论文。在机器阅读、迁移学习等领域持续探索并有较多实践。

扫描二维码分享案例

 

案例简述

 

阿里小蜜是阿里巴巴推出的围绕电商服务、导购以及任务助理为核心的智能人机交互产品,已经成为了阿里巴巴智能服务的代表。机器阅读理解是目前自然语言处理领域的学术热点,阿里巴巴在今年1月的斯坦福大学SQuAD阅读评测中荣登榜首并首次超越人类,在取得学术领先的同时,我们首先将机器阅读应用在了阿里小蜜的电商活动问答,并陆续落地在税务法规、办税指导、政务指南等场景,同时拓展到其他语种,支持东南亚电商Lazada的规则解读与活动问答。

在学术成果大规模落地的过程中,首先需要解决冷启动问题,通过不同的数据收集方式以及模型迁移学习去复用更多数据,甚至借助跨语言学习与机器翻译,进一步降低模型上线成本;同时真实场景的复杂多样也对模型的可控性提出了更高要求,需要在架构上从单一模型演变到整体解决方案,沉淀一套最佳实践来支持新领域以及新技术的落地。

 

案例目标

 

在阿里小蜜与店小蜜这样在电子商务领域的场景中,每逢双11等大促活动时,都会有大量的用户咨询活动规则内容。在税务、政务等问答场景,知识库管理员往往需要从法规文档中拆解配置大量的FAQ,知识维护更新也需要大量成本。通过机器阅读理解的运用,可以让机器直接对文档进行阅读,避免了知识运营或者活动商家的整理提炼过程,减轻工作成本。

 

成功(或教训)要点

 

1)探索机器阅读理解技术的业务价值与适用场景;
2)构建领域数据集及针对性的技术方案;
3)低成本解决模型冷启动及上线的持续优化
4)通过多语言技术将机器阅读赋能到更多业务
5)理清未来技术趋势及挑战

 

案例ROI分析

 

1)大促期间活动规则无需拆解配置知识点,支持大量活动的实时上线,赋能整个淘宝平台商家
2)长篇幅、大规模法规类文档能极大减少FAQ构建成本,让基于法规的细粒度问答成为可能

 

案例启示

 

在阿里小蜜电商问答、法规解读,办事指南等智能问答场景中, 机器阅读理解的引入可以让知识获取不受人脑限制,大大降低了知识维护成本,提供更灵活的问答能力。
前沿学术成果在适合的场景也能发挥重要价值,但在落地过程中对于新技术的使用范围、领域针对性优化、模型简化与加速、构建成本降低、迭代优化等要多做考虑。

 

案例在团队中的意义

 

机器阅读理解作为 QA 问答技术中的全新领域,可以允许用户输入非结构化文本及问题,在文本中直接寻找答案回答用户问题,能够极大丰富问答系统的知识处理能力。但要将学术上面向百科问答等简单场景的机器阅读应用到真实复杂的业务场景中,还需要考虑多方面的问题:应用场景的切分,在线响应的性能保证、领域数据集的构建、模型可控性的提升,新业务的快速迁移等,本案例将解密从学术前沿到工业领先面临的一系列挑战与解决思路。

 

领取大会PPT

我要参会

大会全套演讲PPT

立即领取

大会即将开幕,点击抢票!

我要参会