当AI遇到知识管理,两者将产生什么化学反应?

每三周“输出倒逼输入”第二期:如果围绕一个主题坚持研究半年时间,接近8篇文章,将8篇文章连成一个专题,对这个主题定会有一个新的认识,并且对一个主题的深入研究,会带动已有知识的相互“连接”,形成“触类旁通”的效果。

回顾上期分享

  • 焦虑产生:个人成长速度 < 社会进步速度
  • 知识第三波红利到来:数量-》速度-》深度
  • 改变从现在开始还不晚
  • 为什么要学习知识管理
    • 知识的定义:那些能够改变你行动的信息。(DIKW金字塔原则)
    • 大脑如何运作的?知识和学习的关系
      • 大脑思考经历四个过程:感觉-》知觉-》情绪-》思想
      • 人类大脑配备高速CPU,但嵌入了容量极低的“内存”和“硬盘”,需要外部硬盘(数据)的支持
    • 知识分类:到底要学什么知识?
      • 按照“外部”和“内部”存储分类
      • 按照内容分类
  • 知识管理模型:认知篇(C)、行动篇(A)、品牌篇(B)(待补充)

本期话题完善知识管理模型: 认知篇“知识管理能力五个关键路径”与AI的结合

知识管理5个关键步骤与AI对话的融合:从概念化到结构化

在学习交互设计的时候,看了一本书《交互设计沉思录》,由交互设计领域的思想领袖Jon Kolko所著,提到“交互设计,是在人与产品,系统或服务之间创建一系列对话”。 我们的日常生活由很多很多的“对话”组成,比如:学习一个知识,就是“信息与大脑”的对话;每次请求智能客服,就是“问题“与“智能客服系统”的一次对话,那么一次对话应该包括几个步骤? 用结构化的产品框架来描述是如何的呢?

经过一定时间的总结和沉淀,自己将知识管理归类为五个的关键路径:

  1. 问: 提出问题,通过问题找到你的目标
  2. 集: 建立信息过滤方法论,信息分级,防止收藏池只进水,不出水,导致“收藏池水位太高”
  3. 理: 读书笔记,提取练习,思维导图
  4. 享: 输出倒逼输入,以教为学
  5. 思: 每日反思,建立和刷新自己的认知标准

按照原来的输出计划,即按照这五个关键路径介绍相关的方法论,然后告诉大家,大家这些方法很有效,只要坚持去做就行了。

一直感觉这个五个关键路径蛮有“逻辑和结构”,研究了AI“多轮对话”的逻辑,发现原来自己这几个关键路径,还是太概念化和形象化,没有拆解到最小的颗粒度。

自己就尝试理解将“对话的产品设计思路”和五个关键路径进行一次结合, 完善自己的知识管理方法论,以及更好的审视目前的AI产品设计。

“对话”产品设计框架

所有“对话”都可以抽象为: 输入(input)-》 处理(Process)-》输出(output)三个阶段,输入方式:有语音、视觉、文字,我们智能客服系统基于微信对话框,输入主要形式是文字,目前输出的解决方案还是以人工标注的模板为主,研究空间不大,这里重点研究基于“文字”对话处理环节。

用以下一张图来描述整个结构:

整个对话处理分为四个关键点
1. NLU,自然语言理解(Natural Language Understanding)
2. DST, 对话状态维护(Dialogue State Tracking)
3. DPO, 策略优化(Dialogue policy optimise)
4. NLG, 解决方案生成(Natural Language Generation)

其中DM(会话管理)是对话体验的核心,包括两个重要环节:
1.DST(对话状态维护)- 完善用户特征,进一步明确用户的指令。
2.DPO(策略优化) – 根据特征、状态,提供最优的解决方案

接下来我们一一进行拆解:

一、 NLU(自然语言理解):技术趋于成熟,成为各大科技公司的基础开放能力

NLU是对话的最基本功能,好比大脑对语言的理解能力,通过素质教育,每个人都可以掌握。在人工智能领域,腾讯,阿里,科大讯飞,百度等企业纷纷开放了相关的自然语言理解接口,NLU技术已经不是核心的技术,而是一个通用能力,各大应用开发者只需要申请调用即可。比如如下是腾讯AI开放平台的NLP产品:

这里简单介绍一下相关的关键词(材料引自《出门问问》):

1. 分词

比如:日文章鱼怎么说 =》这句话有两种分词结果: 日文   章鱼   怎么   说 ? | 日   文章   鱼   怎么   说?

常见有两个方法:

  • 词典匹配:分词最传统最常见的一种办法
  • 词向量:语料数据中的一些统计特征(如互信息量)去估计相邻汉字之间的关联性,进而实现词的切分。
2.词性标注
3. 实体识别

  1. 句法分析

注:目前NLU已经不是一个核心技术,那么什么才是智能客服的差异化能力呢?

识别用户意图之后,所提供的服务开始成为对话机器人的核心。

二、DM(Dialoge Manage)对话管理:难点是多轮对话

用户一次性描述清楚需求或者用户还没有开口,系统能定位问题,给出准确答案,是一种非常理想的状态。现实情况大部分的都不是单次对话,会遇到如下情况:
1. 第一句对话,没有识别问题,答非所问,用户开始质疑是机器人,要求人工,系统不能像人工一样,进行相关的安抚和追问,挽救对话。
2. 第一句对话,回答正确,但是继续追问,答案要么是“重复”,要么是给出另外一个答案,这个时候用户也会感到莫名奇妙。

上面两种都是多轮对话体验的吐槽点, 而多轮对话本身就是对话机器人的一大难点,所以有必要对多轮对话的产品形态和结构进行研究。

多轮对话分为两部分:

  1. 初步识别意图前叫“开放域多轮对话”,类似闲聊,比如问“你是谁?”、“你是男生还是女生”。
  2. 封闭域多轮对话:智能客服系统都会尽快引导用户描述问题,识别出用户初步意图,比如“支付不了”,“不到账”,“密码忘记了”,一旦识别初步意图后,进入“封闭域多轮对话”。

本次话题在“封闭域多轮会话”。

三、DST(对话状态维护):特征、填槽、澄清话术、槽间关系

DST(对话状态维护)的核心任务就是补全用户意图的基本特征,进一步明确用户的指令。

特征

补全的信息定义为:特征, 一个问题可以有很多特征,组成“特征库”,每个特征都有一个槽,分为:分为必要槽、非必要槽,必要槽的填槽至关重要,非必要槽可以不填写。

填槽

槽填充方式可以分为三个类型:
1. 词槽:通过用户输入的内容提取
2. 场景槽:从用户进入场景提取
3. 接口槽:从相关的系统接口提取

举个例子,用户问“支付给摩拜的10元没有到账”,要解决这个问题,我们需要收集用户必填特征槽有3个。信息获取是:交易金额(词槽),产品名称(场景槽),交易金额(接口槽),具体填槽情况如下图:

槽组与填槽优先级

当一个槽有多个值的时候,就形成了槽组。槽组填充的优先级:交易金额有两个值,到底填写那个值,不同问题填值优先级不一样:
1. 优先考虑用户的词槽
2. 然后才是接口槽

澄清话术

当“槽”值为空,需要向用户提问,完善用户信息,这个提问叫“澄清话术”。

平级槽与依赖槽

上面讲的都是特征槽位和槽值的之间的关系,还一种情况是槽与槽之间的关系,如下图:

付款时间和金额是平级槽,没有任何依赖关系。而“是否有记录”与“是否本人”,属于依赖槽,前一个特征槽返回了值后,才会判断下一个槽,有逻辑的先后关系,比如:返回“没有记录”的时候,需要咨询是否是本人,才能提供解决方案。

只有平级槽的问题相对简单,复杂的问题基本都是依赖槽,在DPO阶段形成树形方案树。

总结

通过DST环节的拆解,对理解了解到用户意图后,我们收集相关的信息是可以进行结构化和序列号
1. 分析这个意图的特征
2. 找出特征的填值方式:确定哪些特征是必填和非必填, 填值从哪里来?
3. 如果有必填没有填写,如何反问用户,定义澄清话术?
4. 特征之间有没有依赖关系,根据依赖关系建立逻辑图。

反思:

  1. 我们能否列出这10个对话的特征和特征关系图?我们集中精力维护好这10个对话,根据28法则是不是能解决大部分的用户大部分的问题。 要验证这点,就需要对业务非常的熟悉, 作为一个AI产品经理,要尝试成为一个业务专家才行。

  2. 另外目前我们的智能预判,微信支付罗列了100个特征,每个问题对应的特征都是人工来标注,希望机器来学习聚类出每个问题共性的特征,但实际上,每一个会话涉及到的必要特征是有限的,完全可以利用人工标注的能力,这个地方用机器来聚类,不能识别必要的特征。

以上两个假设都要熟悉业务,并用实际的数据统计进行佐证,可以在日常的工作中,可以按照这个思路来进行

另外AI“对话”拆解NPU、DST就分享到此,下期在介绍DPO(策略优化)部分。

AI“对话”NPU、DST与知识管理能力的碰撞点

联系到知识管理能力5个关键路径,正好对应是“问”、“集”这两个关键路径,得到如下启发

  1. 提问分为封闭式和开放式,开放式提问用于铺垫,解决问题可以尝试用封闭式提问,将范围不断的聚焦,缩小。
  2. 遇到问题,尝试提问,然后找到关键词,拆解这个关键词背后的特征,不断尝试填充特征,如果还是效果甚微,请继续提问,也许是你问法不对。

  1. 信息不是越多越好,而是找到问题的必要特征,攻克必要特征,问题就已经解决一半。
  2. 不是所有特征是都显而易见,轻而易举获得。词槽:对应书籍、老师,可以直接拿来就用。 场景槽:对人情世故的理解,有同理心,具备场景思维。 接口槽:只有自己经历刻苦的探索,才能得出的结论。
  3. 特征之间是有依赖关系,事物是有一定的先后次序和规律的,没有学会走,就跑一定会问题,没有知识的问,集,理的沉淀, 再多的享都显得‘苍白无力’。

我说的都是错的!

发表评论