AI 人机交互发展史

起源发展

人机交互发展历程

  • PC时代

    键盘+鼠标
    
  • 移动互联网时代

    多点触摸、手写、手势、siri语音交互
    android ios  
    

{———-}

  • 智能生活时代

语音交互发展路径

  • 具备语音能力的app
  • 实体语音按键
  • 无需按键语音唤醒
  • 远场全双工无需重复唤醒 【讯飞AIUI】
  • 多模态交互机器人

语音交互痛点

  • 语音识别不准

    环境嘈杂、离得远、方言口音
    垂直领域术语、个性化词汇
    
  • 语义理解不对

    上下文关联、场景相关
    实体取名复杂
    垂直领域实体歧义
    口语化、尝试北京、省略说法
    
  • 信息内容不足

    即时性
    可用性
    授权
    
  • 系统响应单一

    机器反馈方式缺少变化
    缺少通用对话管理策略
    

机器翻译技术发展史

  • 基于规则的机器翻译
  • IBM提出的基于词的统计翻译模型
  • Koehn提出基于短语的统计翻译模型
  • 谷歌和蒙特利尔大学提出端到端神经机器翻译
  • 蒙特利尔大学引入Attention机制、解决场景翻译难点
  • 谷歌发布 transformer系统

三大技术路线

  • 规则机器翻译

    openLogos--开源、
    三个技术路线:直接翻译、借助词典;句法树翻译、借助词典;中间语言来翻译
    
    优点
        保持原文结构
        对于语言现象已知或者结构规范的源语言效果较好
    缺点
        人工编写、工作量大
        主观性强、一致性难以保障
        不利于系统扩充
        无法解决不规范语言翻译
    
  • 统计机器翻译

  • 神经机器翻译