起源发展
人机交互发展历程
PC时代
键盘+鼠标
移动互联网时代
多点触摸、手写、手势、siri语音交互 android ios
{———-}
- 智能生活时代
语音交互发展路径
- 具备语音能力的app
- 实体语音按键
- 无需按键语音唤醒
- 远场全双工无需重复唤醒 【讯飞AIUI】
- 多模态交互机器人
语音交互痛点
语音识别不准
环境嘈杂、离得远、方言口音 垂直领域术语、个性化词汇
语义理解不对
上下文关联、场景相关 实体取名复杂 垂直领域实体歧义 口语化、尝试北京、省略说法
信息内容不足
即时性 可用性 授权
系统响应单一
机器反馈方式缺少变化 缺少通用对话管理策略
机器翻译技术发展史
- 基于规则的机器翻译
- IBM提出的基于词的统计翻译模型
- Koehn提出基于短语的统计翻译模型
- 谷歌和蒙特利尔大学提出端到端神经机器翻译
- 蒙特利尔大学引入Attention机制、解决场景翻译难点
- 谷歌发布 transformer系统
三大技术路线
规则机器翻译
openLogos--开源、 三个技术路线:直接翻译、借助词典;句法树翻译、借助词典;中间语言来翻译 优点 保持原文结构 对于语言现象已知或者结构规范的源语言效果较好 缺点 人工编写、工作量大 主观性强、一致性难以保障 不利于系统扩充 无法解决不规范语言翻译
统计机器翻译
- 神经机器翻译