“点34杯咖啡,人工需要两分半,而AI收银员只需要49秒”。在今日举办的“云栖大会·武汉峰会”上,阿里云展示了AI点餐技术。客户以每秒5个字的速度,向一台机器点单,并频繁更换语句,这台机器对每次对话均作出了精准应答。
视频中可以看到,点单环节包含了修改、删除、加单等多轮对话,背后是公共场所强噪声环境下的信号处理和语音识别、流式多意图口语理解引擎、多模态人机交互等技术模块的综合使用。
值得一提的是,在整个交流过程中,没有出现”hi,点单机“之类呆板的唤醒词,可直接下单,这也更符合人与人的自然对话。

阿里巴巴语音交互首席科学家鄢志杰表示,如今机器对人类口语的理解能力带到了新的高度,这完全打破了”语音唤醒+语音指令”传统命令式交互方式,阿里云首创的流式多意图口语理解引擎,极大地提升了对人类随意、自然的口语表达的理解力,“这些模块并非简单级联,而是深度融合而形成了多模态语音交互方案。现在这套解决方案已经在阿里云上开放,开发者开箱即用”。
这项解决方案除了可以做收银员之外,还能在地铁卖票。目前,上海地铁已经部署了这一技术。乘客直接说出目的地,售票机便可选择合适的站点和路线。测试数据显示,普通买票耗时往往超过30秒,而语音购票全程只需要10秒左右。
继续阅读与本文标签相同的文章
上一篇 :
易语言设置文件覆盖是否出现提示的方法
下一篇 :
C语言实现推箱子小游戏
-
PgSQL · 特性分析 · 浅析PostgreSQL 中的JIT
2026-05-19栏目: 教程
-
在AlibabaCloud上,如何使用AD FS进行 【角色SSO】 并完成在容器服务ACK集群中的身份验证
2026-05-19栏目: 教程
-
骚操作 !用 Python 偷偷抓取女朋友的行踪(女朋友在哪里)
2026-05-19栏目: 教程
-
受用一生的高效 PyCharm 使用技巧(五)
2026-05-19栏目: 教程
-
阿里云服务器从购买到入门使用流程 新手必看教程
2026-05-19栏目: 教程
