第10课：机器如何“听懂”你？——语音识别与智能唤醒

初中七年级免费学习

【学习目标】

1. 理解语音识别的基本原理和工作流程

2. 了解语音唤醒的概念和应用

3. 能够使用AI工具体验语音识别和语音唤醒

4. 思考语音识别技术的隐私问题

小明对着手机说了一句“嘿，小爱同学”，手机立刻回应：“我在！”小明又说：“明天早上六点叫我起床”，手机回答：“好的，已设置闹钟。”小明惊叹：“它怎么知道我说的是它而不是别的设备？”这就涉及到两个关键技术：语音识别和语音唤醒。

概念引入：声音如何变成文字？

语音识别的核心任务是把声音信号转换成文字。它的工作流程是：首先通过麦克风捕捉声音，然后将声音信号转换成数字信号，再通过AI算法分析这些数字信号，最终输出对应的文字。就像你听写英语单词一样，只不过AI做得更快更准。

深度解析：语音识别与语音唤醒

语音识别（ASR）：将声音转换为文字的技术。广泛应用于语音输入、字幕生成、智能客服等场景。语音唤醒（Voice Wake-up）：让设备在待机状态下只对特定的唤醒词做出反应。比如“嘿，小爱同学”“嘿，Siri”“小度小度”都是唤醒词。设备一直在“听”，但只有听到唤醒词才会“醒来”并响应。

案例时间：智能音箱的“听力”挑战

智能音箱在嘉年华、音乐声中仍然能听懂你的指令，这背后有强大的AI技术支撑。AI需要在嘉杂的环境声音中分离出人声，还要适应不同人的口音、语速和方言。这就像你在吼杂的教室里努力听清楚老师的话一样，AI也需要“集中注意力”。

案例时间：语音助手能听懂“方言”吗？

我国有丰富的方言资源，但很多语音助手对方言的识别能力还不够好。这是因为方言的训练数据相对较少。目前，很多研究团队正在努力改善这一现状，让AI能更好地理解各地方言，这对保护语言多样性具有重要意义。

知识小结

语音识别的核心流程是“声音采集→信号处理→特征提取→模型识别→文字输出”。语音唤醒让设备只对特定词语响应，既方便又节能。语音技术已广泛应用于智能音箱、手机助手、车载系统等场景。

活动：语音识别与唤醒实验

步骤：

1. 打开手机语音助手，用不同的语速和方言说同一句话，观察识别结果的差异

2. 在有背景音乐的环境中唤醒语音助手，测试唤醒的准确性

3. 尝试用Teachable Machine训练一个简单的声音分类模型（如拍手和吹口哨）

工具/平台：手机语音助手、Teachable Machine（网页版）

预期成果：语音识别实验记录及声音分类模型

1. 语音助手一直在“听”你说话，这会不会侵犯隐私？你觉得应该如何保护隐私？

2. 如果有人用AI模仿你的声音给你的家人打电话，该怎么办？

了解语音克隆技术的发展，以及如何防范声音伪造。关注我国在语音识别领域的最新进展，如科大讯飞、百度语音等技术的突破。

学完本课了？来检验一下学习成果吧！

🎯 去练习