第9课：机器如何“看”图形？——从几何识别到二维码

初中七年级免费学习

【学习目标】

1. 理解计算机视觉的基本原理和工作流程

2. 了解二维码、AprilTag等图码的结构与识别原理

3. 能够使用AI工具体验图像识别的过程

4. 感受计算机视觉在智能硬件中的应用价值

在商场结账时，收银员只需扫一下商品的条形码，电脑就能立刻显示商品名称和价格。小明好奇：“机器是怎么读懂那一堆黑白条纹的？”其实，计算机“看”图像的方式和人类完全不同——它把图像拆解成数字，通过算法分析这些数字来“理解”图像。让我们一起探索机器的“眼睛”吧！

概念引入：计算机如何“看”图像？

人看图像是“一眼就懂”，但计算机看图像是把它拆解成一个个像素点。每个像素点都有一个数字值，代表它的颜色和亮度。一张照片就是一个巨大的数字矩阵。AI通过分析这些数字的规律，就能识别出图像中的物体、人脸、文字等。

深度解析：图码的秘密

二维码（QR Code）：用黑白方块的排列编码信息。三个定位点帮助扫描设备找到码的位置和方向，然后解读数据区域的信息。 AprilTag：一种专门为机器视觉设计的视觉基准标签，广泛用于机器人导航和增强现实。 DM码：一种可以存储更多数据的二维码，常用于物流和制造业。

案例时间：扫码支付背后的科学

当你用手机扫码支付时，手机的摄像头捕捉到二维码图像，AI算法首先定位三个角落的定位点，确定码的位置和旋转角度；然后读取数据区域的黑白方块，将它们转换成0和1的二进制数据；最后解码得到商品信息和支付链接。整个过程只需几分之一秒！

案例时间：机器人的“眼睛”——AprilTag导航

在机器人竞赛中，AprilTag常被用作导航标志。机器人的摄像头识别到AprilTag后，能精确判断自己的位置和方向，从而实现精准导航。这就像你在商场里看到各种指示牌来找到目的地一样，只不过机器人用的是“数字指示牌”。

知识小结

计算机视觉的核心是“图像→像素→数字→分析→识别”。二维码、AprilTag等图码是专门为机器设计的“视觉语言”，让机器能快速、准确地读取信息。计算机视觉技术已广泛应用于日常生活和智能硬件中。

活动：图码识别实验

步骤：

1. 用手机扫描不同类型的二维码（网页链接、名片、支付码等），观察扫描结果

2. 使用Google QuickDraw（快画测试）体验AI如何识别你的简笔画

3. 记录：AI识别了哪些图形？哪些识别不了？为什么？

工具/平台：手机摄像头、Google QuickDraw（网页版）

预期成果：图码识别实验记录表

1. 如果二维码被损坏或遮挡了一部分，机器还能读取吗？为什么？

2. 人脸识别和二维码识别有什么相同和不同？哪个更难？

了解计算机视觉的更多应用：自动驾驶中的行人检测、工业质检中的缺陷识别、医疗影像中的病变检测。计算机视觉工程师是当前最紧缺的AI人才之一。

学完本课了？来检验一下学习成果吧！

🎯 去练习