第3课:数据·算力·算法——AI的“三驾马车”
【学习目标】
1. 理解数据、算力、算法在AI技术中的重要作用及其相互关系
2. 能够通过实验分析数据规模与偏差对模型性能的影响
3. 认识自主研发AI芯片对国家技术安全的战略意义
4. 评价数据、算力、算法三者动态平衡的重要性
【情境导入】
当你向不同的AI工具输入同样的指令“生成一张赛博朋克风格的城市夜景图”时,有的工具几秒就能生成细节丰富的图片,有的却生成缓慢且效果歪曲。同样是AI,为什么差异如此巨大?答案就藏在数据、算力、算法这“三驾马车”之中。数据是AI的“燃料”,算法是AI的“发动机”,算力是AI的“高速公路”。任何一方的短板,都会成为制约整体能力的瓶颈。
【知识大揭秘】
概念引入:AI的三大核心要素
数据是驱动AI不断成长的“养料”,数据的多样性越丰富、质量越高,AI的学习效果就越好。算力是驱动AI高速运行的“引擎”,它决定了AI从数据中寻找规律的速度。算法是AI解决问题的“核心思路”,它定义了系统如何解析信息、识别模式并做出决策。
深度解析:数据规模与偏差的双重影响
数据规模不足会导致模型无法识别不同品种和姿态的猫;数据分布不均(如绝大多数是黑猫)会导致模型在面对白猫或花猫时容易出错。这就是“数据偏差”问题,它不仅影响模型性能,还可能引发公平性问题。
案例时间:“只识别黑猫”的AI——数据偏差的危害
某公司开发的猫品种识别AI,训练数据中90%以上是黑猫图片。结果这个AI对白猫的识别准确率仅有30%,而对黑猫的准确率高达95%。这个案例生动说明:数据偏差会直接导致模型偏见,影响AI系统的公平性。
案例时间:中国AI芯片的突破之路
近年来,我国在AI芯片领域实现了从依赖进口到自主创新的突破。多家企业成功研发出高性能AI芯片,广泛应用于云计算、智能制造、图像识别与自然语言处理等领域。自主研发AI芯片不仅是技术问题,更是国家技术安全的战略问题。
知识小结:三驾马车的动态平衡
数据决定了AI的知识广度和深度,算法决定了AI的思考方式和解决问题的效率,算力决定了AI的运算速度和规模。三者的动态平衡决定了AI的整体性能,任何一方的薄弱环节都会成为制约整体能力的瓶颈。
【AI看图学】

【动手练一练】
活动:数据规模与偏差对模型的影响实验
步骤:
1. 使用Teachable Machine,分别用猫狗各15张、各3张、各1张图片训练模型,测试识别效果
2. 使用偏差数据集(15张白猫+15张黑狗)训练模型,测试对白狗和黑猫的识别效果
3. 记录实验数据,分析数据规模和偏差如何影响模型性能
工具/平台:工具/平台:Teachable Machine(Google免费在线工具)
预期成果:预期成果:两份实验记录表,包含不同数据规模和偏差条件下的识别结果对比
【想一想·辨一辨】
1. 如果一个AI招聘系统的训练数据主要来自男性的简历,它可能会对女性求职者产生什么样的偏见?
2. 有人说“只要数据足够多,算法不重要”,你同意吗?为什么?
【拓展阅读·前沿视窗】
了解误差反向传播算法——它是训练人工神经网络的基础算法,能够在无人干预的情况下高效调整神经网络参数。AI芯片架构师是当前最稀缺的职业之一,他们负责设计和优化AI计算的硬件架构。
学完本课了?来检验一下学习成果吧!
🎯 去练习