0

0

《AI数学系列课程》第一讲:代数在AI中的应用

看不見的法師

看不見的法師

发布时间:2025-11-27 19:34:01

|

868人浏览过

|

来源于php中文网

原创

ai%e7%9a%84%e5%9f%ba%e7%a1%80%e6%98%af%e5%88%9d%e4%b8%ad%e6%95%b0%e5%ad%a6%ef%bc%9f">前言:为什么ai的基础是初中数学?

大家好,欢迎来到《ai数学系列课程》的第一讲:代数在ai中的应用。

很多人一提到人工智能(AI),脑海中立刻浮现出复杂的高等数学概念,比如微积分、线性代数、概率论等等。但我想告诉你一个事实:这些高深的数学理论,最终都是建立在最基本、最坚实的代数运算之上。

今天的核心使命,就是带领大家打破对AI数学的恐惧,用你们现在正在学习的初中代数基础(是的,就是加减乘除、分数、还有一点点向量的概念),来透彻地解读最前沿的AI核心原理。我们相信,只有降低学习门槛,才能真正实现AI知识的普及和民主化。

本课程由上海交通大学、安泰经管学院、交大安泰校友会联合发起,由一群既有深厚学术背景,又有丰富AI实践经验的校友共同打造。我本人,曾是全国高中数学联赛一等奖的获得者,一路深耕数学和算法研究。但如今,我的身份更多是一名500强外企的数字化及AI项目经理,负责将这些理论知识转化为现实的智能应用。我的经历正是为了证明:数学竞赛的抽象思维,最终是要服务于现实世界的应用。

今天,我们将聚焦AI的“代数冰山”底部,后续我们还会逐步深入几何、概率等主题,揭示AI的完整数学面貌。


一、AI三大应用场景:代数如何定义“智能”?

人工智能在本质上是建立在“量化”基础上的。它必须把我们眼中的世界——语言、图像、喜好——全部转化为可以计算的数字。代数,正是处理这些数字的唯一通用语言。

让我们看看代数如何驱动以下三个主流应用:

大语言模型(如ChatGPT): 它是如何理解并判断你输入的内容中,哪些词是核心重点的?电商推荐算法(如抖音淘宝): 它是如何通过计算,确定你的兴趣方向和商品的特征方向是否一致的?OCR文字识别(如手机拍照翻译): 它是如何从一张图片密集的像素点中,提取出笔画、结构,最终识别出文字的?

这三个不同领域的“智能”判断,其核心步骤都是一连串精密的代数运算。


二、核心原理深度拆解:代数的隐形驱动力(细节翻倍)

1. 大语言模型:代数的加权求和与动态权重(Attention 机制)

核心机制: 注意力机制(Attention)。

动态权重设计: 语言的奥秘在于上下文和关系。模型在处理一个句子时,必须知道句子中的词语之间是动态关联的。例如:“苹果发布了一款新的手机。”

如果你问模型:“什么东西被发布了?” 模型必须给“手机”和“发布”更高的权重。如果你问模型:“谁发布了手机?” 模型必须将注意力(权重)转移到“苹果”这个词上。

代数本质——加权求和的魔力:

模型如何实现这种动态“聚焦”?它为每一个词的信息(I)分配一个权重(W)。这个权重是一个数字,权重越高,代表模型越重视这个词。然后,模型将每个词的信息与它的权重相乘,最后把所有的结果相加。

输出信息 = 权重_{词1} \times 信息_{词1} + 权重_{词2} \times 信息_{词2} + \cdots

细节深化: 这个看似简单的乘法和加法,正是AI“学习”的核心。在训练过程中,AI的任务就是不断调整这些权重 W_1, W_2, \cdots ,直到它能准确地判断出不同问题下的重点词语。因此,代数的乘法和加法,是AI理解复杂语言关系、进行语义推理的动力源泉。
2. 电商推荐算法:向量的点积与模长归一化(余弦相似度)

核心机制: 余弦相似度(Cosine Similarity)。

代数第一步——向量化:

在AI眼中,世界没有“喜欢”或“不喜欢”,只有数字。

用户喜好向量: 比如一个用户对电影的偏好可以被量化。假设维度是[科幻, 喜剧, 动作]。如果用户非常喜欢科幻(5分),不喜欢动作(1分),那么她的喜好向量可能是 [5, 3, 1]。商品特征向量: 一部电影的特征向量可能是 [4, 2, 0]。

代数第二步——点积(衡量一致性):

我们用点积来衡量两个向量在每个维度上的一致性。点积就是将两个向量对应位置的数字相乘,再把所有乘积加起来。

\text{用户向量} \cdot \text{商品向量} = (5\times4) + (3\times2) + (1\times0) = 20 + 6 + 0 = 26

点积越大,表明用户和商品在这些特征上重叠越多。

网页制作与PHP语言应用
网页制作与PHP语言应用

图书《网页制作与PHP语言应用》,由武汉大学出版社于2006出版,该书为普通高等院校网络传播系列教材之一,主要阐述了网页制作的基础知识与实践,以及PHP语言在网络传播中的应用。该书内容涉及:HTML基础知识、PHP的基本语法、PHP程序中的常用函数、数据库软件MySQL的基本操作、网页加密和身份验证、动态生成图像、MySQL与多媒体素材库的建设等。

下载

代数第三步——模长归一化(解决“偏见”):

仅仅有点积还不够。想象有一个用户,他给所有的电影都打了10分(购买了所有商品)。他的向量数值会非常大,导致他和所有商品的点积都很高,但这不是真正的“精准”推荐。

我们需要排除数量(模长)的影响,只关注方向(偏好类型)是否相似。

模长: 向量的模长 |A| 就是用勾股定理计算向量的长度,本质是\sqrt{x^2 + y^2 + \cdots}。归一化: 余弦相似度公式通过将点积除以两个向量的模长乘积来实现归一化:

\text{相似度} = \frac{\text{用户向量} \cdot \text{商品向量}}{|\text{用户向量}| \times |\text{商品向量}|}

几何意义: 这个计算结果正是两个向量的夹角余弦值。余弦值越大(越接近1),夹角越小,意味着偏好方向越一致,推荐就越精准。这就是代数的分数运算和向量计算在推荐系统中的决定性作用。
3. OCR文字识别:矩阵的滑动窗口与分层特征(卷积操作)

核心机制: 卷积神经网络(CNN)中的卷积操作。

代数第一步——定义滤波器(Filter):

图片是由密密麻麻的像素点组成的巨大矩阵。卷积操作引入一个小的数字矩阵,我们称之为滤波器(Filter)或卷积核,例如一个 3 \times 3 的数字矩阵。

滤波器的作用: 不同的滤波器储存着不同的代数权重,它们被设计来检测图片中的特定特征,比如:一个滤波器可能专门用于检测水平边缘,另一个用于检测垂直边缘。

代数第二步——滑动窗口与乘加运算:

这个滤波器会像一个“放大镜”或“滑动窗口”一样,在图片矩阵上从左到右、从上到下滑动。

每到一个位置,滤波器中的9个数字就会与图片中对应的9个像素值进行代数乘法,然后将所有乘积结果相加。最终,这9个像素点被压缩成一个新的输出值。重复运算: 这个乘加运算不断重复,将大图片转化为一个更小的、但特征更明显的特征图。

代数第三步——多层特征提取:

这套代数运算是分层进行的,构建了一个层次结构:

第一层卷积: 提取出最基础的特征,如边缘、点、角点。更高层卷积: 在第一层提取的特征基础上,通过新的代数运算,将边缘组装成更复杂的形状,如笔画、圆形、矩形。最终层: 将这些形状组装成完整的字符或人脸。关联代数: 整个过程就是海量的、高效率的矩阵乘法和加法运算。OCR之所以能识别文字,是因为代数运算能够将像素信息转化为具有语义的结构特征。

三、总结与展望:代数的无限可能与数学观(深度细化)

今天,我们深入探讨了代数在AI中的三大功能:

注意力机制: 利用加权求和来为信息分配重要性。余弦相似度: 利用向量的点积和模长来量化事物间的相似性。卷积操作: 利用矩阵乘加来分层提取图像特征。

关键启示: 你们的初中代数知识,是所有AI创新、所有智能算法的通用语言。它教会我们如何将一个复杂、模糊的概念,转换为精确、可计算的数字模型。

代数对你的数学观意味着什么?

学习代数,不仅仅是为了计算X和Y的值,更是为了培养一种量化思维——一种能够将现实世界中的“质量”转化为数学上的“数量”的能力。正是这种思维,让人类能够驯服AI,让复杂的机器学习模型高效运转。

下期预告:几何与计算机视觉的交汇

如果说代数是AI的计算工具,那么几何就是AI的“眼睛”。在下一讲中,我们将探索几何在计算机视觉中的应用:

如何用三角形相似和坐标系来理解图像的透视和比例?如何利用几何原理进行人脸关键点定位、实现图像拼接和AR虚拟道具叠加?

感谢所有对本课程提供支持的学者和机构,特别是斯坦福吴恩达教授、复旦大学赵卫东老师等人的创新理念。

希望今天的课程能激发你对数学的热爱——它不再是枯燥的习题,而是连接你和未来智能世界的桥梁。我们下期再见!

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

38

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

83

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

97

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

223

2026.03.05

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

458

2026.03.04

AI安装教程大全
AI安装教程大全

2026最全AI工具安装教程专题:包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好,附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新,收藏这一篇就够了,让AI安装不再报错!

169

2026.03.04

Swift iOS架构设计与MVVM模式实战
Swift iOS架构设计与MVVM模式实战

本专题聚焦 Swift 在 iOS 应用架构设计中的实践,系统讲解 MVVM 模式的核心思想、数据绑定机制、模块拆分策略以及组件化开发方法。内容涵盖网络层封装、状态管理、依赖注入与性能优化技巧。通过完整项目案例,帮助开发者构建结构清晰、可维护性强的 iOS 应用架构体系。

246

2026.03.03

C++高性能网络编程与Reactor模型实践
C++高性能网络编程与Reactor模型实践

本专题围绕 C++ 在高性能网络服务开发中的应用展开,深入讲解 Socket 编程、多路复用机制、Reactor 模型设计原理以及线程池协作策略。内容涵盖 epoll 实现机制、内存管理优化、连接管理策略与高并发场景下的性能调优方法。通过构建高并发网络服务器实战案例,帮助开发者掌握 C++ 在底层系统与网络通信领域的核心技术。

34

2026.03.03

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.5万人学习

Excel 教程
Excel 教程

共162课时 | 21.1万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号