深度学习是人工智能的核心技术之一,正在对我们生活的各个方面产生深远的影响。然而,这个领域对于初学者来说,无疑是困难和挑战重重的。过于复杂的数学公式,复杂的编程技巧以及成百上千行代码,都使得初学者在踏上深度学习的道路时,感到畏惧甚至放弃。我深感这些问题的存在,并坚信需要一本全面、深入且容易理解的课程来解决这些问题。因此我希望能够借助这本课程,帮助你避开我所遭遇的困难,更快更好地掌握深度学习相关的知识与技能。为了实现这个目标,我尽可能地把握两个重要的方向。首先,我希望本课程能够明确地解释和推导那些复杂的数学公式,并通过实际的编程例子,帮助读者理解和应用这些公式。其次,我尽量将理论知识与实践应用代码结合起来,以确保同学们在掌握理论知识的同时,也能有效地应用这些知识来解决实际问题。
本课程不仅包含了大量的公式推导和编程实例,同时也穿插了许多名人名言和思政内容,以及一些关于算法思路的讨论。我希望这些内容能帮助您更深入地理解深度学习,理解它的发展脉络,以及它是如何与我们生活相联系的,也希望这些思想能够启发读者,领悟其背后的哲学和生活联系,培养社会责任感和伦理意识,从而正确运用人工智能技术,促进科技与社会的和谐发展。
本课程已录制教程,
1. CG平台慕课可以看到完成的视频
2. B站视频(前5章) https://www.bilibili.com/video/BV155411t7ad/
由于视频难免有错误,还请大家在答疑中指出,谢谢。
注意:请各位同学在登录的第一时间在个人信息中录入手机号和邮箱,用于课堂签到和找回密码。
工学博士、博士生导师,硕士生导师。
长期致力于智能决策研究,目前主要探索智能运筹优化问题以及产业应用与大模型的结合。近年来在Transportation Research Part E: Logistics and Transportation Review、 IEEE Transactions on Intelligent Transportation Systems、Expert Systems with Applications 等行业顶刊发表论文多篇,获国家、省市级项目、发明专利多项。
硕士、博士 研究生招生广告:
非常欢迎热爱编程,对人工智能有强烈探索欲,有软硬件项目研发经验,有Kaggle、天池等竞赛的比赛经验,写过技术类博客,有Github开源项目或者发表过学术论文的同学们加入我们。
线性代数、微积分、概率论
6.5.2 实战9:基于LeNet-5的MNIST图片分类实战
7.3.2 实战11:基于VGG的CIFAR-10图片分类实战
7.4.5 实战12:基于简版GoogLeNet的CIFAR-10图片分类实战
7.5.4 实战13:基于ResNet的CIFAR-10图片分类实战
9.5.5 实战19:基于稀疏自编码器的手写数字图片重建实战
10.1.6 实战20:基于变分自编码器的手写数字图片重建实战
10.3.2 实战22:基于DCGAN的手写数字图片生成实战
11.1.4 强化学习实验环境冰湖游戏环境FrozenLake
11.3.1 策略迭代算法(Policy Iteration)
11.3.2 实战24:基于策略迭代算法的FrozenLake游戏
11.3.4 实战25:基于值迭代算法的FrozenLake游戏
11.4.3 实战26:基于SARSA算法的FrozenLake游戏
11.4.5 实战27:基于Q-Learning算法的FrozenLake游戏
11.6.2 实战29:基于REINFORCE算法的平衡摆游戏
12.1.2 大模型的发展简史:从Transformer到DeepSeek的技术跃迁
12.1.4 大模型的社会影响:DeepSeek在行业落地中的生产力变革
12.2.1 2.1 语言模型的核心数学原理(概率链式法则与生成式AI)
12.2.3 2.3 自注意力(Self-Attention)的数学形式与计算流程
12.2.4 2.4 传统序列模型(RNN/LSTM)的局限性
12.3.1 3.1 Transformer核心组件解析(编码器、解码器、位置编码)
12.3.2 3.2 实验1:手动实现Self-Attention机制(可视化注意力权重)
12.3.3 3.3 实验2:构建Mini-Transformer模型(编码器-解码器实战)
12.3.5 3.5 位置编码的工程实现(正弦函数 vs 学习式编码)
12.4.1 4.1 分布式训练框架(数据并行、模型并行、混合并行)
12.4.2 4.2 实验3:从零训练GPT-2微型版(简化架构与硬件适配)
12.4.3 4.3 优化策略:梯度裁剪、学习率预热、混合精度训练
12.4.5 4.5 模型评估指标(困惑度、BLEU、人类对齐度)
12.5.1 5.1 自然语言处理(文本生成、对话系统、代码生成)
12.5.2 5.2 多模态应用(CLIP图像理解、DALL·E创意生成)
12.5.3 5.3 行业落地案例(医疗诊断助手、金融风险分析)
12.5.4 5.4 伦理挑战(偏见放大、信息泄露、责任归属)
12.6.1 6.1 模型压缩技术(知识蒸馏、量化、稀疏化)
12.6.3 6.3 DeepSeek开源生态与工具链(Hugging Face、LangChain)
以小组形式完成自选题目,在17、18周进行PPT汇报(应用场景、算法思路、结果),在本平台提交可执行的代码和说明(jupyter notebook)
主要参考书目:
《神经网络与深度学习》 https://nndl.github.io/
课外阅读:
《深度学习》 (花书)
《机器学习》 (西瓜书)
《TensorFlow深度学习实战》 (TF2.0版)