梦夜十六

公告

欢迎来到梦夜の小窝 ~ 这里记录技术折腾与碎碎念

标签

梦夜十六

公告

欢迎来到梦夜の小窝 ~ 这里记录技术折腾与碎碎念

了解更多

标签

Act AI CLIP Deep Learning Deepfake DeepLearning DeepSeek为何大规模招人 Electron Fine-Tuning GAN KIDS LoRA Mixup OSFT PEFT Physics-Informed PyTorch pytorch React SVD The Topology Optimization TypeScript ViT 公共系统分析反刍思维反腐周刊哲学国债妈妈扛钢管供出成绩被屏蔽女儿存在宣传心理学思维机制思考情感意义技术升级下的劳动力撕裂拓扑优化教程数字资本与国家权力的联合收网桌面应用正交子空间微调深度分析热点物理约束环保生成对抗网络社会社会发展社会心理学社会讨论经济美国近12万名科技员工被解雇自我模型苹果产品全球涨价认知认知科学认识资本的跨领域成本转嫁轻量化微调辩证法进化心理学预测加工马克思主义

梦夜十六

公告

欢迎来到梦夜の小窝 ~ 这里记录技术折腾与碎碎念

了解更多

标签

Act AI CLIP Deep Learning Deepfake DeepLearning DeepSeek为何大规模招人 Electron Fine-Tuning GAN KIDS LoRA Mixup OSFT PEFT Physics-Informed PyTorch pytorch React SVD The Topology Optimization TypeScript ViT 公共系统分析反刍思维反腐周刊哲学国债妈妈扛钢管供出成绩被屏蔽女儿存在宣传心理学思维机制思考情感意义技术升级下的劳动力撕裂拓扑优化教程数字资本与国家权力的联合收网桌面应用正交子空间微调深度分析热点物理约束环保生成对抗网络社会社会发展社会心理学社会讨论经济美国近12万名科技员工被解雇自我模型苹果产品全球涨价认知认知科学认识资本的跨领域成本转嫁轻量化微调辩证法进化心理学预测加工马克思主义

站点统计

文章

13

分类

4

标签

67

总字数

72,736

运行天数

0 天

最后活动

0 天前

1014 字

3 分钟

PyTorch 入门教程

2026-03-31

教程

AI

/

DeepLearning

/

pytorch

PyTorch 入门教程#

“工欲善其事，必先利其器。”

嗨，欢迎来到我的博客第一篇文章！如果你正在为”PyTorch 怎么入门”而焦虑，那你来对地方了（大概）。今天我们就来聊聊如何从零开始，把 PyTorch 跑起来。（不过其实这篇文档默认你有一点点开发基础）

PyTorch 是何意味？#

PyTorch 是 Meta（前 Facebook）开源的深度学习框架。如果你听说过 TensorFlow（不过看这篇文章的大部分应该都不知道罢），PyTorch 就是它最强劲的竞争对手。而且在学术界和工业界，PyTorch 如今已经是当之无愧的主流选择。

PyTorch 最大的特点是动态计算图（Dynamic Computation Graph），这就是说，你写的代码就像普通 Python 一样直观，随时可以调试、随时可以修改，不像早期的 TensorFlow 那样需要先”定义图”再”运行图”。

环境安装#

安装 PyTorch#

推荐直接去官网 pytorch.org 选择你的环境配置，会自动生成安装命令。

1
# 以 CPU 版本为例（适合入门练手）
2
pip install torch torchvision torchaudio

tips：如果你有 NVIDIA 显卡，建议安装 CUDA 版本，训练速度会有质的飞跃。可以在官网上选对应的 CUDA 版本就行。

安装完成后，验证一下：

1
import torch
2
print(torch.__version__)       # 打印版本号
3
print(torch.cuda.is_available()) # 检查 GPU 是否可用

核心概念：Tensor（张量）#

PyTorch 的核心数据结构是 Tensor（张量）。你可以把它理解成一个”超级 NumPy 数组”——支持 GPU 加速，还能自动求导的NumPy数组。

创建 Tensor#

1
import torch
2

3
# 从列表创建
4
a = torch.tensor([1.0, 2.0, 3.0])
5
print(a)  # tensor([1., 2., 3.])
6

7
# 创建全零 / 全一矩阵
8
zeros = torch.zeros(3, 4)   # 3行4列的零矩阵
9
ones  = torch.ones(2, 3)    # 2行3列的一矩阵
10

11
# 随机初始化（训练中最常用）
12
rand  = torch.randn(3, 3)   # 从标准正态分布采样

Tensor 的基本运算#

1
x = torch.tensor([1.0, 2.0, 3.0])
2
y = torch.tensor([4.0, 5.0, 6.0])
3

4
print(x + y)      # tensor([5., 7., 9.])
5
print(x * y)      # tensor([ 4., 10., 18.])
6
print(torch.dot(x, y))  # 点积：tensor(32.)
7

8
# 改变形状
9
z = torch.randn(4, 6)
10
print(z.reshape(2, 12).shape)  # torch.Size([2, 12])
11
print(z.view(3, 8).shape)      # torch.Size([3, 8])

自动微分：autograd（夯爆了）#

这是 PyTorch 最神奇的地方之一。深度学习的核心是反向传播（Backpropagation），本质就是对损失函数求梯度。而 PyTorch 通过 autograd 帮你自动完成这件事。

1
import torch
2

3
x = torch.tensor(3.0, requires_grad=True)  # 告诉 PyTorch 需要对 x 求导
4

5
y = x ** 2 + 2 * x + 1   # y = x² + 2x + 1
6

7
y.backward()  # 反向传播，自动计算梯度
8

9
print(x.grad)  # dy/dx = 2x + 2 = 2*3 + 2 = 8
10
               # 输出：tensor(8.)

requires_grad=True 就像给 PyTorch 贴了个小纸条：「嘿，记得跟踪这个变量的梯度！」

搭建神经网络：nn.Module#

在 PyTorch 里，搭建一个神经网络需要用到 torch.nn.Module。你只需要继承它，定义好网络层和前向传播逻辑就行。

下面我们来搭一个最简单的全连接网络（Fully Connected Network）：

1
import torch
2
import torch.nn as nn
3

4
class SimpleNet(nn.Module):
5
    def __init__(self):
6
        super(SimpleNet, self).__init__()
7
        self.fc1 = nn.Linear(784, 256)  # 输入784维，输出256维
8
        self.fc2 = nn.Linear(256, 128)
9
        self.fc3 = nn.Linear(128, 10)   # 输出10类（如手写数字识别）
10
        self.relu = nn.ReLU()
11

12
    def forward(self, x):
13
        x = self.relu(self.fc1(x))
14
        x = self.relu(self.fc2(x))
15
        x = self.fc3(x)
16
        return x
17

18
model = SimpleNet()
19
print(model)

输出大概长这样：

1
SimpleNet(
2
  (fc1): Linear(in_features=784, out_features=256, bias=True)
3
  (fc2): Linear(in_features=256, out_features=128, bias=True)
4
  (fc3): Linear(in_features=128, out_features=10, bias=True)
5
  (relu): ReLU()
6
)

干净、清晰，一目了然。这就是 PyTorch 的魅力。

模型初体验（）#

光有网络还不够，我们来看一个完整的”小闭环”——数据 → 前向传播 → 计算损失 → 反向传播 → 更新权重。

1
import torch
2
import torch.nn as nn
3
import torch.optim as optim
4

5
# 1. 准备假数据（实际场景中替换成真实数据集）
6
X = torch.randn(100, 784)   # 100个样本，每个784维
7
y = torch.randint(0, 10, (100,))  # 100个标签（0-9）
8

9
# 2. 实例化模型、损失函数、优化器
10
model = SimpleNet()
11
criterion = nn.CrossEntropyLoss()         # 交叉熵损失（分类任务常用）
12
optimizer = optim.Adam(model.parameters(), lr=0.001)  # Adam 优化器
13

14
# 3. 训练循环
15
for epoch in range(10):
16
    # 前向传播
17
    outputs = model(X)
18
    loss = criterion(outputs, y)
19

20
    # 反向传播 + 权重更新
21
    optimizer.zero_grad()   # 清空上一步的梯度，这步千万别忘！
22
    loss.backward()         # 计算梯度
23
    optimizer.step()        # 更新参数
24

25
    print(f"Epoch [{epoch+1}/10], Loss: {loss.item():.4f}")

这段代码是 PyTorch 训练的标准模板，建议抄下来背熟，以后你会反复用到。

What’s your mission next？#

恭喜你，你已经掌握了 PyTorch 最核心的几个模块！接下来你可以探索：

数据加载 torch.utils.data.Dataset 和 DataLoader

计算机视觉 torchvision、卷积神经网络（CNN）

自然语言处理 Transformer、Hugging Face + PyTorch

模型保存与加载 torch.save() / torch.load()

GPU 训练 .to('cuda') 把模型和数据搬到显卡上

官方文档写得非常好，强烈推荐推荐：pytorch.org/docs

总结#

回顾一下今天学到的核心内容：

Tensor 是 PyTorch 的基本数据单元，可以理解为支持 GPU 的 NumPy 数组
autograd 帮你自动计算梯度，不需要手推偏导数
nn.Module 是搭建神经网络的基类，继承它来定义你的模型
训练循环 的四步口诀：前向传播 → 计算 Loss → zero_grad() → 反向传播 → 更新参数

深度学习看起来很难，但其实入门并不难。最重要的其实是动手敲代码，把每一段示例跑一遍，改一改参数，其实就能掌握一些了。

如果这篇文章对你有帮助，欢迎收藏或分享给同样有困境的朋友。我们下篇文章见！👋

如果这篇文章对你有帮助，欢迎分享给更多人！

PyTorch 入门教程

https://dreamnight.net.cn/posts/pytorch/

作者

梦夜十六

发布于

2026-03-31

许可协议

CC BY-NC-SA 4.0

部分信息可能已经过时

正交子空间微调：面向物理约束的轻量化拓扑生成对抗网络

梦夜の小窝

PyTorch 入门教程#

PyTorch 是何意味？#

环境安装#

安装 PyTorch#

核心概念：Tensor（张量）#

创建 Tensor#

Tensor 的基本运算#

自动微分：autograd（夯爆了）#

搭建神经网络：nn.Module#

模型初体验（）#

What’s your mission next？#

总结#

目录