设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 2287|回复: 4
打印 上一主题 下一主题

[信息技术] 继续请教问题:关于 Pytorch 的 Autograd

[复制链接]
  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    跳转到指定楼层
    楼主
     楼主| 发表于 2023-2-14 13:09:28 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 雷达 于 2023-2-14 13:12 编辑 % E; c. w) g! w2 |" A. P2 a
    - M. A0 c$ [# y7 `! w, X. Z4 Q
    为预防老年痴呆,时不时学点新东东玩一玩。6 l6 h: T! S# J$ q: X
    Pytorch 下面的代码做最简单的一元线性回归:
    % ]- Q1 m( L" R" |  F& g----------------------------------------------
    % v& {2 ^# Q7 H0 A0 Z3 M/ \( d- Oimport torch1 _# M* q" v! |' w+ Z- q
    import numpy as np+ o0 }6 T' A3 `8 U
    import matplotlib.pyplot as plt& x/ ~/ q! l4 |
    import random% _; Q' z: f8 B
    2 ]8 ~. w* g4 b' w
    x = torch.tensor(np.arange(1,100,1))
    8 F0 e- k7 ]- V7 B  f! K4 ]4 ay = (x*27+15+random.randint(-2,3)).reshape(-1)  # y=wx+b, 真实的w0 =27, b0=158 h- e8 Y9 r- @# q, q. T! S$ |
    - a3 Q. N6 _9 D* o7 ]
    w = torch.tensor(0.,requires_grad=True)  #设置随机初始 w,b
    ) j% L6 m: x- U( G  v6 Sb = torch.tensor(0.,requires_grad=True)3 ~8 N% n8 Q; c' R; [
    ( a; |/ x; M- @3 T1 n1 r% N
    epochs = 100* X3 B- |  C3 i; I0 K. q
    & i: f* b) u( F6 ^2 u3 V5 Z  k: g- k8 S
    losses = [], R8 x! _+ w1 u  V. n8 P* v9 ^. ], a
    for i in range(epochs):2 k2 Y( j7 [3 ~! I) p) E: z
      y_pred = (x*w+b)    # 预测" `* m: q9 {( c* i7 _5 p
      y_pred.reshape(-1)
    ! k, k8 [* O' G& Z& [& i  l/ ?
    3 h' S6 a6 x: _! a0 A7 E+ H5 T" u$ m  loss = torch.square(y_pred - y).mean()   #计算 loss
    ( X4 [! T/ w4 R  losses.append(loss)
    # i: _. n% z+ ]; v6 `8 [0 {8 a3 m  4 X7 D5 V% `4 g; F. P( |8 [/ F0 `. m
      loss.backward() # autograd
    5 W% `4 v  r5 C: X& T& k  with torch.no_grad():
    . W  D  _. C2 r! W* g    w  -= w.grad*0.0001   # 回归 w. J# |- w  N- ?% M/ }
        b  -= b.grad*0.0001    # 回归 b $ X% s. p' W; u6 L: R
      w.grad.zero_()  
    " y) [2 C2 S2 f, _" p! v3 Q: }  b.grad.zero_()
    7 e4 w% F+ K$ H) f# d
    " |, e: K* D: @print(w.item(),b.item()) #结果
      X/ N2 V+ m3 `- `
    0 R% X2 Z8 T# z6 r) qOutput: 27.26387596130371  0.4974517822265625
    / O! A# L  w3 u, Y3 Q, L6 O----------------------------------------------' J' x- ^- i' D  n
    最后的结果,w可以回到 w0 = 27 附近,b却回不去 b0=15。两处红字,损失函数是矢量计算后的均值,感觉 b 的回归表达有问题。
    " k. s$ `$ W9 }高手们帮看看是神马原因?
    , L+ t6 w0 @8 t, d

    评分

    参与人数 1爱元 +10 收起 理由
    老票 + 10 不明觉厉

    查看全部评分

    该用户从未签到

    沙发
    发表于 2023-2-14 19:23:02 | 只看该作者
    本帖最后由 老福 于 2023-2-14 21:58 编辑 9 x  v2 T5 t( r" h: i

    2 {: X2 `  c. k4 r* R没有用过pytorch,但你把随机噪音部分改成均值为0的正态分布再试试看是不是符合预期?1 n" d8 u. W2 P, ?
    -------$ l' u# b* v% b( \4 W8 V
    不好意思,再看一遍,好像你在自算回归而不是用现成的工具直接出结果,上面的评论只有一点用,就是确认是不是算法有问题。! h) u& c* R3 h; P& h
    -------  m  k2 L9 Q1 l) @3 C4 T3 p! d
    算法诊断部分,建议把循环次数改为1000, 再看看loss是不是收敛。有点怀疑你循环次数不够,因为你起点是0, 步长很小。只是直观建议。

    评分

    参与人数 1爱元 +10 收起 理由
    雷达 + 10 谢谢建议

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    板凳
     楼主| 发表于 2023-2-14 21:52:57 | 只看该作者
    老福 发表于 2023-2-14 19:23
    ; _5 _+ T7 ~7 S0 z% B, B1 G- g& n1 ~没有用过pytorch,但你把随机噪音部分改成均值为0的正态分布再试试看是不是符合预期?
    / |: @, ?7 R, o" b-------
    5 o6 T5 }3 x- H+ W. O/ N$ d, S不好意思, ...
    2 b/ x% h5 o; Q
    谢谢,算法应该没问题,就是最简单的线性回归。
    ! ~) f- S" O6 s/ d  o, V$ g6 R9 m我特意没有用现成的工具,就是想从最基本的地方深入理解一下。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    地板
    发表于 2023-2-14 22:00:48 | 只看该作者
    本帖最后由 老福 于 2023-2-14 22:02 编辑 8 J4 n/ w$ k+ @' Y8 [
    雷达 发表于 2023-2-14 21:52
    / Z; @& \( `3 `/ ^& n# F7 w谢谢,算法应该没问题,就是最简单的线性回归。+ t  E; [* r* c; |
    我特意没有用现成的工具,就是想从最基本的地方深入理解 ...

    ' H4 b# K8 k. c; w6 e5 [2 v, L! ]$ z. ^
    刚才更新了一下,建议增加循环次数或调一下步长,查一下loss曲线。$ B9 u6 M6 N) [% ?
    5 g$ G( R2 q  h; `
    或者把b但的起点改为1试试。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    5#
     楼主| 发表于 2023-2-15 00:25:26 | 只看该作者
    本帖最后由 雷达 于 2023-2-15 00:31 编辑
    * M- B' U1 o8 M8 T* x0 J7 a7 m9 `
    老福 发表于 2023-2-14 22:00& k/ N/ N9 g. I) ?  F. t/ ~
    刚才更新了一下,建议增加循环次数或调一下步长,查一下loss曲线。  [0 B' C" h; v5 L' K2 e- s7 {

    6 F2 |5 n- a% _; S( Z% z或者把b但的起点改为1试试。 ...

    0 v9 x. Q9 ~+ ]! J2 ^! F3 \/ W! C1 }! b" d" O3 D
    你是对的。
    ! ?% x+ E, E  F0 Q1 B1 }7 r去掉了随机部分% p# R5 I5 }4 O* t+ f4 g7 @8 x' Z
    #y = (x*27+15+random.randint(-2,3)).reshape(-1), ]$ J# x% U' j- x8 R5 O5 P
    y = (x*27+15).reshape(-1)
    + }4 M  N. V- I4 n8 x$ p5 v" l$ b
    循环次数加成10倍,就看到 b 收敛了
    / v7 v: |8 \0 sw , b9 ~; o# ~4 Y: V- h0 f. z
    27.002620697021484 14.826167106628418
    $ H  f1 k- I% A1 r% ?6 T) x% g6 {
    和 b 的起始位置无关,但 labeled data 用 y = (x*27+15+random.randint(-2,3)).reshape(-1) ,收敛就很慢。
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2026-1-5 22:51 , Processed in 0.027966 second(s), 18 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表