设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 2224|回复: 4
打印 上一主题 下一主题

[信息技术] 继续请教问题:关于 Pytorch 的 Autograd

[复制链接]
  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    跳转到指定楼层
    楼主
     楼主| 发表于 2023-2-14 13:09:28 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 雷达 于 2023-2-14 13:12 编辑 8 f  d. h# W, o* [9 Q" V+ l# J- P( b
    ! f& j  A& r/ k
    为预防老年痴呆,时不时学点新东东玩一玩。0 N. u) J3 T* r1 _5 j
    Pytorch 下面的代码做最简单的一元线性回归:
    5 S  W. |8 J( h- C6 y----------------------------------------------
    0 k* \7 O- R/ ?, E- C$ I" T# Wimport torch) V. o+ _3 U& f5 Z7 |
    import numpy as np: s3 w& v% }0 |' L
    import matplotlib.pyplot as plt% C& Y3 n# b6 e/ |
    import random
    / D/ R" P; m5 ^2 d5 r8 \! O9 _  I
    x = torch.tensor(np.arange(1,100,1))) |' H, N  ~! ?7 u
    y = (x*27+15+random.randint(-2,3)).reshape(-1)  # y=wx+b, 真实的w0 =27, b0=156 F; D, e3 y9 \. M
    , S( K) H; ]) f
    w = torch.tensor(0.,requires_grad=True)  #设置随机初始 w,b2 H; ~8 _+ |8 ]) Z; H; ?
    b = torch.tensor(0.,requires_grad=True)
    . _1 f9 c$ H% q7 g$ W- t! }6 r5 i4 [7 m+ x- n
    epochs = 100# S6 D: y) d: C  l. R+ Q

    ( j3 v1 j) e5 j& M  g/ p& B4 v9 @# nlosses = []
    0 \& B! A# O8 ?! Z: N- z5 ~for i in range(epochs):) J6 H" I9 A# Z7 h
      y_pred = (x*w+b)    # 预测! G2 s% g  e8 x
      y_pred.reshape(-1)  a) X0 @' P! L( H1 A5 K! S$ c- l
    ' m2 u" n9 ]8 ]# x6 J: o6 ^
      loss = torch.square(y_pred - y).mean()   #计算 loss
    4 u4 [+ P) _& }* a  losses.append(loss)% }5 R: \/ I: l, M9 i- o8 z
      0 u9 P& T# G. Y2 w; i
      loss.backward() # autograd1 o8 }) V0 t. X. J5 d
      with torch.no_grad():
    1 j- W7 R! H& X, G2 V) M' `    w  -= w.grad*0.0001   # 回归 w0 M) p) b" F* S' D% f0 D9 J
        b  -= b.grad*0.0001    # 回归 b
    + s, R1 k9 j# z+ U& F8 u8 W  w.grad.zero_()  
    . s/ a( m: F! R! c. J# s, f. P  b.grad.zero_()
    " v( n" e! t! t: r" i& c
    6 z8 e9 o/ \9 i5 |4 C6 kprint(w.item(),b.item()) #结果
    $ J' I. X- u! s. _( W
    5 `4 J" n! }: t- zOutput: 27.26387596130371  0.4974517822265625
    ; K/ ]9 L2 h% z7 s  N----------------------------------------------
    : R, M. x6 q, z( D最后的结果,w可以回到 w0 = 27 附近,b却回不去 b0=15。两处红字,损失函数是矢量计算后的均值,感觉 b 的回归表达有问题。, r' @2 ~% A4 `6 E$ U* c4 C
    高手们帮看看是神马原因?1 a* C' {1 w5 q+ E8 n

    评分

    参与人数 1爱元 +10 收起 理由
    老票 + 10 不明觉厉

    查看全部评分

    该用户从未签到

    沙发
    发表于 2023-2-14 19:23:02 | 只看该作者
    本帖最后由 老福 于 2023-2-14 21:58 编辑 + c# P# G4 @2 k" Z" a; ?
    3 A* K9 c+ H/ L" A0 \( I
    没有用过pytorch,但你把随机噪音部分改成均值为0的正态分布再试试看是不是符合预期?
    $ M  Y* y% Z3 {2 u, H-------
    + r0 _6 o! \; T不好意思,再看一遍,好像你在自算回归而不是用现成的工具直接出结果,上面的评论只有一点用,就是确认是不是算法有问题。
    * p. K% k9 f: X# c4 ?-------
    $ v: v$ B) e2 t& Y* H1 b0 L算法诊断部分,建议把循环次数改为1000, 再看看loss是不是收敛。有点怀疑你循环次数不够,因为你起点是0, 步长很小。只是直观建议。

    评分

    参与人数 1爱元 +10 收起 理由
    雷达 + 10 谢谢建议

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    板凳
     楼主| 发表于 2023-2-14 21:52:57 | 只看该作者
    老福 发表于 2023-2-14 19:23) r! C, {0 s" U4 w) m
    没有用过pytorch,但你把随机噪音部分改成均值为0的正态分布再试试看是不是符合预期?* ~- S7 q8 {2 I
    -------$ }# z( L+ A' i% y
    不好意思, ...
    ; o! \5 F1 ~2 R% G5 C, ]# J1 Y- R
    谢谢,算法应该没问题,就是最简单的线性回归。
    7 T5 o/ [# i1 H我特意没有用现成的工具,就是想从最基本的地方深入理解一下。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    地板
    发表于 2023-2-14 22:00:48 | 只看该作者
    本帖最后由 老福 于 2023-2-14 22:02 编辑
    * G2 M: U. C6 O: o: T8 _: t
    雷达 发表于 2023-2-14 21:52' ]' ?% O  w4 E% ^
    谢谢,算法应该没问题,就是最简单的线性回归。# R1 m- N- N7 n+ n
    我特意没有用现成的工具,就是想从最基本的地方深入理解 ...
    % ~2 j. X  [! P% ~8 i7 I- E
    3 D) Q) B9 c+ B  Y+ d( v5 D( w
    刚才更新了一下,建议增加循环次数或调一下步长,查一下loss曲线。7 H7 l' ?+ S9 o3 i' T6 D! e/ r

    4 L- a$ `; p6 _( v或者把b但的起点改为1试试。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    5#
     楼主| 发表于 2023-2-15 00:25:26 | 只看该作者
    本帖最后由 雷达 于 2023-2-15 00:31 编辑
    ; p- N% I+ T* m
    老福 发表于 2023-2-14 22:00
    " o1 t+ z3 l9 \( f0 x# {+ q  |刚才更新了一下,建议增加循环次数或调一下步长,查一下loss曲线。
    % g& x* |% k/ H9 Y, k+ p4 h# W* ]( f5 l# W; I
    或者把b但的起点改为1试试。 ...
    * V2 ~7 @0 X2 `- W' V  u

    " n& v) P4 f8 [& k8 w你是对的。
    * `: I4 o( N- G  f8 R9 h2 E4 @去掉了随机部分+ o- B0 W- ^& R. P1 L$ Y
    #y = (x*27+15+random.randint(-2,3)).reshape(-1)7 g$ [4 T5 i- J' A$ I: w9 {# {
    y = (x*27+15).reshape(-1)7 T  R. T( K( P1 O) e# `) N

    $ d4 p! j2 H7 v5 S; I循环次数加成10倍,就看到 b 收敛了3 g9 F, G6 d7 `% ?0 b0 _
    w , b- h5 J. T# i" Y; D/ a
    27.002620697021484 14.826167106628418
    $ g# J$ k0 t9 l2 ^" z3 t5 p
    " e: D& g0 B, m8 s和 b 的起始位置无关,但 labeled data 用 y = (x*27+15+random.randint(-2,3)).reshape(-1) ,收敛就很慢。
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2025-12-16 04:26 , Processed in 0.028320 second(s), 18 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表