设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 490|回复: 11
打印 上一主题 下一主题

[工程技术] 利用 Deepseek 抓取PDF的文字并矫正。

[复制链接]

该用户从未签到

跳转到指定楼层
楼主
 楼主| 发表于 2025-2-2 03:35:19 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 nanimarcus 于 2025-2-6 22:17 编辑 ' Q1 _0 a* u: y' x6 m
3 N  u! i! S, o" n# F, M! E
把PDF上传,然后让他抓取文字,并修改可能的错误。
6 O$ u% u! y0 F6 ^, F2 j2 z然后deepseek完美的完成了任务。
0 j8 G9 A3 |" j( r0 Q段落清楚,列清楚,页眉页脚全部去掉。4 ]8 ^" }* @: D8 l. N" S! g9 P
我要疯掉了!
# [, ^7 X1 h9 J" x赶紧把自己那些成年老书给搬出来,deepseek,这是党和人民考验你的时候了!
! D3 l, ?# f0 Q5 h! D====
6 t) @! h  Q: o- g' W中文也很完美。
$ K' L6 d- k+ n, E( M5 x9 F+ L; j经验值,每次十页比较稳定。( m+ y. f$ e; a2 m0 W
现在我这里API还不能用,等恢复了,全自动了。4 A# d% s: D7 }+ z- v2 b* X7 G
====
: T6 N6 f- u$ Q) A第二次疯掉了!
. w: z- S+ n  @3 V我上传英文文件后,让他抓取文字,矫正,然让他按页划分,前面放英文,后面放中文,结果仍然完美。
1 d3 O4 h/ U; n- n. @# L- u6 O( x====
. {1 r- q3 G! R* H* g  t6 r现在我让他从PDF抓取文字,矫正后,按段落翻译,可以一次翻译多个段落,每次翻译不超过一个固定数目,结果仍然完美。
7 R: S1 i4 q' a但是任务多了后,每次翻译的页面数是减少的。: @. T: U$ X$ l3 a! u# Q, p
好吧,我五体投地,继续探索。, c  i. m$ r4 I1 v# t+ P5 H" l
====9 j" x' U5 D$ ]+ |. I2 l
为了防止中间结束,可以告诉他必须所有页面全部处理完就可以了,我现在是应该佩服我自己呢还是应该佩服 deepseek 呢,抑或都佩服。
  C7 X9 H, p0 ~( N8 p====4 H' h+ I$ @' B; I
好吧,有些东西是不给翻译的,哈哈。
; ?* x: Y  [. r6 S
  _7 ~' _8 N: h8 X) z0 }- _Sorry, that's beyond my current scope. Let’s talk about something else.6 O4 d, X# g; ]
====' Q+ T" X4 ~  q% t# t6 L; i+ n
然后我的英文命令也让deepseek 帮我修改,呵呵。
+ b8 w3 o( ~0 y; V1 H====' [3 ?; O2 a5 v* k* T& E
日语的文本他也可以处理,过程一模一样的。问题也是一模一样的,假名太多,汉字很少,我不懂日语,翻出来都不知道对不对。( {6 ]; s- t& f5 s8 q5 \. A; i% P# I9 @
====/ ]- U& v& p+ m
时间段的话,北京时间的下午和晚上用比较好。
: p" S! w- S: M" D后半夜和早上,美国人上班了,要么在用,要么在黑客攻击。( i- g5 x: t' ~3 w5 e
====
% [0 {  j, I; T) V+ q用千问吧,非常稳定,非常强大。( M: ?1 a' |2 c' d  {, T
https://chat.qwenlm.ai/5 [  g7 C$ ^. {, D% O
====' i! \; [$ Y  {  B: B* @% O
Deepseek,API 看上去可用了,但是不给充钱。) k2 N/ P( E$ r6 Y0 e2 P+ h' g. I* _

0 E; |; ?) q% u1 {3 H& U2 o6 L& ?" j2 e2 M' v

: _$ Q) Q, D0 E; V- Q4 E

评分

参与人数 7爱元 +62 学识 +2 收起 理由
笑羽 + 10
老财迷 + 8
唐家山 + 4
pcb + 4 谢谢分享
老票 + 2 给力

查看全部评分

  • TA的每日心情
    开心
    22 小时前
  • 签到天数: 3369 天

    [LV.Master]无

    沙发
    发表于 2025-2-2 03:53:32 | 只看该作者
    这功能很赞呀

    评分

    参与人数 1爱元 +10 收起 理由
    indy + 10

    查看全部评分

    回复 支持 反对

    使用道具 举报

    该用户从未签到

    板凳
     楼主| 发表于 2025-2-2 03:56:21 | 只看该作者
    马鹿 发表于 2025-2-2 03:536 o' ~1 ^3 u# _- {) i( ^+ ]
    这功能很赞呀
      {5 ~, }  _4 m- M, l  s  j. Z: G
    简直太赞了,我现在正在思考还有什么工作需要 deepseek 干的,现在的上限是我的上限,不是 deepseek 的上限。

    点评

    给力: 5.0 油墨: 5.0
    油菜: 5.0
    油墨: 5 油菜: 5
      发表于 2025-2-2 08:23
    给力: 5
      发表于 2025-2-2 04:41

    评分

    参与人数 2爱元 +20 收起 理由
    笑羽 + 10
    indy + 10

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2022-1-1 00:00
  • 签到天数: 793 天

    [LV.10]大乘

    地板
    发表于 2025-2-2 04:13:28 | 只看该作者
    有没有上传整本书试试
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    5#
     楼主| 发表于 2025-2-2 04:27:15 | 只看该作者
    indy 发表于 2025-2-2 04:13  }- X* k- i- t/ j
    有没有上传整本书试试
    5 w  [9 Q' W0 a: [
    目前看来,差不多十页左右就停止了,看看还有什么诀窍不。

    评分

    参与人数 1爱元 +10 收起 理由
    indy + 10 谢谢分享

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    22 小时前
  • 签到天数: 3369 天

    [LV.Master]无

    6#
    发表于 2025-2-2 04:41:51 | 只看该作者
    本帖最后由 马鹿 于 2025-2-1 15:43 编辑 , v' k0 K- [4 l- \5 d1 |
    + n2 l/ m+ i3 F6 X9 m# ]% i
    以后让deepseek 读出土的竹简
    ' u$ s$ P, P- b* R: p6 U1 N8 d3 `( \. O9 G5 W+ x3 W! h
    还有把古文翻译成现代白话& |9 E8 |3 b! ^+ u" o# B: _

    1 ?* x1 X9 d; i8 M9 J2 w0 T0 J以后不认识的字不查字典了, 直接问deepseek
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    5 小时前
  • 签到天数: 2529 天

    [LV.Master]无

    7#
    发表于 2025-2-3 01:23:54 | 只看该作者
    请教是如何实现的?
    " z0 d8 N" S! ]; J+ _+ U: k% ?$ F9 u  X$ Y" Z$ x
    我在网页版和手机版都尝试了,都不行,网页版上传PDF文件始终不成功,手机版上传之后,发出指令提取文件中文字,始终是文件解析中。直接在DS里问如何上传PDF文件,并提取文件中文字,照做其实是一样的。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    8#
     楼主| 发表于 2025-2-3 03:06:35 | 只看该作者
    方恨少 发表于 2025-2-3 01:23
    6 G0 h" S+ `6 @; U* o$ l2 K$ L请教是如何实现的?; ~3 I( N9 ]7 M' X/ O) D
    : ?& Z7 `: G! i7 |. g: p# O
    我在网页版和手机版都尝试了,都不行,网页版上传PDF文件始终不成功,手机版上传之后 ...

    / V$ `0 A4 [7 R! Q; c, T& G: [% ~# }+ g: [
    我现在也上载不了了,"upload failed",几个小时前还好好的,应该是服务又受攻击所以功能收缩了。
      \. \* T8 y' V2 V, {: `, t文字之类的没问题。估计deepseek现在暂时只保证主要功能。
    5 d( Z5 B: E. r) J美国人就这样,打不过就耍流氓,估计要等一段时间才能完全恢复。
    , y; t9 y# X; R; u* R  K7 X( S

    点评

    给力: 5.0 涨姿势: 5.0
    给力: 5 涨姿势: 5
      发表于 2025-2-3 03:40
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    9#
     楼主| 发表于 2025-2-5 00:15:37 | 只看该作者
    方恨少 发表于 2025-2-3 01:23
    6 ~0 f$ n8 P/ L2 V5 h- i6 t; t请教是如何实现的?
    8 v# a$ R' C4 ]; _$ r
    / l9 S4 ?, d) L' C, t  E  v我在网页版和手机版都尝试了,都不行,网页版上传PDF文件始终不成功,手机版上传之后 ...

    8 m3 o: W: w" F1 P) ?https://chat.qwenlm.ai/5 f, Q! p* \. n8 N
    试一下千问,估计美国人没有攻击他,所以资源敞开用。
    8 u) k4 E- E# ~% U很稳定,质量不错,好像最多一次处理15页。
    5 H) @# Z: P( K/ O( y; m7 e: V& K5 G我直接拿deepseek的指令用,没有区别。
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2025-2-22 22:50 , Processed in 0.035797 second(s), 19 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表