设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
楼主: 燕庐敕
打印 上一主题 下一主题

[科普知识] 语音识别漫话

    [复制链接]
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    跳转到指定楼层
    楼主
    发表于 2011-6-23 13:14:46 | 显示全部楼层 回帖奖励 |倒序浏览 |阅读模式
    第一章
    1 U" D4 T6 |/ N8 a' p# S' ]9 K
    随便聊聊语言和语音
    3 d# v3 ^! E; _$ q1 J1 M) K1 f. a. u
    语言是什么,语音又是什么?各个百科书上的定义不尽相同,又大致没什么明显差异。
    & }3 C' G) b. p' f; i- ]: A
    举语言为例,百度百科如是讲:“语言是思维工具和交际工具。它同思维有密切的联系,是思维的载体和物质外壳和表现形式。语言是符号系统,是以语音为物质外壳,以语义为意义内容的,音义结合的词汇建筑材料和语法组织规律的体系。语言是一种社会现象,是类最重要的交际工具,是进行思维和传递信息的工具,是人类保存认识成果的载体。”

    1 e8 T) n# }2 n$ S8 V1 {1 e
    维基上则这样讲:“语言是一套共同采用的沟通符号、表达方式与处理规则。符号会以视觉、声音或者触觉方式来传递。”
    # ]4 l3 _! ~& D* ^
    而互动百科上说:由于研究方法和角度的不同,人们对语言的定义多种多样。有代表性的说法就有几十种。
    5 u! u/ t$ E0 c, y' p1 k. x
    无论如何,语言是人类创造的,用以承载和传递信息的工具。这个对于语言作为工具性描述的定义,包括人类创造的非自然语言(如世界语)和机器语言,也都符合要求。虽然,这个定义没能涵盖语言的其他功能。

    0 x- e, g  h2 \& E: |0 A
    语言是怎样起源的?现在没人说的清楚。中国的古代文献里只提到仓颉造字,也不知有没有文献里记载语音的产生或者探讨语音的产生。我不是这方面的专家,还请老丁,太傅,张王,虎老师,江城等诸位国学深厚的大拿说说。至于西方,也并无类似记载。有记载的唯有中东的古埃及时代。
    . }1 U2 m9 J4 i! r* g# z8 E
    在古希腊史学家希罗多德的《希波战争史》的上卷曾记载有这样一个故事:公元前6世纪古埃及努比亚王朝那个驱逐了亚述占领而复国的名叫萨姆提克一世(或者几世)的法老,他很想知道哪种语言是世界上最古老的语言,于是就把两个初生的婴儿送到与世隔绝的地方喂养,严禁任何人在他们面前交谈。两年后的一个早晨,这两个孩子突然手舞足蹈地喊出了“biex”这个词。法老派人查访后,发现腓尼基语中有发音和这个接近的词,意思是面包。于是法老就宣称腓尼基语是世界上最古老的语言。如果这个故事是真的,那它告诉我们,古埃及人对语言 的起源问题很早就有兴趣,并用他们想当然的方法进行了有趣的探索(岑麒祥,1985)。希罗多德的下卷记录希波战争很是确切,但是上卷类似随笔,记载各地风土人情,传闻轶事,所以这个我以为算是孤证,因为这件事距离他本人也有近百年了。

    * n. p( S% _7 U/ @
    从两千多年前的法老到十九世纪,各种关于语言起源的理论非常多。比如有人认为语言起源于原始人劳动时发出的声音(唷,希呵理论);或模仿大自然的声音慢慢建立语言(叮当理论);还有认为是模仿动物的叫声开始的(Bow wow理论)。这些理论多数没有什么科学价值,也就是把科学的东西和宗教,哲学的混在了一起,而且在方法上也是用哲学方法推测,不是科学方法实践。这些说法都是不可能有反证的,因此也没有被证明的可能性(王士元,彭刚,2006)。几百年来许多哲学家和语言学家耗费大量精力来研究这个问题,事实上倒是阻碍了语言学的进展。结果1866年法国语言协会订立了一条规则,不接受有关语言起源的报告和文章,此后多个语言协会也订了类似的规则。结果,此后100多年,没展开过什么语言问题起源的讨论。

    5 O, ~% n" ]! T& E7 S; [2 {+ Z
    下面说说语音。

    评分

    参与人数 3爱元 +15 捐资 +2 学识 +1 收起 理由
    煮酒正熟 + 5 + 2 + 1
    万里风中虎 + 5 欢迎老燕
    海天 + 5

    查看全部评分

  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    沙发
     楼主| 发表于 2011-6-23 13:27:08 | 显示全部楼层
    回复 雪个 的帖子/ t9 k! m* ]5 r% @9 p0 U
    1 N7 P" h, Z) ?7 h* A4 [
    发错了,应该是科技探索那里。太傅能不能给转版?
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    板凳
     楼主| 发表于 2011-6-23 14:31:14 | 显示全部楼层
    回复 燕庐敕 的帖子
    2 i  q, K0 q& N8 k! r4 X2 h% V9 Y
    ! B' H$ y; u* [能转到哪里算哪里吧。
    " D' y0 N8 A& K* g2 u4 Y) Z$ Q" |4 C, R0 K& A- y5 y  j
    这个才开始写,当年答应你和仙人的。俺没有说话不算,就是太拖拉了---那年是2007年。
    - O7 H( ]; f2 C2 m. @2 u4 [
    " y  V; r' b) P杂七杂八写了一些类似八卦的棋手的故事,放在哪个版面好?
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    地板
     楼主| 发表于 2011-6-24 08:55:41 | 显示全部楼层
    回复 Radiohead 的帖子
    . k( s, \6 N  f: x& `
    ) \2 |5 `% g; ~% i; x; e7 }2 }李开复在真实意义上,就是用统计学实现语音识别的第一个成功实践者。
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    5#
     楼主| 发表于 2011-6-24 08:56:12 | 显示全部楼层
    回复 PenPen 的帖子
    + }' x7 O" ?  u9 g. e' ]( V. F$ d  l7 Q% b9 M
    当然,绕不过去的。
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    6#
     楼主| 发表于 2011-6-24 09:00:03 | 显示全部楼层
    回复 穿越 的帖子. T) z& i& Y4 J- s/ e
    5 C* L& m3 L4 A( I8 H$ m. h  ?
    师弟好
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    7#
     楼主| 发表于 2011-6-26 23:06:47 | 显示全部楼层
    回复 darkingwing 的帖子
    & ^, ^% F; j9 d. B
    ' j) ?& T& j" S% K这个展开就太广了。基因决定了可以发出复杂的声音到人类学会用复杂而抽象的声音表达复杂的意思,这个课题恐怕远远大于语音识别。我没能力在这里探讨这些。
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    8#
     楼主| 发表于 2011-6-27 12:43:53 | 显示全部楼层
    回复 darkingwing 的帖子/ Q) Z, F4 r$ \4 }
    * H( q: G5 {! V2 g- ^
    慢慢往下看,我会提到的。
    2 w" M% D7 p$ x0 y1 s/ v. B$ N, k! B5 Z
    这个不是我的专业,是家里领导的。不过20年了,真就是没吃过猪肉还没见过猪跑吗?
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    9#
     楼主| 发表于 2011-6-27 16:32:10 | 显示全部楼层
    回复 暗夜雪武 的帖子# \% l9 p( W8 }  L6 ]' m! Z

      d7 g( h8 h" z没写好呢,慢慢来。

    点评

    慢慢写  发表于 2011-6-27 16:33
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    10#
     楼主| 发表于 2011-6-29 09:18:13 | 显示全部楼层
    本帖最后由 燕庐敕 于 2011-12-2 21:31 编辑
    . l" [: F' [' b5 K% o1 o! U6 d
      }$ Z1 t! z& q& }& a+ H回复 定风波 的帖子
      H! G- Q' ]0 W( M0 E. T0 L6 O- [7 c: l0 z3 y. ]! S
    微软收购Dragon之后在语音方面确实进展很大。
      H+ }. m6 L/ t1 o3 b8 Z1 k$ l* {% R0 E6 a  n
    当今最好的是合并了野火之后的Nuance,他们的英语语音识别已经商用化多年。
    : Q# x' x: y  `; y5 k) {9 ~" u) m* I% ~; x% v
    国内他们也进入十年了,主要是和华为这些方案商合作,卖端口。' L5 D" @1 o) _% r
    1 i5 c  h( ?2 ?6 M' ^( m5 t
    现在也力图与银行机场等合作。遇到的最大对手是科大讯飞。7 X: @9 B" `5 ^# p( P
    ( i0 \8 F8 X; K" S( l% E. i) m# g% q
    方言与普通话或者英语或者其他什么人的语言在实现上没什么区别。最主要就是大字表和字库的训练,还有句子/词的切分。训练的越多自然效果越好

    点评

    确实是这样,不然也不会进入工程化阶段,进入工程化意味着已经没有什么重大的paper可以在3,2年内发出了,应用也就开始定型.  发表于 2011-6-29 10:53
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    11#
     楼主| 发表于 2011-12-16 11:40:11 | 显示全部楼层
    抱朴仙人 发表于 2011-12-16 05:40 ( B  e- l1 Y  B( x, l0 S9 w2 W
    哇!终于动工啦?这可是个计划已久,光光预告就出了三四次的大作呢。期待期待,搬个小马扎坐下听讲 ...

    4 ?6 I" Q( R1 l# Y就是您老和雪太傅的那个“文科生也要能看懂”的光辉指示,害苦了俺也~~~~

    点评

    俺在河里就是有名的文科生呢,我都看不懂怎么行呢?嘻嘻  发表于 2011-12-16 14:15
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    12#
     楼主| 发表于 2011-12-16 22:42:21 | 显示全部楼层
    包子 发表于 2011-12-16 21:11
    % G; g6 r( U1 F3 U9 S( P9 ?上次玩微软的语音识别,读了本古文观止,顺利的识别了 “郑伯克段于鄢”,吓的我够呛! ...

    * j$ `1 a$ A$ L' T8 N1 E4 s微软在1990年代之前并无专门研究语音的部门。后来收购Dragon之后,在微软研究院也开展的这方面的工作。
    4 u$ {9 `- M- `( i" ~
    " [0 f4 F( @) e  M当今技术大概算第二吧。
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    13#
     楼主| 发表于 2011-12-22 15:54:05 | 显示全部楼层
    PenPen 发表于 2011-12-22 15:42
    ( L5 ]8 a, A8 G- C( `研究院那帮人是不是都专注于发paper去了?tellme做得这么烂,被siri甩的好远了 ...

    ( I8 n+ ?+ x- j1 z$ r这个么,应该问张亚勤,不是问我。
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    14#
     楼主| 发表于 2011-12-23 08:43:12 | 显示全部楼层
    洗心 发表于 2011-12-23 04:44
    % E( g* D" ?% g2 w这个是师兄的老本行啊。
    ( M. G# \$ }% F2 G7 @0 L5 W7 @3 i) f: ]# v
    一直想找一个比较好的汉字语音识别的软件,把语音自动转化为文字的。请问师兄有什 ...

    * S. j* }* J1 _. v6 d8 W师妹,这个真不是我的老本行,是家里领导的。我算是没吃过猪肉,看了20多年猪跑吧。
    . [; ?) g# x; C  f- q+ X
    , q& ^, y, d! o+ O' A具体的,面向个人的汉语语音识别软件,我还是回家问一下你师姐吧。
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    15#
     楼主| 发表于 2012-1-19 23:18:55 | 显示全部楼层
    茉莉 发表于 2012-1-19 23:11 8 ^  G2 E2 Z* P
    甚麼時候有下文?期待

      h, P  b: C& D+ H. j" R' B4 ^" X我也不知道。

    点评

    挖坑要趕快填呀@_@  发表于 2012-1-19 23:20
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    16#
     楼主| 发表于 2012-3-7 17:17:29 | 显示全部楼层
    就爱抬杠 发表于 2012-3-7 17:15
    : n7 i! W% F4 @2 `3 S啥时有下文?等得花儿也谢了

    * w4 v& E4 x( [% Q# {/ Y7 U4 L我现在还没稳定下来,还在找工作,诸位可不可以有点同情心,同理心?!

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2024-5-17 06:23 , Processed in 0.056609 second(s), 25 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表