燕庐敕 发表于 2011-6-23 13:14:46

语音识别漫话

第一章
随便聊聊语言和语音

语言是什么,语音又是什么?各个百科书上的定义不尽相同,又大致没什么明显差异。
举语言为例,百度百科如是讲:“语言是思维工具和交际工具。它同思维有密切的联系,是思维的载体和物质外壳和表现形式。语言是符号系统,是以语音为物质外壳,以语义为意义内容的,音义结合的词汇建筑材料和语法组织规律的体系。语言是一种社会现象,是人类最重要的交际工具,是进行思维和传递信息的工具,是人类保存认识成果的载体。”
维基上则这样讲:“语言是一套共同采用的沟通符号、表达方式与处理规则。符号会以视觉、声音或者触觉方式来传递。”
而互动百科上说:由于研究方法和角度的不同,人们对“语言”的定义多种多样。有代表性的说法就有几十种。
无论如何,语言是人类创造的,用以承载和传递信息的工具。这个对于语言作为工具性描述的定义,包括人类创造的非自然语言(如世界语)和机器语言,也都符合要求。虽然,这个定义没能涵盖语言的其他功能。
语言是怎样起源的?现在没人说的清楚。中国的古代文献里只提到仓颉造字,也不知有没有文献里记载语音的产生或者探讨语音的产生。我不是这方面的专家,还请老丁,太傅,张王,虎老师,江城等诸位国学深厚的大拿说说。至于西方,也并无类似记载。有记载的唯有中东的古埃及时代。
在古希腊史学家希罗多德的《希波战争史》的上卷曾记载有这样一个故事:公元前6世纪古埃及努比亚王朝那个驱逐了亚述占领而复国的名叫萨姆提克一世(或者几世)的法老,他很想知道哪种语言是世界上最古老的语言,于是就把两个初生的婴儿送到与世隔绝的地方喂养,严禁任何人在他们面前交谈。两年后的一个早晨,这两个孩子突然手舞足蹈地喊出了“biex”这个词。法老派人查访后,发现腓尼基语中有发音和这个接近的词,意思是“面包”。于是法老就宣称腓尼基语是世界上最古老的语言。如果这个故事是真的,那它告诉我们,古埃及人对语言 的起源问题很早就有兴趣,并用他们想当然的方法进行了有趣的探索(岑麒祥,1985)。希罗多德的下卷记录希波战争很是确切,但是上卷类似随笔,记载各地风土人情,传闻轶事,所以这个我以为算是孤证,因为这件事距离他本人也有近百年了。
从两千多年前的法老到十九世纪,各种关于语言起源的理论非常多。比如有人认为语言起源于原始人劳动时发出的声音(唷,希呵理论);或模仿大自然的声音慢慢建立语言(叮当理论);还有认为是模仿动物的叫声开始的(Bow wow理论)。这些理论多数没有什么科学价值,也就是把科学的东西和宗教,哲学的混在了一起,而且在方法上也是用哲学方法推测,不是科学方法实践。这些说法都是不可能有反证的,因此也没有被证明的可能性(王士元,彭刚,2006)。几百年来许多哲学家和语言学家耗费大量精力来研究这个问题,事实上倒是阻碍了语言学的进展。结果1866年法国语言协会订立了一条规则,不接受有关语言起源的报告和文章,此后多个语言协会也订了类似的规则。结果,此后100多年,没展开过什么语言问题起源的讨论。
下面说说语音。

雪个 发表于 2011-6-23 13:25:29

回复 燕庐敕 的帖子

这个怎么发这里了?似乎发“原创精品”那里更合适些

燕庐敕 发表于 2011-6-23 13:27:08

回复 雪个 的帖子

发错了,应该是科技探索那里。太傅能不能给转版?

燕庐敕 发表于 2011-6-23 14:31:14

回复 燕庐敕 的帖子

能转到哪里算哪里吧。

这个才开始写,当年答应你和仙人的。俺没有说话不算,就是太拖拉了---那年是2007年。

杂七杂八写了一些类似八卦的棋手的故事,放在哪个版面好?

穿越 发表于 2011-6-23 18:31:26

回复 燕庐敕 的帖子

欢迎老燕 {:209:}!这篇移到原创精品好,那里挣钱多。

好像有个理论说语言的出现极大地加快了人类的进化。

张声语 发表于 2011-6-23 19:20:55

啊,特别想听这个!

Radiohead 发表于 2011-6-23 19:29:15

坐等后续帖子。

李开复做语音很强

PenPen 发表于 2011-6-23 21:20:09

回复 燕庐敕 的帖子

会涉及到基于统计的方法么?想听听老燕的看法 :lol

履虎尾 发表于 2011-6-23 22:17:32


{:237:}等下文

燕庐敕 发表于 2011-6-24 08:55:41

回复 Radiohead 的帖子

李开复在真实意义上,就是用统计学实现语音识别的第一个成功实践者。

燕庐敕 发表于 2011-6-24 08:56:12

回复 PenPen 的帖子

:lol当然,绕不过去的。

燕庐敕 发表于 2011-6-24 09:00:03

回复 穿越 的帖子

师弟好:P

荷子 发表于 2011-6-24 09:55:31

回复 燕庐敕 的帖子

支持老燕{:237:}

赫然 发表于 2011-6-24 22:12:54

回复 穿越 的帖子

我想也是的,应该可以极大地提高人和人之间信息交流的速度。

而文字的出现,提供了信息保留和复制能力。

互联网和数码化,提高了信息交流,保留,复制,还有检索的能力。

darkingwing 发表于 2011-6-26 02:12:36

回复 燕庐敕 的帖子

人类的语言功能由两个重要的基因开关决定,而会用叫声表达特定对象的动物在自然界也不少, 所以哲学家和语言学家不了解生物进化史是不行地

煮酒正熟 发表于 2011-6-26 04:53:27

赫然 发表于 2011-6-24 22:12 static/image/common/back.gif
回复 穿越 的帖子

我想也是的,应该可以极大地提高人和人之间信息交流的速度。


小赫,俺觉得,之所以语言的出现极大推动了人类进化进程,恐怕跟语言对人类大脑的积极反作用有关。或者说是:人类大脑进化到一定程度后发展出了语言,而一旦出现了语言之后,它的不断发展又反过来给予大脑的发展以极大的助力。这大概有点儿象经济与金融的关系(当然,金融对经济有负面作用,而语言对大脑似无负面作用)。

俺胡抡一下,借以欢迎老燕!

赫然 发表于 2011-6-26 05:13:43

回复 煮酒正熟 的帖子

这个角度有理的。

在对老年痴呆的治疗中,语言训练是很重要的一部分。

燕庐敕 发表于 2011-6-26 23:06:47

回复 darkingwing 的帖子

这个展开就太广了。基因决定了可以发出复杂的声音到人类学会用复杂而抽象的声音表达复杂的意思,这个课题恐怕远远大于语音识别。我没能力在这里探讨这些。

darkingwing 发表于 2011-6-26 23:49:01

回复 燕庐敕 的帖子

中文的语言识别几年前据说效率差强人意,不知道现在进展如何,英语似乎已经解决了

燕庐敕 发表于 2011-6-27 12:43:53

回复 darkingwing 的帖子

慢慢往下看,我会提到的。

这个不是我的专业,是家里领导的。不过20年了,真就是没吃过猪肉还没见过猪跑吗?:D
页: [1] 2 3
查看完整版本: 语音识别漫话