暗夜雪武 发表于 2011-6-27 12:59:26

等着看语音啊

燕庐敕 发表于 2011-6-27 16:32:10

回复 暗夜雪武 的帖子

没写好呢,慢慢来。

定风波 发表于 2011-6-29 08:26:18

回复 燕庐敕 的帖子

深入的不知道,微软的语音识别现在已经很好了,据我所知有相当部分的项目已经进入工程阶段,从研究院转了出来。上次看了他们的私下展示,似乎搞研究的那帮人正在攻克中文的方言,反正在云上跑的服务对新闻类节目识别率已经接近完美了,现在的问题似乎是性能不行达不到接近实时的级别,要用几倍的时间。

燕庐敕 发表于 2011-6-29 09:18:13

本帖最后由 燕庐敕 于 2011-12-2 21:31 编辑

回复 定风波 的帖子

微软收购Dragon之后在语音方面确实进展很大。

当今最好的是合并了野火之后的Nuance,他们的英语语音识别已经商用化多年。

国内他们也进入十年了,主要是和华为这些方案商合作,卖端口。

现在也力图与银行机场等合作。遇到的最大对手是科大讯飞。

方言与普通话或者英语或者其他什么人的语言在实现上没什么区别。最主要就是大字表和字库的训练,还有句子/词的切分。训练的越多自然效果越好

yu20022002 发表于 2011-11-25 18:58:19

支持下。。。。。。。。。。。。

fish197 发表于 2011-11-26 00:12:51

老兄,这个太好了,谢谢。

tangculiji2003 发表于 2011-11-28 09:24:07

长见识 唯一的一名游学生回帖 有点害羞啊

小卡 发表于 2011-12-2 18:32:24

当这两个月看足了SIRI的神奇,再回来读老燕的文章,格外有趣。

梦晓半生 发表于 2011-12-5 01:57:59

下面呢?{:198:}

黑JK 发表于 2011-12-6 20:20:22

电子技术的突飞猛进,将庞大的数据基于云的快速检索~实验室还是相当可行的
现在更重要的无线传输的问题,利润的问题

明月回春 发表于 2011-12-6 21:30:16

总觉得语音识别和输入法的内核几乎是一样的。只不过语音还要先把自然音转变成数字信号。内部都是隐含马尔科夫链。真正的先驱应该是IBM 的 Fred Jelinek (贾里尼克)和卡内基·梅隆大学的 Jim and Janet Baker (贝克夫妇,李开复的师兄师姐) 。他们分别独立地提出用隐含马尔可夫模型来识别语音,语音识别的错误率相比人工智能和模式匹配等方法降低了三倍 (从 30% 到 10%)。。八十年代李开复博士坚持采用隐含马尔可夫模型的框架, 成功地开发了世界上第一个大词汇量连续语音识别系统 Sphinx。

抱朴仙人 发表于 2011-12-16 05:40:15

哇!终于动工啦?这可是个计划已久,光光预告就出了三四次的大作呢。期待期待,搬个小马扎坐下听讲:P

燕庐敕 发表于 2011-12-16 11:40:11

抱朴仙人 发表于 2011-12-16 05:40 static/image/common/back.gif
哇!终于动工啦?这可是个计划已久,光光预告就出了三四次的大作呢。期待期待,搬个小马扎坐下听讲 ...

就是您老和雪太傅的那个“文科生也要能看懂”的光辉指示,害苦了俺也~~~~

包子 发表于 2011-12-16 21:11:29

上次玩微软的语音识别,读了本古文观止,顺利的识别了 “郑伯克段于鄢”,吓的我够呛!

燕庐敕 发表于 2011-12-16 22:42:21

包子 发表于 2011-12-16 21:11 static/image/common/back.gif
上次玩微软的语音识别,读了本古文观止,顺利的识别了 “郑伯克段于鄢”,吓的我够呛! ...

微软在1990年代之前并无专门研究语音的部门。后来收购Dragon之后,在微软研究院也开展的这方面的工作。

当今技术大概算第二吧。

jufeng 发表于 2011-12-22 13:56:51

燕庐敕 发表于 2011-12-16 22:42 static/image/common/back.gif
微软在1990年代之前并无专门研究语音的部门。后来收购Dragon之后,在微软研究院也开展的这方面的工作。

...

等待戈多,哈哈,不是了,等着下面...狐狸的那个精油帖明显没有你的技术难度高...

PenPen 发表于 2011-12-22 15:42:39

燕庐敕 发表于 2011-12-16 22:42 static/image/common/back.gif
微软在1990年代之前并无专门研究语音的部门。后来收购Dragon之后,在微软研究院也开展的这方面的工作。

...

研究院那帮人是不是都专注于发paper去了?tellme做得这么烂,被siri甩的好远了

燕庐敕 发表于 2011-12-22 15:54:05

PenPen 发表于 2011-12-22 15:42 static/image/common/back.gif
研究院那帮人是不是都专注于发paper去了?tellme做得这么烂,被siri甩的好远了 ...

这个么,应该问张亚勤,不是问我。

洗心 发表于 2011-12-23 04:44:52

这个是师兄的老本行啊。

一直想找一个比较好的汉字语音识别的软件,把语音自动转化为文字的。请问师兄有什么好推荐的?

燕庐敕 发表于 2011-12-23 08:43:12

洗心 发表于 2011-12-23 04:44 static/image/common/back.gif
这个是师兄的老本行啊。

一直想找一个比较好的汉字语音识别的软件,把语音自动转化为文字的。请问师兄有什 ...

师妹,这个真不是我的老本行,是家里领导的。我算是没吃过猪肉,看了20多年猪跑吧。

具体的,面向个人的汉语语音识别软件,我还是回家问一下你师姐吧。
页: 1 [2] 3
查看完整版本: 语音识别漫话