文学馆 > 这个系统能退货吗 > 第三十三章:

第三十三章:


可惜实际运用环境不会那么理想,而是就像林雨以前寝室中4个人一样千差万别,虽然大家说的都是中国话,但是四个来自不同地方的人的口音却大相径庭,刚刚住在一起的时候四个人沟通经常有些问题,但是大家很快就适应下来。

        人脑强悍的学习能力绝对不是当今电脑所能够比拟的。而现有的语音识别软件却没有这么强悍的学习适应能力,也就是说它没有用来识别这种语音特征差异的知识库,当然就无法将一些未知类型的发音很好的识别出来。

        不同口音的识别和环境噪音的排除是语音识别俩个难题,要解决这些问题需要大量的第一手语音资料片段来建立一个海量的语音特征知识库,或者是开发出高度智能的超级电脑。

        但林雨手里已经有一个完成品,现在只需要补充一下资料库就行啦。相比自己开发简单太多啦。

        系统根据林雨下载的理论资料,结合各种语音片段分析,不断对语音识别基础算法进行了更新,并且生成不同的语音识别模拟器--这是主要考虑到地球现在主流电脑的运算水平实在太低级。

        以模拟iphone4s的50%运算能力为最低基准,系统模拟出不同性能情况下该语音识别算法的准确率和反应时间,原始版本从最初基准性能下5秒内能够达到90%的识别准确率--当然这个成绩已经远超现在地球上所有语音识别软件水准。

        要知道这个90%准确率是用数千段不同语境的不同口音中英文语音信息进行模拟识别检验,也就是说基本上考虑了各种口音及噪音的过滤处理。

        这个成绩已经比现在只会听英文的苹果Siri要强多了,毕竟Siri现在能够识别的也是比较标准的英文发音。不信你拿印度口音和新加坡口音的英语录音片段试试看Siri能够识别出多少来。

        如果是在一台模拟性能接近双核2G以上主频电脑上,这个指标的识别水平将会提升到2秒以内达到97%以上准确率,反应时间同识别准确率其实有些冲突,因为要识别更加准确必须要原始版本的语音语料库基础资料来源更加丰富。

        声音采样越广泛识别准确率越高,而语音样本库越庞大,用于搜索匹配的时间就会越久导致反应时间的延长,因此语音样本的抽样压缩和语音搜索匹配算法一直是克里优化的俩个重点。

        系统一直在不停地模拟改进提取语音语义特征值的算法,通过不断压缩冗余值,在保持不失真的情况下持续不断缩小语音样本语料库大小,另外一方面也不断改进对语音语料库智能搜索匹配算法。

        优化算法林雨帮不了什么忙,但是收集尽可能多的语音样本林雨却没有问题,所以林雨的每一天都过着一种非常充实的生活,日复一日地搜索下载不同类型的语音样本供系统分析提炼。

        而系统现在做的就是在地球上现有语音识别理论和算法基础上,利用他强悍到无边的模拟能力,不断地模拟各种不同的语音处理算法。

        通过模拟来找到一种更加有效的--这种方法虽然有些笨拙,但是有了系统超强的运算能力,毕竟每秒钟成千上万种可能算法都可以模拟,使得这种笨拙的方法也有相当的效果,找出了好几种可能的优化算法,将识别率和反应时间提升到了一个新的高度。

        这可是要将这些成果用地球人能够理解的语言和理论写出来,还要让人能够看懂的。

        因此林雨几乎二十四小时不间断地不断忙着,开着脑外加载模拟算法,要能够在最低基准上面实现1秒内达到97%识别率,而在双核2G主频电脑上实现1秒内99%以上识别率之后,足足就用了三天的时间。

        在林雨看完十几本数学专著,下载研究了好几个开源语音识别软件的基础上,才完成了语音识别新算法的论文和开发完成一个在地球电脑上运行的语音识别软件。而这个语音识别软件的第一个应用就是包装成为一种语音输入法。

        幸好林雨一直开这脑外加载,不然非带把脑袋烧坏不可。

        海角论坛。完成语音识别软件和论文写作俩个任务,林雨现在是一身的轻松。

        他注册换了一个马甲加入到一个对《这个系统能退货吗》剧情发展讨论贴中,为了测试新软件,只见他对着电脑麦,尽量模仿各种不同的腔调口音说着话,这些话很快就被电脑识别变成文字去回复论坛中各种文青对人物和剧情的分析。

        林雨对剧情了若指掌,分析起来当然头头是道,往往是一大段一大段的精辟分析,很快就引起了粉丝们的关注,当然有了语音识别输入,林雨的虽然回复内容实在,可是每次回复却还是比论坛中任何人都要快速。

        感觉就算比起专业速记人员也毫不逊色。

        “嘿,哥们你用的是神马输入法,怎么回复那么快,几乎是秒回了?”一个文青终于忍受不了林雨这种飞一般的回复速度的好奇,忍不住发问了。

        什么输入法?林雨一愣,随即反应过来,自己为了测试刚刚开发出来的语音识别输入法,一时间没有注意控制速度,没想到如此拉风的秒回竟然不知不觉就引发了关注。

        “一种新型的语音输入法。”林雨变幻着用一种类似老赵的铁岭声音说道,立刻电脑屏幕上准确将他的语音转换成文字,收录到的老赵语音样本不少,识别率自然完全没有问题。

        在刚才的讨论中,林雨已经用他能够想出来的所有发音方式进行了模拟测试,识别准确率百分之百,虽然他现在只是将电视机声音调小作为背景噪音,离一个复杂噪音环境还有一些距离,但是由于林雨变幻着不同口音和语气,能够达到这种水平,几乎可以看到,键盘输入法的时代结束了,这款语音输入法的推出将宣告一个新输入时代的开始。

        “嗨,哥们,你逗我玩儿吧,企鹅语音输入法我用过,那有你这速度和准确率。”那个文青不相信的回复道。

        “呵呵,刚拿到的内部测试版本,哦,极音输入法,不出意外的话很快你就能够从各大网站下载到预览版了。”林雨不禁随意地杜撰了一个类似软件名字回复道。

        “真的还是假的?哪家公司研发出来这么牛的输入法?”

        “这是公司才开发出来的最新作品。正在测试中,呵呵,不过真的好用。摆脱键盘的感觉还真是不错啊”

        “收费还是免费的?免费的话能不能将你的测试版本传一个给我,我的邮箱是xxx@email.”

        “大哥,跪求发一个到ooo@789.”

        很快贴子讨论就偏离了方向,开始有越来越多的人关注到这俩个人的对话,到最后都加入到求极音输入法的行业,一时间满屏都充斥着求极音语音输入法的回复。

        再度创造一个轰动效应的林雨,完全没有想到一个软件实测居然会如此演变,由此可见这个语音输入软件的适用范围实在太广泛了。

        但是林雨这次没有头脑发热就答应下来,他就算再缺乏情商,也知道这个时候把软件免费发出去是绝对不合适的,可见随着智商的激增,尤其是经历了那么多事后,林雨的情商还是有了那么一点点的进展迹象。

        但是怎么赚钱呢?是免费模式,还是注册收费模式?这还真是一个问题。林雨挠了挠头,初步测试如此成功,引起的反响也非常不错。

        一会还有两更,嗯!三更!还有三更!谢谢大家的支持!

        ;


  https://www.bqvvxg.cc/wenzhang/29/29907/1679305.html


  请记住本书首发域名:www.bqvvxg.cc。文学馆手机版阅读网址:m.bqvvxg.cc