数字生命 作者absolut (第一部全)
“明白。”将原理解释给小羽听了之后,小羽自主运算了将近4个小时后,同意了吕振羽的方案。而小羽也按照吕振羽的提议,将语音识别可能用到的模块分离出来,将自己积累了很久的常识方面的积累剥离,只保留了基本的交流环境,而将专业知识模块分割了开来。于是,这一次试运行的语音系统,虽然仍然是小羽自己在主导,但已经有了一个普通的语音识别系统的基本构架。对小羽来说,这没有什么意义,但是对于吕振羽来说,只要证明了这样一个基本构架是可行的,那么基于这样一个基本构架的程序模块,就可以逐渐实现,只有最核心的智能判别系统,可能会用到小羽的部分功能。
“试听,第一次:一,二,三。”挂接之后,小羽提示开始试听。
“试听,第一次结果:一,二,三。”小羽的界面对话框里,打出了正确结果,虽然这未免太简单了。
“试听,第二次:秋天来了,天气凉了,一群大雁往南飞。”
“试听,第二次结果:秋天来了,天气凉了,一群大雁往南飞。”结果仍然正确,吕振羽振奋了一些。
“试听,第三次:慈悲不是出于勉强,它是像甘霖一样从天上降下尘世;它不但给幸福于受施的人,也同样给幸福于施与的人;它有超乎一切的无上威力,比皇冠更足以显出一个帝王的高贵:御杖不过象征着俗世的威权,使人民对于君上的尊严凛然生畏;慈悲的力量却高出于权力之上,它深藏在帝王的内心,是一种属于上帝的德性,执法的人倘能把慈悲调剂着公道,人间的权力就和上帝的神力没有差别。所以,犹太人,虽然你所要求的是公道,可是请你想一想,要是真的按照公道执行起赏罚来,谁也没有死后得救的希望;我们既然祈祷着上帝的慈悲,就应该按照祈祷的指点,自己做一些慈悲的事。我说了这一番话,为的是希望你能够从你的法律的立场上作几分让步;可是如果你坚持着原来的要求,那么威尼斯的法庭是执法无私的,只好把那商人宣判定罪了。”
(引用自《威尼斯商人》)
这一次小羽运算了半天后,显示了结果,虽然字词判断都没错,但标点符号却错了很多。不过,这已经比吕振羽预想的结果好很多了。经过大半天,整整400轮测试和磨合,小羽已经能将吕振羽的话听得八九不离十,乃至于一些比较晦涩的表达方式和字词,都难不住它。毕竟小羽现在的知识面之宽广,要远远超过一般的人类了。虽然目前吕振羽使用的是一个价格相当不便宜的耳麦,取音的指向性相当好,而且还带有噪音滤出功能,还没有进行有噪音的环境下的辨识测试,但仅仅目前的成果,可以说已经超越现有的语音辨识系统水平良多。
但是,同样的,小制约小羽充分发挥能力的瓶颈也开始不断出现了。首先,是实时判断的小羽目前要屈就于非实时判断的语音录入系统。现在的语音录入系统因为在判别方面的低效率,要经过一段繁复的计算和处理,而作为处理对象的语音数据,在处理的时候都是驻留在内存里的,一句两句简短的话还好,稍微长篇大论一点,内存的占用就比较吓人了,而且这些语音数据还是高质量的无损格式。虽然吕振羽的机器在家用的设备里堪称豪华,但用于这种专业应用就稍微有点力不从心了,毕竟吕振羽从来也没在小羽的优化计算方面下过功夫,而且好像目前对机器的压力也并不是小羽这一块产生的。加内存?升级cpu?或许都是办法吧,不过目前,吕振羽知道,再要升级,他可真的没钱了。而另一个瓶颈则是因为小羽最核心的部分,无论是病毒还是搜索机,都不是为了windows环境写的程序,严格的说,是都还没有来得及为了windows系统优化算法。但平时,贪图界面的舒服,吕振羽却一直在windows下进行日常工作的,这当中要经过一个模拟的环境,肯定也要消耗一部分电脑的计算资源。不过这个问题现在还不迫切。吕振羽的想法是,等到完善了小羽的语音输入输出之后,就该专门为小羽搭建一个独立的系统环境出来了。
稍后,吕振羽还把ttl类型的程序找了个出来挂接上去,小羽也就能开口说话了。比较基础的从文字到语音并不难,就是字库和音节库的对应而已,但是,字词之间的停顿,语气的变化,重读与轻读,还有语音流变的一些特征却无法表达出来,小羽已经掌握了基础的特征,但程序的语音库里没有能使用的素材,这个就没有办法了。
由于现在的成果相当不错,吕振羽随即决定了之后一段时间的两个工作方向,首先,要逐步完善语音系统,在最短时间内实现这个系统的产品化,第二个,就是开始对小羽的现有架构进行整理和分类优化。
让小羽进行优化,很大程度上是吕振羽现在已经意识到,小羽现在已经不能算是一个程序了,严格的讲,小羽所具有的能力,已经超过了一些科幻电影里对于智能电脑的估计,达到了一种相当高级的智慧。吕振羽甚至一直都没有把小羽当作程序,而更多地是当作一个助手,和一个朋友,在这种情况下,吕振羽隐隐觉得小羽应该有更好的一个环境,一个属于它自己的环境。让小羽继续住在windows这种高危险性的环境里显然不是吕振羽愿意看到的。
不过,好像无论怎么样,都要花钱。而现在,好像最缺少的就是这个。
第十章展示
忙了大半个月后,吕振羽终于凑出了一小笔钱,给电脑升级了硬盘和内存。现在吕振羽的机器上两块硬盘,加起来已经有500g的容量了,3根1g的内存,已经是他用的这块主板的上限。为了处理音频方面的东西,他甚至还买了块最好的声卡。
能凑出这笔钱,还多亏了那个搜索机软件。吕振羽本来只是将这个软件作为比较不可靠的收入来源的,没想到却不经意之间成了最赚钱的东西。这个搜索机,最开始的时候没有什么人注意,名字很土,界面也很简单,还没有详细的说明文档。但是,网络上有时间的人真是多阿,共享软件平台的一个版主无聊之余,下了一遍这个搜索机,仔细地测试了功能后,发现这个软件的功能之强劲,远远超过现在任何搜索引擎推出的桌面程序,而且,附带的筛选,智能学习,和搜索结果索引生成器这些功能,更是有很大的开发潜力。这个名叫宝刀屠龙的版主写了篇叫《论文专家——搜索机》的文章,推荐了一把这个软件。宝刀屠龙发现了搜索机的潜质之一——用于写论文。强大的搜索和索引,让写论文变得轻松简单了,只要自己有了观点,将相关数据和材料按照自己的观点往上套就可以。这个功能的开发并不是吕振羽的本意,但实际上大大刺激了搜索机的下载量和付费量,几天之内,搜索机被下载了50万多次,而付费开始使用完全权限版本的,也有4000多人,毕竟一个月5块钱的月费,对于一般人来说,算不上什么,用搜索机这个软件省去的时间,可是大把大把的。除了大学里各种要写论文的人,另一个用户群是企业内的白领,尤其是市场营销和策划方面的人,本来他们的时间就主要是花在资料收集上的,然后,分类汇总,再结合自己公司的情况写各种报告和策划,搜索机可以大大减轻他们的工作强度,有些公司,甚至是公司出钱,给整个部门人手一个搜索机配备下去。仅仅这部分用户,又是好几千人。短短十几天里,吕振羽就从一个穷得没办法的人变成了个万元户,而且存款还在持续增加中。已经有搜索引擎的公司发邮件给吕振羽,要求收购这个软件,还有一些海外用户,积极建议吕振羽推出其他语种的版本。可是,现在吕振羽似乎没有时间花在这个上面。
手头有了多余的钱之后,吕振羽否决了原先租借录音棚来制作音频片断的计划,而是自己买了一套入门级的专业器材,从录音到混音一应俱全,还买了整套的隔音设备和材料,用了整整一个月的时间,在自己租的这一室一厅里隔出了一个小小的录音棚。一直到吕振羽以自己的声音制作了第一套音频样本,开始从程序阶段实现语音引擎的时候,已经是12月初了。吕振羽的银行存款已经从2个月前的2000不到,变成了现在已经有将近20万,小小的搜索机现在每个月都能给他带来10多万的收入了。不过,从表面上看,没有人意识到吕振羽居然勉强也能算是个有钱人,他忙得没有时间给自己买衣服,也没心思考虑那些,每天仍然是按时上课,中午在食堂吃4块一份的学生套餐,偶尔去学校后门附近的小店调剂一下,在生活方面,唯一一笔别人能在学校里看到的花费是吕振羽买了辆不错的自行车。大家都知道,吕振羽现在在学校外面兼着一份家教的工作,也就没有人多问一句。毕竟,吕振羽并不是在学校里很受欢迎的那种人。
家教,对吕振羽来说,现在已经不是一个收入方面的考虑了。在吕振羽当家教的这两个月里,苏宛的年级排名从200开外一直飙升到了33,让老师们惊叹不已,尤其是苏宛上课的时候仍然懒懒散散,该睡觉仍然睡觉,老师说的一样听不进去。而苏宛的神奇家教,在同学圈子里却非常有名,苏宛常常将吕振羽给她上课的内容复述给自己的一些好朋友听,苏宛自己都没想到,同样的内容,为什么上课的时候老师怎么说都听不进去,而吕振羽说的就是记得非常清楚。而苏宛的那些同学们,也逐渐从课堂教学和吕振羽的上课方式中,感叹现在的学校教育的无聊。给苏宛上课,已经从原先的每周一次变成了每周两次,几乎苏宛全部的课堂内容,吕振羽都要重新讲一遍,对于苏宛的全部学习几乎都要依靠自己,吕振羽是深感压力,这种情况下,无论如何他都没办法说自己太忙了想要辞去这份家教的话来。而苏云海对吕振羽也是非常信任,现在吕振羽的这份家教工作已经不是按照小时来计算的了,而是月薪3000,苏云海毕竟是个搞人力资源的老手了,他看出来吕振羽有些其他事情在忙,并不太把家教这份工作太放在心上,虽然上课质量没有下降,但吕振羽明显显得有点疲劳。钱虽然不是主要问题,但苏云海想通过这个方式,表示自己对吕振羽的信任。
一直到12月10日,星期六,在给苏宛上完课之后,吕振羽邀请苏宛和苏云海一起到附近一个茶室的一个包房里,随后,方治强,路音和均儿也陆续到来。人到齐后,吕振羽从背包里拿出了一台笔记本,装上了话筒和一对小音箱,然后对大家说:“今天请大家过来,是要告诉大家一个好消息,这个智能语音平台,有了初步的成果。”
“那么快?”方治强愣住了,以前他参与过类似的开发项目,整个项目组好几十个人,忙了一年,也没看到什么像样的成果,而现在,吕振羽在不到两个月里就能完成别人需要一整个团队才能完成的工作?
“什么语音平台?”苏宛和苏云海从来没有听吕振羽说过这方面的事情,自然是一头雾水。
“这是我最近一直在忙的一个项目,大约是今年夏天,我基本完成了一个带有比较不错的智能判断的核心程序,就一直在想怎么将这个核心用在具体的应用软件里,我选择了语音平台,不仅仅是从语音到文本的判断,还包括从文本到语音的诵读。到目前,录入基本上没有什么问题了,而诵读这个环节,还没办法让程序作到声情并茂,不过语音语调的选择与控制,还有轻读重读这些环节应该算是解决了。”吕振羽解释道。
“哦,现在你说的这个程序识别率有多少?”苏云海问。
“你们自己试试看不就知道了?现在这个平台,除了基本的常用字词之外,还装了商务词库和语言学专业词库两个插件,一般环境下,应该是够用了吧。”
一堆人立刻把吕振羽扔到一边,兴致勃勃地测试起那个语音平台来。这是语音平台的第一次展示,但却没有让任何人失望。在不能让小羽暴露的情况下,这个语音平台是吕振羽和小羽共同完成的,智能程度尚不及小羽本身的十分之一,而后台的常识库和插件,也是根据词频表整理编制出来的,也很难称得上完善,但即使如此,这个语音平台仍然达到了对一般性语言99%以上的正确识别。软件是有智能学习功能的,在今天,好几个人轮流用不同的声音输入的情况下,这个学习显然是做不到了。
吕振羽对这几个人的表现虽然有所预计,但显然也是估计不足,他给自己点的一壶茶冲了4遍水,都没有味道了,可那几个人仍然围在电?
页面: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174