八喜电子书 > 科幻世界电子书 > 暴改全世界 >

第102部分

暴改全世界-第102部分

小说: 暴改全世界 字数: 每页4000字

按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!



过结合上下文的语境方式,基本做到将大段的语音完全识别出来,准确率相当高。

    不过冯子默认为,还不够好,尤其是在短词汇方面,比如人名、术语、同音词组等方面飞音语音都表现的不尽人意,而且在嘈杂环境的表现更是一场灾难!

    冯子默想象中的语音输入法应该更加智能,分辨更加精准,抗干扰能力更加强大,足以同人耳媲美,甚至比人耳具有更强分辨力的软件。

    简单来说,就是一种具有真正智能,可以在使用过程中根据用户的使用习惯不断进行调整和深度学习,最终达到完美识别用户语音的境界。

    对于准备打造的这款智能语音输入法的核心——智能模块,冯子默可以说是胸有成竹,毕竟有着之前版本的经验以及在扶桑开发的那款车辆应急系统都用到了类似的智能模块。

    唯一让冯子默有些头痛的是对千差万别的用户群语音数据的收集和识别。

    毕竟冯子默主打的是智能识别,但是哪怕再智能,也是需要进行深度的语言学习。

    普通话,作为全国推广的官方语言自是需要首先被攻克的,不过普通话对冯子默想要打造的智能识别系统来说,恰恰最没有难度。

    毕竟普通话有着规范且健全的发音准则,只要这些准则都深度学习一遍,就可以在相当程度上对普通话进行精准识别。

    然后就是各地方言,在初步评估中,冯子默将方言分为两类,一类是粤语、闽南语这种总结出了类似于普通话那种成体系的发音规则,并且有一套所谓正宗发音原则的方言。

    另一类则是只有语言的使用者可以意会,却是不能言传他人的方言。

    对于第一类方言,倒是可以和普通话同样对待。

    但是第二类方言就不能如此省事儿了。

    能听懂普通话和第一类方言,是冯子默对智能语音识别系统的最基本要求。

    在此基础上,冯子默将对第二类方言的识别与带有地方口音的普通话或者第一类方言的识别作为智能语音识别系统的需要具备的进阶版能力。

    毕竟听的懂标准版的普通话乃至特色方言都没什么大不了,能听懂带有地方口音甚至个人口音的普通话以及特色方言才算牛。

    冯子默之前就听过一个段子:说一位南闽籍的老板将一位员工叫到办公室,让他帮你买仙人掌,还特意交代要“黄糊色”。

    员工当时就懵了,心中更是嘀咕着:黄糊色是的什么颜色,没见过仙人掌有黄糊色的啊!

    老板看着一脸懵然的员工,又特意指着电脑桌面图案中高悬的太阳再次强调道:黄糊色、黄糊色!

    员工晕晕乎乎的走出老板办公室,满面愁容,口中还一直念叨着“黄糊色”。

    恰在此时,一位南闽籍同事问这位员工发生了何时,员工将事情完整的讲述了一遍,还一本正经的问同事,黄糊色到底是什么颜色。

    这位南闽籍的同事却是哈哈大笑道:不是黄糊色,是防!辐!射!

    段子虽然是段子,但冯子默深知这个段子反应的却是客观现状,不仅南闽群众“h”、“f”不分,自己作为千湖省的一员,哪怕在国家普通话考核中拿到了二级甲等的证书,同样经常在不经意间在发音上弄混“h”与“f”,至于像“灰化肥会挥发”这种简短的绕口令更是从来没有清晰、快速、正确的念出来过。

    而诸如此类的口音迁移问题在各种版本的普通话和方言中数不胜数。

    因此,想要具备分辨不同口音和不成体系的方言这种能力,冯子默能想到的唯一办法就是深入到群众中去学,向使用这种语言的人群去学。

    当然,不是冯子默自己去学习,而是让准备打造的这款智能语音识别系统去学习。

    至于智能语音识别系统如何到群众中去学习地道的当地语言,自然只能靠语音数据库了。

    要说语音数据库,冯子默第一个想到的却不是飞音集团,尽管飞音集团所研发的语音输入早已进入市场多年,不仅有着不少忠实拥趸,更是有着数量众多的语音输入用户,势必收录有数量庞大且丰富的语音样本。

    不过,飞音语音虽然支持普通话以及数十种方言,但是对于口音问题和第二类方言,飞音输入法自身都不能识别,自然也就没人会在使用飞音输入法的时候说不能被识别的方言。

    因此,在这一类型的乡音、方言的语音标本,飞音集团应该也是寥寥。

    真正被冯子默第一个想到拥有这种资源的公司则是国内社交领域的绝对霸主——迅腾,该公司旗下的QIQ和微书信两款应用软件占据了社交领域绝大部分份额,可谓是无孔不入,装机量更是遥遥领先。

    冯子默具体看中的正是具有发送语音消息功能的微书信,微书信作为社交领域的两座高峰之一,几乎成为了一款装机必备软件。

    坐拥数以亿计的庞大用户群,微书信自是通过语音消息功能收录有近乎国内所有语种、口音的语音标本,而且数据量极为丰富。

    至于社交领域的另一座高峰QIQ,虽然也有相同的功能,但是冯子默认为微书信的语音消息的使用频率应该高于QIQ。

    而且,更重要的是,冯子默认为使用微书信语音消息的人群分布的更为广泛,更具有普遍代表性。

    当然,作为语音标本数据库,论语音标本的丰富程度,还有好几家公司可以与迅腾公司相媲美,比如移不动、联不通,电不信这三大通讯运营商。

    虽然这三家公司不会对所有电话进行录音,但是如果他们想获取语音标本,那完全是不费吹灰之力,而且可以做到精准录音,各种语音标本自是可以做到应有尽有。

    不过这三家公司好歹都是国企,节操在一定程度上还是有的,况且大瑞宪法第四十条明确规定:大瑞公民的通信自由和通信秘密受法律的保护。

    冯子默相信,以这三家公司的高傲,绝不会弯下身段与自己搞合作,更是不会铤而走险冒着违法的风险,给自己提供语音标本。

    是以,冯子默将最理想的合作对象定为迅腾公司,虽然在一定意义上来说,微书信中的用户语音信息应该也是受到法律保护,哪怕是迅腾公司自己也不能轻易查看。

    但是冯子默相信,办法总比困难多,只要付出足够的利益,肯定会有办法的。

    其实在冯子默看来,哪怕近乎可以听懂所有语音的进阶版语音输入法也就勉强达到行业领先标准,仍谈不上智能,更不能说完美。

    所谓智能,在冯子默的构想中,至少要善解人意,并且可以在复杂的环境中准确无误的听懂用户说的每一句话、每一个词、甚至每一个字。

    这就要求智能语音的识别不能局限于听到的这一截语音,如果仅是单截语音,尤其是同音词汇,甚至同音字,那完全没法分辨,智能语音必须要有联系上文和语境进行推理的能力。

    同时,智能程序还需要进行进一步的特异性深度学习,学习的对象不再是宽泛的语音标本,而是要具体到用户,在用户使用智能语音的过程中,智能语音就同步进行记忆和学习。

    随着用户语音使用时长的累计,智能语音的学习程度也随之逐渐深入,进而对用户的语言习惯和发音方式进行透彻的解析和模拟,最终达到和用户自身分辨能力相当的地步。

    也就是说,智能语音要做到用户一句话说出口,只要用户自己能听明白在说什么,智能语音都可以做出完全一致的识别。

    可以说,到了这种程度的语音输入法,虽然不能说比用户自己更懂用户,但绝对可以说是比用户以外的任何人都要懂用户说的话。

    也只有达到这种境界的软件,才被冯子默认为可以称得上智能。

    不过,哪怕到达这种境界,依然不是冯子默所想的那种完美状态。

    冯子默构想的完美状态智能语音输入法应该具有比用户更懂用户的能力。

    也就是用户一句话说出口,有时可能会出现口误或者其他表述不清或不当的情形,这个时候智能语音输入法可以在保留用户原意的基础上,根据用户的日常用语习惯进行自动纠错和调整。

    不过冯子默深知,哪怕他将智能语音输入法编写出来,想进化到完美形态也是需要一个漫长的过程,当然这些都是后话。

    却说冯子默在完成了对智能语音输入法的整体构思和预期设定后,就开始埋头编起了这款在未来具有统治地位的语音智能输入法,

第158章 长安门广场() 
话说冯子默这一忙乎起来就废寝忘食,一直到第二天凌晨,冯子默才从忘我的状态中清醒过来。

    倒不是智能语音输入法的编程工作终于大功告成,哪怕以冯子默如今的编程能力,十来个小时也就堪堪将框架搭出来,离雏形都还差得远,更不要说后期还要修饰各式各样的小设定。

    冯子默之所以回来神儿来,只是因为他饿了,饿的前胸贴后背。

    虽然前一天中午胡吃海喝饱餐了一顿,但是从昨天下午开始冯子默几乎就滴水未进,不仅脑中保持着高强度的运算,手也没有片刻得闲。

    十多个小时干下来,不说积蓄的能量消耗殆尽,就是手也受不了啊,毕竟冯子默敲击键盘的频率可比寻常程序员快的多。

    当然也不是说程序员就有着高手速,手残的程序员同样大有人在。

    冯子默只是思维敏捷,几乎不需要思考时间,或者说思考速度远快于输入速度,故而冯子默全程都处入被思维赶着的状态,抽筋似的疯狂敲击键盘,好在冯子默的手也是够快、够准、够稳,不然只怕是更加窘迫。

    正因如此,冯子默的手速可谓是高的令人发指,而且冯子默这还不是短时间内的爆发,而是长时间的高频输出,以至于冯子默停下来之后,手还在不由自主的抽风,跟鸡爪似的不停抽搐。

    不过这已经是冯子默特意用真气疏通经脉的结果,不然手早就罢工了。

    甩了甩酸软的双手,冯子默从行李箱中捞出一大包高热量值的巧克力以及一盒之前手头不甚宽裕时的最爱——压缩饼干。

    胡乱塞了好几块巧克力的冯子默发现房间里提供的茶叶包装很是高端的样子,于是就烧了一壶开水。

    最后,冯子默就着茶水将所带的储备干粮吃了个七七八八,之所以没有一扫而空,倒不是冯子默吃饱了,而且冯子默为了以防万一,从牙缝中留了一份以备不时之需。

    略感满足之后,冯子默看了下时间,已是差不多到了每日修行的时候,觉自是没得睡了,不过冯子默也不以为意,偶尔熬个夜也没什么大不了的。

    既然没有睡觉的打算,自然是要完成每日修行,不过冯子默却是没准备在烨郡王府外面的61000平米的广场上修行,而是准备将修行的地方换到一个面积更为广阔的广场——帝都地标之一——长安门广场。

    长安门广场南北长880米,东西宽500米,面积达44万平方米,可容纳100万人举行盛大集会,是世界上最大的城市广场。

    不过作为国内最富盛名的广场,长安门广场自然不仅仅是因为面积大,更是因为其特殊的历史地位及其深刻的纪念意义。

    此次前往长安门广场,冯子默其实是奔着看升国旗去的。

    冯子默虽然能肯定当年跟母亲一起来长安门广场看过升国旗,但对当时的景象其实已然没有多少印象。

    不过有一个画面,冯子默却是记忆犹新:当初因为年纪小,个子也矮,为了看升旗,是母亲将自己高高举过头顶。

    至于当时看到了什么,冯子默早已记不得,但是母亲略微摇晃的却又竭力保持稳定的双臂却是一直印在冯子默的脑海。

    可以说,冯子默此番前往,在很大原因上就是为了故地重游,去重温当年尚不能体会的母爱。

    至于另外一个原因,则是冯子默之前各种小说看的太多,想着长安门广场神圣的升旗仪式指不定会引动国家的气运,而长安门的升旗时间又是太阳的上部边缘与长安门广场所见地平线相平的时间而定,刚好与自己吸纳紫气时间完美重合。

    因此,冯子默就脑洞大开的想着在长安门广场上进行修炼,当太阳刚刚升起,万物复苏,紫气东来的时候,如果这缕缕紫气和大瑞的气运相结合形成一种更为神妙的真气,那要是吸纳进体内,岂不是会爽的不要不要的?

    冯子默看了下手机地图,发现帝都烨郡王府酒店离长安门广场直线距离不到10公里,步行距离也就11公里的样子,并不算远。

    想着此时时间还算充裕,冯子默干脆也不打车,准备直接跑步前往。

    虽然是跑步,但冯子默却是没打算慢悠悠的跑过去,而是准备全力以赴,测试一下自己的目前的体能。

    因为冯子默刚好看过一项国内10公里长跑类的运动员分类级别,从国际健将、运动健将、一级运动员、二级运动员、三级运动员都有着相应的时间规定。

    虽然冯子默一宿没睡,但他自认精神还算饱满,体力也恢复的差不多,不会有太大影响,唯一可能影响比较大的是,冯子默穿的只是双普通的运动鞋,不过冯子默觉得没必要尽善尽美,就顺便粗略的测验一下,算是舒活筋骨就好。

    于是冯子默换了一身轻便的衣物,拿着手机和房卡就出了门,其余所有零零碎碎的东西一概不带。

    在帝都烨郡王府前面的广场上简单的热了下身,冯子默摸出手机,调出跑步记录器,轻轻点了下手机屏幕,便大步流星的飞奔了出去。

    此时天空虽然还是被黑暗所笼罩,但是帝都的明亮路灯却是将低空的黑暗驱逐殆尽。

    冯子默就在路灯的照耀下沿着马路飞奔,至于具体的前进路线,虽然冯子默没有实地考察过,但是从帝都烨郡王府酒店到长安门广场本就都是直路,全程只用拐两个弯儿,有着超级大脑的冯子默自是对路线了然于胸。

    虽然是清晨,帝都的空气依然

返回目录 上一页 下一页 回到顶部 3 1

你可能喜欢的