武汉丝绸服装鉴定社区

让阅读变得“动听”,百度推出阅读类App语音解决方案

百度AI2019-09-10 16:22:53

为了解决当代人类生活第一大痛点:懒 :) ,许多阅读类App都希望可以解放用户的手和眼,让用户可以利用碎片化时间,像听音乐一样的去听书。但遭遇了各种各样的问题


状况一:“幽灵人声”,男默女泪


既然是“听书”,那“听得舒服”自然就成为最最首要的技术标准。如果不小心选择了不成熟的语音合成技术,死板合成的僵硬机器声简直堪称“幽灵人声”。想象一下,夜深人静的时候打开听书软件,书里传来这种声音,真的没办法不脑补各种恐怖电影情节啊!(还是国产的那种(保护视力这里就不给大家放图了。


打个比方的话,简直就是“学了三年动画的同学出了这个毕业作品”系列的既视感:



状况二:懒得打字,无法沉浸


“听得舒服”这个诉求解决之后,鉴于“懒无极限”这一社会学共识(强行共识),最好添加书评的时候也能动动嘴就完成。如果不能完美解决语音输入这一痛点,那么用户就无法彻底解放手和眼,无法沉浸在语音世界里。


状况三:功能鸡肋,进退两难


语音功能的接入,添加或减少都会直接影响用户体验。功能太少的话体验不畅,而功能太多又常常导致卡顿甚至闪退。许多阅读类App被鸡肋的语音功能挟持着进退两难。



 ◇


如果恰好你就是阅读类应用的开发者,如果你也正想摆脱阅读对于眼睛和手的束缚,那么百度大脑语音技术决定给你一套完整的解决方案!



| 百度语音——阅读类APP解决方案


功能


1、有感情地阅读小说:使用不同的语音库,实现不同情感地阅读体验。

 


以本书内容为例,普通的语音合成技术生成的朗读音与情感语音合成的朗读音对比如下,点击收听:


其中,前半段为传统语音合成,后半段为百度情感语音合成。


通过前后对比可以听出,较之于传统语音合成的机械、死板,情感语音合成的朗读音被赋予了更多的“情绪”,抑扬顿挫的情感让它听起来更接近于“人声”。


2、语音输入评论,改变书评的写作方式。

 

3、语音控制:用户只需要说出搜索小说《xxx》即可搜索出小说结果,“停止阅读”,即可停止阅读,“翻到上一页,翻到下一页”,即可实现对阅读的控制。 

 


| 技术特色

 

多语言多音色可选中文普通话、中英文混读、男声、女声任你选,更支持语速、音调、音量、音频码率设置,让你的应用拥有最甜美和最磁性的声音。与往常的从始至终一个音调的“机器音”不同,“情感语音合成”可以让机器的声音更贴近人类的说话习惯,更加自然。


官网体验:http://ai.baidu.com/tech/speech/tts


离线在线融合模式SDK可以根据当前网络状况,自动判断使用本地引擎还是云端引擎进行语音合成,断网情况下也可以使用。


流畅自然的合成效果语音合成技术业界领先,合成效果接近真人发声,流畅自然,且极具表现力,给你最舒适的听觉体验。

 

应用场景:小说、文章、资讯、报告等阅读类应用。语音输入评论。语音完成搜索、控制。百度语音技术目前被QQ阅读等许多千万量级App搭载使用,具体效果如何,接下来为大家举例展示。



| 应用案例


快听小说


快听小说的听书功能,区别于录音方式,是通过语音合成技术直接读出来的。这里不光需要语音技术能够对文字进行识别,还需要稳定地对断句、语调、语速根据情感的不同自动调节等。



iReader



掌阅iReader利用百度语音合成技术将小说等文学作品以语音朗读的方式传达给用户,随时随地在有声世界里感受适生活。



 ◇


重要的事情再说一遍:如果恰好你就是阅读类应用的开发者,如果你也正想摆脱阅读对于眼睛和手的束缚,那么点击“阅读原文”吧,百度大脑语音技术决定给你一套完整的解决方案!


 ◇

在「百度大脑」微信号,你将获得:

AI 头条

近七日最重要人工智能新闻

百度大脑洞

AI 领域那些不可思议的研究

AI 内参

长篇报道、白皮书和深度访谈的专业解读

关注我们,与百度大脑一同思考未来。

微信号:baidubrain

微博:@百度大脑

网站:ai.baidu.com

友情链接

Copyright © 武汉丝绸服装鉴定社区@2017