AI超拟真有声书还原度有多高(人工智能技术持续在音频领域发力)


AI超拟真有声书还原度有多高(人工智能技术持续在音频领域发力)

文章插图
人工智能技术持续在音频领域发力 。喜马拉雅陆续出现了由AI写作、AI演播的有声小说 。面对科技在人类社会的狂飙突进,你能想象后几十年的生活会是什么样吗?
近日,AI续写应用彩云小梦以喜马拉雅旗下网文创作平台——奇迹文学的写手身份,入驻喜马拉雅 。其创作的作品由AI主播“喜小道”有声化后,发布在喜马拉雅平台 。从推出的几部成品来看,“AI写手”仍需不断成长,但随着技术的发展和进步,一个艺术化的音频作品从文本到有声化的创作,或许在不久的将来,均可以由AI实现 。
在音频领域,将文本转换为语音的技术统称为TTS技术(Text-to-speech,语音合成),除AI主播“喜小道”,利用这项技术,喜马拉雅在相声评书、电子书、新闻等领域实现了突破,去年九月甚至让已故评书大家单田芳先生“声音重现” 。单田芳先生之子单瑞林评价,“听到TTS声音,心魂间猛然一阵,仿佛父亲又回到这个世界 。”
AI超拟真有声书还原度有多高(人工智能技术持续在音频领域发力)

文章插图
一代评书大师单田芳的书迷遍布大江南北,上至老人,下至孩童 。去年,在北京单田芳艺术传播有限责任公司授权下,喜马拉雅用TTS技术还原单田芳先生的声音,并首次将单田芳的AI合成音应用于六部风格各异的书籍,用单式评书腔调,全新演绎听众耳熟能详的经典之作 。
目前,“单田芳声音 AI 重现系列专辑”拥有14.2万粉丝,既有直击泪点、奇人异事道尽人生悲欢的武侠小说——赵晨光的《江湖消亡史:北平暗夜》;也有传达时代脉动的纪实文学——陈廷一的《毛氏三兄弟:三兄弟与共和国奠基》;还有时下流行、故事情节曲折奇特的推理小说——紫金陈的《无证之罪》;更有延续单老生前未完成的的评书经典——宫白羽的《十二金钱镖》……
AI超拟真有声书还原度有多高(人工智能技术持续在音频领域发力)

文章插图
为了重现单老的声音,向传统艺术致敬,喜马拉雅智能语音实验室不仅复现了单老苍劲、沙哑的“云遮月”式独特嗓音,同时保留了他那情感充沛、起伏跌宕的腔调 。
据悉,喜马拉雅音频算法团队自研的TTS框架目前已处于行业领先水平,其TTS前端文本处理分析模块已经能够高精度、全自动地对文本进行多音字识别、韵律预测和风格分类,并已开发出可以实现多情感、多风格、多语种声音的TTS技术模型,不仅可以演绎不同情绪的文字,还可以自动区分旁白、对白,并支持英文,极大地丰富了TTS能表达的情感和韵律 。喜马拉雅已申请了三项TTS语音合成相关专利,其中就包括可以使没有任何英语原始数据的TTS声音能够说英语的技术框架 。
作者:童薇菁
编辑:姜方

    推荐阅读