置顶公告:【置顶】关于临时开启评论区所有功能的公告(2022.10.22) | 【置顶】关于本站Widget恢复使用的公告
  • 你好~!欢迎来到萌娘百科镜像站!如需查看或编辑,请联系本站管理员注册账号。
  • 本镜像站和其他萌娘百科的镜像站无关,请注意分别。

Synthesizer V

猛汉♂百科,万男皆可猛的百科全书!转载请标注来源页面的网页链接,并声明引自猛汉百科。内容不可商用。
Lih讨论 | 贡献2022年9月23日 (五) 08:58的版本 (搬运自萌娘百科的同名条目)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳到导航 跳到搜索
爱莲娜芙缇info.jpeg
萌娘百科欢迎您参与完善本条目☆Kira~
欢迎正在阅读这个条目的您协助编辑本条目。编辑前请阅读Wiki入门条目编辑规范,并查找相关资料。萌娘百科祝您在本站度过愉快的时光。
Synthesizer V R2 logo.png
基本资料
软件名 Synthesizer V
操作系统 Windows / Linux / macOS
语言 日文、英文、中文
软件类型 歌声合成
首次发布 技术预览版
(2018年8月19日)
别称 SynthV、SV
开发商 Dreamtonics Co,. Ltd.
最新版本 Synthesizer V Studio 1.7.0
(2022年7月21日)
代表色 SynthV绿(15E879

Synthesizer V(简称SynthV)是由以华侃如(Kanru Hua)为首的Dreamtonics Co,. Ltd.开发的歌声合成引擎及编辑器软件(V表示第5次架构迭代)。该引擎采用了自主研发的基于人工神经网络及拼接合成算法的LLSM(底层语音模型)技术,仅使用少量采样数据即能生成自然的声音。

Synthesizer V使用的歌声数据库具有Standard和AI两种不同版本,分别对应WaveNet vocoder强化的传统拼接歌声合成(Standard)和基于机器学习的歌声合成(AI)。[1]

发展历程

编辑器和引擎

第一代
  • 2017年12月1日,开发者华侃如在B站首次透露,Synthesizer V是一个长达7年的研发成果[2]。Kanru Hua在2018年5月7日投稿后续视频[3]
  • 2018年6月9日,海仔儿_KyoB站投稿虽然歌声无形,6月16日Cillia在B站投稿以ENG-F1歌声数据库翻唱的《silence》[4]。因其歌声数据库十分自然的声音及两位调校师的神调校受到广泛好评。
  • 2018年8月19日,Synthesizer V预览版发布,内置ENG-F1歌声数据库——Eleanor Forte(爱莲娜·芙缇)。
  • 2018年12月7日,海仔儿_KyoB站投稿Synthesizer V首款中文歌声数据库艾可翻唱的《好想你》[5];12月23日授权搬运日文歌声数据库玄武试听DEMO[6]
  • 2018年12月24日,开发者华侃如发布Synthesizer V首个正式版本[7],由Animen和平行四界代理销售。
第二代
  • 2019年12月31日,开发者华侃如公开基于Synthesizer V R2的预览版Web Synthesizer V[8],内置Web版本的日语歌声数据库masaki(Saki)。
  • 2020年4月11日,星尘Official投稿基于Synthesizer V R2赤羽"精二"歌声数据库重调的《404 Not Found》先行试听曲[9]
  • 2020年6月26日,Dreamtonics正式发布Synthesizer V Studio[10],带来全新设计的用户界面与Synthesizer V Engine 2.0,由AH-Software、平行四界和Animen代理销售。
  • 2020年10月30日,Dreamtonics投稿完全基于深度学习的Synthesizer V AI歌声合成测试曲[11]
  • 2020年12月25日,Synthesizer V AI正式发布,并入既有的Synthesizer V Studio,以免费升级的形式提供。
  • 2021年2月19日,Synthesizer V AI更新第二代稳定语音模型,提高渲染速度和声音音质,改善合成稳定性并减小AI歌声数据库的体积。
  • 2021年6月18日,Synthesizer V AI迎来第三代升级,带来明显的细节增强和更丰富的歌唱表现力[12]
  • 2021年10月14日,Dreamtonics投稿基于第四代Synthesizer V AI的中文AI女声测试曲,并开启征名活动,在11月5日被命名为青溯
  • 2021年11月18日,Synthesizer V AI正式带来第四代音高模型,增加可定制、独立于歌声数据库的自动音高调校功能[13]
  • 2021年12月23日,Synthesizer V AI推出第五代高速渲染与高频谱分辨率模型,音频保真度和速度得到了提高,编辑器还支持AI歌声数据库的跨语种歌声合成(需歌声数据库厂商提供歌声数据库升级,无需额外购买和下载,即可合成其他语言的歌声)[14]
  • 2022年7月21日,Synthesizer V AI推送高动态歌声模型,合成歌声将能够反映持续演唱过程中的音量连续变化,同时还能够在合成歌声中加入实际演唱中会出现的声音强弱变化与细微的音色变化。[15]

发布歌声数据库

Synthesizer V
  • 2018年8月19日,Synthesizer V英文歌声数据库爱莲娜·芙缇公开。
  • 2018年11月11日,Synthesizer V日文歌声数据库闇音レンリ开放下载。
  • 2018年12月24日,Synthesizer V日文歌声数据库玄武开放下载。
  • 2018年12月28日,Animen发售Synthesizer V中文歌声数据库艾可,在平行四界也有代理销售。
  • 2019年4月19日,平行四界发布Synthesizer V中文歌声数据库赤羽试听曲并开启预售。
  • 2019年5月31日,平行四界发布Synthesizer V中文歌声数据库诗岸试听曲并开启预售。
  • 2019年6月28日,平行四界发布Synthesizer V中文歌声数据库苍穹试听曲并开启预售。
  • 2019年8月22日,平行四界发布Synthesizer V中文歌声数据库海伊试听曲并开启预售。
Synthesizer V Studio
  • 2020年6月26日,平行四界开启Synthesizer V Studio中文歌声数据库赤羽诗岸苍穹海伊的预售;AH-Software发售日文歌声数据库Saki(代理销售)和琴葉 茜・葵
  • 2020年7月13日,Animen发售Synthesizer V Studio中文歌声数据库艾可、日文歌声数据库玄武Saki;7月29日代理销售中文歌声数据库赤羽诗岸苍穹海伊
  • 2020年8月7日,平行四界发布Synthesizer V Studio中文歌声数据库牧心试听曲并开启预售。
  • 2020年8月12日,平行四界发布Synthesizer V Studio中文歌声数据库Minus试听曲,并在8月28日开启预售。
  • 2020年12月25日,Dreamtonics发布Synthesizer V AI日文歌声数据库Saki AI,在AH-Software和Animen也有代理销售。
  • 2021年1月21日,AH-Software代理销售Synthesizer V Studio日文歌声数据库玄武
  • 2021年3月18日,AH-Software发售Synthesizer V Studio日文歌声数据库小春六花&小春六花 AI。
  • 2021年6月18日,AH-Software发售Synthesizer V Studio日文/英文歌声数据库弦巻マキ&弦巻マキ AI。
  • 2021年10月13日,Animen发布Synthesizer V Studio日文歌声数据库闇音レンリ,并开放免费注册通道。
  • 2021年11月26日,AH-Software发售Synthesizer V Studio日文歌声数据库ついなちゃん&ついなちゃん AI。
  • 2021年12月1日,Dreamtonics发售Synthesizer V AI中文歌声数据库青溯,并在淘宝开设店铺销售。
  • 2021年12月6日,Animen发售Synthesizer V AI英文歌声数据库爱莲娜·芙缇 AI。
  • 2021年12月11日,AUDIOLOGIE发售Synthesizer V AI英文歌声数据库铃爱莉,并在淘宝开设店铺销售。
  • 2022年1月19日,Eclipsed Sounds发售Synthesizer V AI英文歌声数据库SOLARIA
  • 2022年1月25日,平行四界发布Synthesizer V AI中文歌声数据库Infinity试听曲,并在1月27日开启预售,在2月20日正式发布。
  • 2022年1月27日,AH-Software发售Synthesizer V Studio日文歌声数据库京町精华&京町精华 AI。
  • 2022年2月4日,Dreamtonics发售Synthesizer V AI英文歌声数据库Kevin和日文歌声数据库Ryo,在AH-Software也有代理销售。
  • 2022年4月9日,Dreamtonics发售Synthesizer V AI中文歌声数据库默辰
  • 2022年4月13日,AH-Software发售Synthesizer V AI日文歌声数据库夏色花梨 AI。
  • 2022年5月4日,Dreamtonics发售Synthesizer V AI中文歌声数据库岸晓
  • 2022年5月27日,Dreamtonics发售Synthesizer V AI中文歌声数据库沨漪
  • 2022年7月21日,Dreamtonics发售Synthesizer V AI Gold系列双语(中文/英文)歌声数据库Weina,并在微信小程序开设网店销售。

技术

Synthesizer V AI

Synthesizer V AI 是搭载了 Dreamtonics 研发训练的 DNN (深度神经网络)的歌声合成技术。通过 Synthesizer V AI 生成的歌声,有如人类歌手般自然流畅,细节饱满,无论何种音乐风格都能应对自如。同时,经过优化的神经网络无需复杂昂贵的硬件即可在大多数设备上流畅运行。

根据不同的使用需要,Synthesizer V AI 提供了两种渲染模式可供选择:偏好品质模式使用完整大小的神经网络模型,将 Synthesizer V AI 技术的潜力完整发挥;偏好速度模式则使用较小的神经网络模型,可加快渲染速度。

Synthesizer V Standard(标准 Std)

Synthesizer V Standard 将 AI 技术融入传统基于样本的歌声合成技术,创造出驱动全新歌声合成引擎的歌声数据库,通过自然歌声扩展(Natural Singing Extension)的机器学习技术,实现了更加真实的合成音色。

官方介绍

为艺术而生的科学

我们的目标是创造一个能够使合成歌声在艺术上最终达到完美境界的工具。这份热情被倾注于一个长达7年的项目 - 为了以最高的科学精准对歌声建模。在这个科研项目的第五次迭代中,Synthesizer V走出了实验室。[16]

Synthesizer V 引擎

基于人工神经网络和拼接合成的混合算法,Synthesizer V仅使用少量采样数据即能生成自然的声音。我们研发的LLSM (底层语音模型) 技术分离处理声带和声道特征,从而实现对歌声音色的高保真、灵活修改。[17]

功能特性

现代的操作界面

Dreamtonics 与总部位于柏林的设计团队 Resonant Design 合作,致力于为您打造舒适的音乐创作体验。 新一代软件将 Synthesizer V 标志性的钢琴卷帘工作区域,与音轨编排功能和创新的侧边栏布局相结合。 通过精细地调整界面元素的信息量与最佳观感之间的平衡,为您带来使用体验的飞跃提升。 除了精致的布局之外,广泛使用矢量图形的界面还能够适配高 DPI 显示器和各种显示设备。 采用深色配色方案和温和的对比度,减轻用户疲劳。

实时渲染

即时呈现您对歌声的所有调整! 多功能钢琴卷帘中内置强大的可视化选项,无需按下播放按钮即可提供近乎实时的反馈。 精巧的多线程程序设计,使编辑器智能地识别要播放的部分, 因此您可以在任何时间点收听您的创作,无需等待。

歌声合成引擎

Synthesizer V 是首个在架构上将人工智能与样本融合的歌声合成引擎。 这种融合弥补了传统样本引擎中所欠缺的自然感,同时也保持针对细节操作的能力,这与限制用户处理能力的大多数 AI 合成器不同。 经过完全重写的第二代引擎将融合技术更近一步,提高质量的人工神经网络能让呼吸声和耳语声更加清晰。 全新引擎使用了多线程渲染机制,与先前版本相比,内存消耗减少了几个数量级,运行更加丝滑流畅。

细致入微的参数调整

Synthesizer V Studio 新的参数面板可以使用控制点进行更平滑的参数曲线调整。 这种新设计可以让您在参数曲线上,像处理音符一样选择和拖动控制点。 同时保留了第一代编辑器的手绘和直线绘制工具。 音符属性面板也进行了许多改进,包括调整音素时长的能力。 在 Pro 版本中可以切换每个音素的多个替代发音,这是一个重大改进。

脚本编程能力

通过易于学习的 Lua 和 Javascript 语言,您可以制作自己的编辑工具。 藉由这项功能,可以大幅提高熟练用户的工作效率。 脚本引擎与功能高度集成,可以实现包括项目、选择和导航等编程工具在内的完全控制。 使工作流程自动化,这样您就可以专注于更重要的工作。

八大参数

音高偏差

实时改变实际歌声音高与书写音符音高的距离。以音分为单位,100音分为一个半音,有±300音分,±600音分,±1200音分三种模式可供选择。因此,最多可以完成上下一个八度的音高调节。默认数值为0音分。

颤音包络

实时改变颤音的深度。数值范围为音符属性中颤音深度的0倍至2倍。默认数值为1倍。

响度

实时改变歌声音量的大小。以分贝为单位,数值范围为±12dB。默认数值为0dB。

张力

实时改变虚拟歌手声带的紧张程度。以抽象的紧张、放松作为数值的上下界。在数值偏向紧张时,歌手声音明亮,坚实,有力。在数值偏向放松时,歌手气声较大,温柔。默认数值为适中。

气声

实时改变歌声气声的大小。以抽象的气声、清晰作为上下界。默认数值为适中。

发声

实时改变真实歌声(相对气声)的响度,而不影响气声的大小。以抽象的有声、无声作为上下界。在数值偏向无声时,真实歌声的音量减小,声音以气声为主。默认数值为有声。

性别

实时改变虚拟歌手音色的性别因子。以抽象的男性、女性作为上下界。在数值偏向男性时,口型偏圆,发声位置靠后,声音浑厚。在数值偏向女性时,口型偏扁,发声位置靠前,声音尖细。默认数值为适中。

音区偏移

AI歌声数据库的参数,能够在固定音高的前提下改变音色,效果类似于Standard歌声数据库的“表现力分组”功能。以音分为单位,100音分为一个半音,可以完成上下400音分的音色调节。默认数值为0音分。

外部链接和注释

导航菜单


阅读更多:https://moegirl.uk/Synthesizer_V
本文引自萌娘百科(https://moegirl.uk ),文字内容默认使用《知识共享 署名-非商业性使用-相同方式共享 3.0》协议。
返回顶部
页面反馈
显示目录

目录