输入文本,选择系统音色或自己的音色,生成适合播客、课程、短视频旁白的中文语音。
预计点数:每 100 字约 5 点,最低 5 点;生成前请确认钱包余额充足。
选择平台或自定义音色时会校验音色的 targetModel。