Appearance
我用的是谁的声音?
默认使用 徐嘉铭 的音色。
如果定制语音能力,该能力属于可选配置项,并非默认强制开启。是否使用特定音色、使用哪一种音色,完全取决于具体的定制方案与授权边界。
语音流转架构说明
为了洗清“低端写死语音包”的嫌疑,本系统对外公开标准的数据流转逻辑。从打字文本到你的耳朵里,数据严格按照以下流式拓扑进行毫秒级热调优:
01
输入文本
大模型(LLM)实时生成的动态上下文
➔
02
TTS 语音引擎
火山引擎 / 腾讯云一句话声音克隆
➔
03
语音流输出
流式音频切片、50%概率随机换着发
音色说明
语音能力支持按定制方案进行配置,默认使用 徐嘉铭 音色。
如需特定风格音色,可根据具体项目需求单独确认与调整。
使用者该怎么理解
系统支持根据群聊生态和用户偏好,在以下两种模式之间进行动态切换:
- 文字模式:适合大多数常规高频互动场景,响应延迟极低且稳定直接。默认打字输出,辅以情绪驱动的表情包收集与动态丢图机制。
- 语音模式:适合追求特定角色氛围、需要更强黏性与高真实度陪伴的定制需求。文字与音频流按设定的概率随机混合发送,内置 SSML 脏话发音四声纠正技术。