小米自研MiMo-V2-TTS语言合成大模型发布:能说会唱 河南话、粤语等样样精通 今日,小米发布Xiaomi MiMo-V2-TTS,这是小米自研语音合成大模型,不仅能说、能演,还会唱。其基于自研Audio Tokenizer和多码本语音-文本联合建模架构,经过上亿小时语音数 语音合成 2026年03月28日 4 点赞 0 评论 6 浏览