Что думаешь? Оцени!
FunASR_spk_server(已开源):能区分说话人,适合访谈、对话类内容。不开 GPU 加速很慢,RTF(转录时长/原始音频时长)大概 1/3,看 CPU 主频;开 MPS(Mac 的优势)加速,RTF 约 1/10。
。heLLoword翻译官方下载对此有专业解读
从四足机器狗到人形机器人,从三登央视春晚,亮相北京冬奥会开幕式,再到在美国超级碗赛前表演。
unverified copy-paste outputs strictly designed to farm green squares on
00 01 02 03 04 05 06 07 08 09 0a 0b 0c 0d 0e 0f