近期,捷通华声应用最新算法,推出全新一代灵云语音识别核心引擎,识别率实现跨越式提升。目前,新一代语音识别技术已上线灵云平台(AIcloud.com),供开发者调用,并面向政企客户推出包含8k、16k版本的全新灵云语音识别能力平台。
视频地址:https://v.qq.com/iframe/preview.html?vid=b0776m4ni8j
新一代灵云语音识别演示(建议全屏观看)
此次灵云语音识别技术的升级,是捷通华声在CTC算法的基础上,对建模单元粗粒度、模型训练方法、解码帧率进行创新优化。有效提升了语音识别引擎的执行效率、鲁棒性,增强了口音、语速适配能力,大幅提升了多人对讲、远场讲话等场景中的语音识别率。
调用云端语音识别服务 就上灵云平台
新一代灵云语音识别技术已上线灵云平台,开发者可以去灵云开发者社区(aicloud.com/dev/)申请调用。
开发者将灵云语音识别SDK集成到ISO、JAVA、安卓、Windows等软件应用中后,填写申请到的灵云平台语音识别服务地址、授权信息,便可免费调用灵云平台的语音识别服务。
目前,灵云平台上的语音识别技术已服务包括打车软件、输入法、翻译APP、手机银行客户端等各类数十万应用,覆盖数亿终端用户。
灵云ASR能力平台 为政企单位提供私有、专业的语音识别能力
在提供公有云ASR能力的同时,捷通华声一直在为Callcenter、会议、公安等场景提供私有化的语音识别能力。
其中,在Callcenter 电话信道8K语音识别场景,捷通华声已服务众多大型银行客服中心、客服BPO中心,将海量语音实时转写为文字,为智能质检、智能客服、智能外呼、数据分析等提供私有云的语音识别能力。
在会议、司法、医疗等16k语音识别场景,捷通华声积累了大量声学、语言数据,分别推出了会议、审讯、医疗各科室等行业版的语音识别能力平台,为政企客户提供专业、私有、更安全的语音识别能力。
十多年来,捷通华声始终坚持核心技术自主研发。随着此次灵云语音识别技术的跨越式提升,捷通华声将为公有云开发者、政企客户提供识别率更高、更优质的语音识别能力与服务。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
瑞芯微电子股份有限公司(以下简称“瑞芯微”)正式发布新一代机器视觉方案RV1106及RV1103,两颗芯片在NPU、ISP、视频编码、音频处理等性能均有显著升级,具有高集成度、高性价比、低待机功耗的特点。RV1106及RV1103为普惠型方案,旨在助力更多行业伙伴高效实现机器视觉产品的研发及落地。
展望科大讯飞的2022,“讯飞超脑2030计划”发布,科大讯飞全面锚定虚拟人、虚拟宠物,在雄厚的技术能力和丰富的场景经验支持下,持续验证着其面向新场景、新领域的创新能力,也在加速转化成为其未来5到10年的业绩支撑点。
目前我国确实有了较强的产业基础,但产业尤其是高端装备制造业,在基础领域与国际先进水平相比还有巨大的差距。“我国目前做了很多应用创新,但同时也忽视基础领域的发展,在基础的材料、元器件、管理理念、人才培养上都存在痛点,这也包括传感器;接下来我国应该夯实实体产业、加快转型升级,政府应加强基础研究的扶持和引
1956年8月,以香农为代表的一群科学家在达特茅斯学院,围绕着“用机器来模仿人类学习以及其他方面的智能”这个主题,创造出人工智能(ArtificialIntelligence)这个影响深远的概念。
近日,人工智能学术与产业界的权威年度盛会“MEET2022智能未来大会”召开,会上公布年度人工智能领航企业、人工智能创业领袖等榜单。其中,影谱科技创始人姬晓晨女士入选2021年度人工智能创业领袖,成为唯一上榜的女性企业家,同时上榜的还有商汤、旷视、依图、第四范式、地平线等企业领袖。
我觉得我们AI的目标是:从芯片设计到软件生态,全链路自主开发,建立可控的世界级AI体系。所以这是俺对未来5年中国AI圈的展望和判断。(1)2026年,英伟达造车、国产开车26年国产芯片会在推理和垂直场景上发力。以DeepSeek为代表,大多数AI大模型会以软件弥补硬件不足,所以训练和推理分开,训练就
文/道哥在深陷“后门”风波、接受网信办问询之后,英伟达的“特供版”H20芯片,又有了新消息。近日,美国科技媒体《TheInformation》援引知情人士消息称,英伟达已悄然向其关键供应商——包括负责封装的安靠科技、供应高带宽内存的三星电子、以及承担后端处理的富士康发出指令,要求暂停所有与H20AI
文/二风来源/节点财经一场关于“中国芯”的IPO审议,正把投资者们的目光锁定在上交所。根据上交所发布的公告,上市审核委员会已定于9月26日审议摩尔线程的科创板首发申请。作为中国半导体自主化浪潮中最受瞩目的“考生”之一,包括其创始人显赫的英伟达背景、高达80亿元人民币的募资雄心,以及在国产GPU领域取
技术的进步永无止境,继创下TPC-C性能&性价比双冠之后,阿里云PolarDB云原生数据库再度实现关键突破。9月24日杭州云栖大会上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技术的PolarDB数据库专用服务器。在原有RDMA网络的基础上,Polar
2025年9月24日,在杭州举办的云栖大会上,阿里云正式发布全新一代服务器操作系统AlibabaCloudLinux4(简称Alinux4)。Alinux4基于Linux6.6内核打造,是首个全面遵循龙蜥社区“开源生态合作倡议”规范的商业发行版。它不仅兼容主流开源社区生态,更针对阿里云最新9代ECS
9月24日,杭州云栖大会技术主论坛上,阿里云重磅发布AI安全护栏,提供五项核心安全能力,护航AI安全。一方面为客户提供融入AIAgent开发全链路的原生安全防护,另一方面持续用AI赋能安全产品智能化升级,打造Agentic-SOC安全运营,提升安全威胁检测和响应效率。在过去的一年,AIAgent正在
9月24日,魔搭社区举办了“全球协作•科学突破•创意无限”的专题论坛,并发布魔搭社区国际版、科学智能专区与AIGC创作引擎FlowBench,旨在连接全球开发者、加速科研范式创新、赋能创意表达。自2022年11月初成立至今,魔搭社区已成长为中国最大AI开源社区,其模型数量已突破10万,服务了全球20
9月24日,2025云栖大会现场,阿里云CTO周靖人接连发布了七款大模型技术产品。七款技术产品覆盖语言、语音、视觉、多模态、代码等模型领域,在模型智能水平、Agent工具调用以及Coding能力、深度推理、多模态等方面均实现突破。在大语言模型中,阿里通义旗舰模型Qwen3-Max全新亮相,性能超过G
9月24日,阿里云在云栖大会上宣布新一轮全球基础设施扩建计划:将在巴西、法国和荷兰首次设立云计算地域节点(region),并将扩建墨西哥、日本、韩国、马来西亚和迪拜的数据中心,以便更好服务全球客户日益增长的AI和云计算需求。目前,阿里云在全球29个地区运营91个可用区,是中国最大、亚太第一的云服务商