1. 创业头条
  2. 前沿领域
  3. AI智能
  4. 正文

捷通华声灵云语音识别重大突破 中文语音识别行业领先

 2018-09-07 14:42  来源:互联网  我来投稿 撤稿纠错

  一键部署OpenClaw

近期,捷通华声应用最新算法,推出全新一代灵云语音识别核心引擎,识别率实现跨越式提升。目前,新一代语音识别技术已上线灵云平台(AIcloud.com),供开发者调用,并面向政企客户推出包含8k、16k版本的全新灵云语音识别能力平台。

视频地址:https://v.qq.com/iframe/preview.html?vid=b0776m4ni8j

新一代灵云语音识别演示(建议全屏观看)

此次灵云语音识别技术的升级,是捷通华声在CTC算法的基础上,对建模单元粗粒度、模型训练方法、解码帧率进行创新优化。有效提升了语音识别引擎的执行效率、鲁棒性,增强了口音、语速适配能力,大幅提升了多人对讲、远场讲话等场景中的语音识别率。

调用云端语音识别服务 就上灵云平台

新一代灵云语音识别技术已上线灵云平台,开发者可以去灵云开发者社区(aicloud.com/dev/)申请调用。

开发者将灵云语音识别SDK集成到ISO、JAVA、安卓、Windows等软件应用中后,填写申请到的灵云平台语音识别服务地址、授权信息,便可免费调用灵云平台的语音识别服务。

目前,灵云平台上的语音识别技术已服务包括打车软件、输入法、翻译APP、手机银行客户端等各类数十万应用,覆盖数亿终端用户。

灵云ASR能力平台 为政企单位提供私有、专业的语音识别能力

在提供公有云ASR能力的同时,捷通华声一直在为Callcenter、会议、公安等场景提供私有化的语音识别能力。

其中,在Callcenter 电话信道8K语音识别场景,捷通华声已服务众多大型银行客服中心、客服BPO中心,将海量语音实时转写为文字,为智能质检、智能客服、智能外呼、数据分析等提供私有云的语音识别能力。

在会议、司法、医疗等16k语音识别场景,捷通华声积累了大量声学、语言数据,分别推出了会议、审讯、医疗各科室等行业版的语音识别能力平台,为政企客户提供专业、私有、更安全的语音识别能力。

十多年来,捷通华声始终坚持核心技术自主研发。随着此次灵云语音识别技术的跨越式提升,捷通华声将为公有云开发者、政企客户提供识别率更高、更优质的语音识别能力与服务。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关文章

  • 人工智能时代下阅北科技的创新与变革

    在信息技术持续革新与市场竞争日趋激烈的行业环境下,本地生活服务领域正经历着深刻的智能化转型。这一转型过程不仅涉及技术层面的升级迭代,更关乎服务模式与行业生态的系统性重构。阅北科技通过持续推进算法技术的优化与应用,在提升服务精准度和用户满意度方面进行了积极探索。阅北的算法系统建立在持续优化的技术架构之

    标签:
    人工智能
  • 瓯江论道:AI赋能绿色发展

    2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,

    标签:
    ai技术
  • 漕河泾天罡人工智能研究院正式揭牌 开启中国人工智能产业高质量发展新篇章

    2025年10月17日,上海在人工智能技术加速演进、产业生态持续升级的关键时期,由上海市漕河泾新兴技术开发区发展总公司联合天罡智算交易平台共同发起成立的“漕河泾天罡人工智能研究院”(以下简称“研究院”)正式揭牌。研究院将依托漕河泾的产业资源与平台优势,联合上海交通大学、上海社会科学院等权威机构,聚焦

    标签:
    人工智能
  • 王通:未来个人创业的十个机会

    个人创业需要启动成本低、无需庞大团队、可快速验证、能利用个人技能或资源。这里分享适合个人创业的十个机会一.AI内容优化与本地化服务·做什么:帮助企业或个人利用AI工具(如GPT-4,Midjourney)优化内容生产流程。例如,为跨境电商撰写多语言产品描述,为小红书博主生成爆款文案,为小公司制作营销

  • 世界人工智能大会在沪召开,上海人工智能研究院多项成果精彩亮相

    以“智能时代同球共济”为主题的2025世界人工智能大会在上海正式开幕。

    标签:
    人工智能
  • 20%员工或被裁、1.6万人离开:Meta酝酿史上最大规模裁员

    文/杨雪健来源/节点财经Meta或迎来史上最大规模裁员潮。2026年3月14日,路透社曝出Meta正计划启动新一轮大规模裁员,此次裁员比例或达公司总员工数的20%,按其近7.9万的员工规模计算,约1.58万名员工或将被裁。若该计划执行,将成为Meta自2022年底实行“效率之年”重组后规模最大的一次

  • 阿里发布全球首个企业级Agent平台“悟空”

    3月17日,阿里发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的”龙虾军团”。悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。拥有8亿用户的钉钉重写底层代码,进行全面CLI(命令行界面)化改造,让悟空Agent能够原生操

  • 90%的AI中间商会消失:Google封号只是第一枪

    AI的“免费红利期”结束了,未来18个月,靠“API倒卖”的公司,会成片消失。这个导火索就是最近Google的一轮封号导致的,随着封号风波的结束,这也标志着AI行业【收租时代】来了。2月封号潮:高付费用户被一锅端一周前,Google开始大规模封号,付着250美金月费的人,账号说没就没,Gmail、Y

  • DeepSeek V4意外泄露,原生多模态

    来自路透社等媒体报道的最新消息:DeepSeek未发布的V4Lite模型遭泄露上网,华为获得早期访问权限,英伟达被排除在外。近期,谷歌发表了2篇Multi-Agent协作学习新论文有网友提供了更加详细的信息,DeepSeekV4Lite:100万token上下文窗口(V3为128K)内置原生多模态推

  • 中国开启AI全民化元年,BAT同入“亿级俱乐部”

    春节红包会结束,但AI已融入数亿人生活里

  • 开源模型再突破,全球AI行业的拐点要来了?

    性能、商业、生态诠释开源模型的最佳姿态

  • 看懂黄仁勋CES演讲,就看懂 AI 接下来十年的走向

    2026年刚开年,全世界最狂的那个男人,穿着他的经典黑皮衣,在CES舞台上发出了未来十年的信号。他搞了个“能吃饱套餐”:6个包子+一碟小菜+一碗粥=肉包子套餐,这样以后你只要买一个套餐就能吃饱了。(Rubin平台)同时他们店里还免费提供的筷子、勺子、蘸料、酱油、醋、水果、零食等等。(开放10万亿语言

  • GDPS2025赛场直击!开普勒大黄蜂助力华理斩获搬运赛项桂冠

    12月12日-14日,2025全球开发者先锋大会暨国际具身智能技能大赛(GDPS2025)于上海张江科学会堂举行,大会以具身智能竞技为核心,融合了技术比拼、产业展示与科普体验,为全球观众呈现出具身智能的现在与未来。上海开普勒机器人有限公司(以下简称"开普勒机器人")携明星产品K2"大黄蜂"亮相,并参

    标签:
    GDPS
    2025
  • 弈动 Dynamic·数智跃迁 博弈无界|2025TechWorld智慧安全大会在京召开

    在数字化与智能化深度交织的时代浪潮中,安全的边界不断延展,技术的演进正引领产业迈向新一轮变革。10月24日,以“弈动Dynamic·数智跃迁博弈无界”为主题的2025TechWorld智慧安全大会在北京盛大召开。来自国家部委、院士学者、高校科研机构和企业的权威专家与业界精英齐聚北京,共议AI安全、数

    标签:
    弈动
  • 瓯江论道:AI赋能绿色发展

    2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,

    标签:
    ai技术