近日,AI实力强劲的百度输入法又向业内投下一颗“重磅炸弹”——业界首发“离线中英自由说”功能。这项基于中英文SMLTA模型的创新功能,让用户在弱网甚至无网络环境中,依然可以顺畅地进行中英文语音混输,且识别准确率和有网络时一样优秀, 准确率超过98%。百度输入法在此前推出的“在线中英自由说”功能基础上,借助AI技术赋能对语音输入进行了又一次重大升级,大幅提升了用户交互效率,全感官输入2.0再迎重磅升级。

(百度输入法离线中英自由说功能)
据了解,百度输入法此次推出的“离线中英自由说”功能已经在V9.3.5版本中全新上线。除支持中英文夹杂的离线混合输入之外,还可精准识别离线状态下的英文整句、中文整句输入。例如用户不便打字正在用语音输入一段话,可一走进地铁,语音识别却跟不上。而百度输入法的离线中英自由说功能就能很好地解决这个问题,它支持用户在地铁、电梯、高铁或隧道这类弱网甚至断网的环境下,依然可以自如流畅地语音录入,且无需进行中英文手动切换。此外,“离线中英自由说”依旧支持流式识别,即语音输入可以跟随用户的话音逐字实时上屏,满足用户对语音识别实时性和流畅性的高需求,真正让用户实现了“随时随地随心说”。
一直以来,离线的语音输入就是行业一大难题,由于传统的离线中英文混合识别计算资源有限,需要限制模型的体积,因此极大限制了离线识别系统的性能。而百度输入法的离线中英文语音识别系统,针对性地采用中英文混合建模技术,提出基于低帧率、低比特的中英文SMLTA模型,其中采用神经网络语言模型替换传统的N元语言模型,大大减少了离线识别模型的体积。与此同时,基于SMLTA的离线中英文语音识别系统还是首个基于Attention的端到端离线语音识别模型的产品部署,大幅提升了离线中英文语音识别系统的性能。
在AI技术加持下,百度输入法的语音输入能力不断突破,在创新功能、用户使用频次、体验满意度等方面始终领跑行业。今年年初线上交流需求爆发,百度输入法便捷、高效、准确的语音输入功能便成为特殊时期人们的沟通首选,自1月25日春节假期以来,日均语音请求量破10亿次大关,并且“扛住”了高流量和用户高标准的双重“高压”,持续为用户提供不卡顿、不出错的语音输入服务。此后艾媒咨询发布的《2020中国第三方手机输入法市场疫期专题报告》也表明,百度输入法在行业内拿下用户日均语音输入次数、满意度等多个行业第一。百度输入法深谙用户对于多语种、多环境下语音输入的需求与痛点,不断降低着语音输入的使用门槛,自然也收获了用户和行业的广泛认可。
从“中文识别”到“中英自由说”,从“在线状态”到“离线环境”,百度输入法对AI技术的应用,不仅提升了手机输入法的智能化程度,也极大改善了人机交互效率。当语音输入日渐主流,用户习惯加速养成,对于手机输入法厂商而言既是机遇也是挑战,相信百度输入法还将加码AI技术的应用,驱动语音输入继续升级迭代,持续优化“全感官输入2.0时代”的AI输入体验。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,
个人创业需要启动成本低、无需庞大团队、可快速验证、能利用个人技能或资源。这里分享适合个人创业的十个机会一.AI内容优化与本地化服务·做什么:帮助企业或个人利用AI工具(如GPT-4,Midjourney)优化内容生产流程。例如,为跨境电商撰写多语言产品描述,为小红书博主生成爆款文案,为小公司制作营销
百度AI团队今日正式推出PaddleOCR3.1版本,以突破性的多语言组合识别(MultilingualCompositionPerception,MCP)技术为核心,彻底重构复杂文档处理边界。此次升级标志着OCR领域首次实现对同一文档内任意混合语言文本的精准识别,为全球化企业、跨境业务及多元文化场
导航网站的崛起:从信息过载到精准触达随着全球AI工具数量爆发式增长(2025年已超数万款),用户面临前所未有的选择困境。传统搜索引擎的“关键词-链接”模式难以应对工具筛选的场景需求,垂直化、场景化的AI导航网站应运而生。这类平台通过聚合、评测、分类与推荐四重机制,将分散的工具资源整合为结构化入口。例
当微信公众号文章中出现一个人的名字,它会自动变成蓝色链接,点击即可查看AI生成的“个人简历”——这一微信新功能让不少用户感到被“扒光”在互联网上。近日,微信新上线的“AI搜索”功能陷入隐私泄露争议漩涡。多位网友在社交平台反映,当微信公众号推文中出现本人姓名时,名字会自动变为蓝色超链接,点击即可浏览由
2025年,被业界公认为具身智能(EmbodiedAI)真正觉醒的元年。当人工智能跨越数字世界的边界,轰然撞开物理世界的大门,是谁在荒野中劈开荆棘?又是谁在定义行业的未来?由魔搭社区(ModelScope)、CCF智能机器人专委会、工信部装备数字孪生技术重点实验室、Lumina具身智能社区、开放原子
拒绝“智元”走私语义,七维拆解Token物理本质,定义AI时代唯一真名:「符元」。
3月22日,智汇金陵·AI开源人才峰会暨魔搭开发者大会在南京举办。从去年6月30日至今,魔搭社区用户数从1600万增长至2500万,9个月内用户增量近千万;魔搭社区上的开源模型数量从7万增长至17万,9个月内新增10万个开源模型,包括DeepSeek、智谱、MiniMax、阶跃星辰、Mistral等
文/杨雪健来源/节点财经Meta或迎来史上最大规模裁员潮。2026年3月14日,路透社曝出Meta正计划启动新一轮大规模裁员,此次裁员比例或达公司总员工数的20%,按其近7.9万的员工规模计算,约1.58万名员工或将被裁。若该计划执行,将成为Meta自2022年底实行“效率之年”重组后规模最大的一次
3月17日,阿里发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的”龙虾军团”。悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。拥有8亿用户的钉钉重写底层代码,进行全面CLI(命令行界面)化改造,让悟空Agent能够原生操
AI的“免费红利期”结束了,未来18个月,靠“API倒卖”的公司,会成片消失。这个导火索就是最近Google的一轮封号导致的,随着封号风波的结束,这也标志着AI行业【收租时代】来了。2月封号潮:高付费用户被一锅端一周前,Google开始大规模封号,付着250美金月费的人,账号说没就没,Gmail、Y
来自路透社等媒体报道的最新消息:DeepSeek未发布的V4Lite模型遭泄露上网,华为获得早期访问权限,英伟达被排除在外。近期,谷歌发表了2篇Multi-Agent协作学习新论文有网友提供了更加详细的信息,DeepSeekV4Lite:100万token上下文窗口(V3为128K)内置原生多模态推
春节红包会结束,但AI已融入数亿人生活里
性能、商业、生态诠释开源模型的最佳姿态
2026年刚开年,全世界最狂的那个男人,穿着他的经典黑皮衣,在CES舞台上发出了未来十年的信号。他搞了个“能吃饱套餐”:6个包子+一碟小菜+一碗粥=肉包子套餐,这样以后你只要买一个套餐就能吃饱了。(Rubin平台)同时他们店里还免费提供的筷子、勺子、蘸料、酱油、醋、水果、零食等等。(开放10万亿语言