2025年6月17日,字节跳动旗下智能助手豆包正式在电脑版及网页端全量上线“AI播客”功能,用户只需上传PDF文档或网页链接,即可一键生成由两位AI主播演绎的对话式播客节目。这一创新功能凭借高度拟人化的语音效果和秒级转化效率,迅速引发内容创作者、学生群体及职场人士的关注。
技术突破:真人级语音交互,秒级生成播客
据豆包团队介绍,该功能基于其自主研发的语音播客模型,通过流式模型与端到端技术,将文本创作到音频生成的全流程压缩至数秒内完成。生成的播客不仅音色自然、停顿合理,还融入了日常对话中的语气词和附和习惯,例如“嗯”“对”“其实呢”等口语化表达,使对话更贴近真人交流场景。
内测用户反馈显示,该功能尤其适用于处理长篇学习资料或行业报告。例如,学生可将课堂PPT拍照上传,AI自动提取文字后生成深度讲解的播客;职场人则可将网页文章转化为通勤路上的“听书”内容。一位参与测试的用户表示:“以前看一篇万字报告要半小时,现在直接生成播客,边走边听效率翻倍。”
场景覆盖:学习、工作、娱乐全适配
目前,豆包AI播客支持多种输入方式:
文档转播客:上传PDF、Word等格式文件,AI自动解析内容并生成对话; 链接转播客:支持微信公众号、知乎、腾讯文档等公开链接,一键抓取文字生成音频; 拍照转播客:通过手机拍摄PPT、书籍等纸质资料,OCR识别后转化为播客。
此外,用户可自由选择主播音色(如“新闻主播风”“轻松对话风”)及对话模式(男女对谈、双男或双女组合),甚至自定义角色身份(如“专家访谈”“师生讨论”)。例如,将学术论文转化为“教授与学生探讨”的播客,或把产品说明书改写为“客服与用户问答”形式,极大提升了内容的趣味性和可听性。
行业对比:差异化优势凸显
与市场上同类产品相比,豆包AI播客的核心竞争力在于“低成本、高时效、强互动”。例如,有道文档FM虽支持多格式输入,但生成音频需手动调整角色分配;而谷歌NotebookLM的中文播客功能则存在语言适配性不足的问题。豆包团队表示,其模型通过海量中文对话数据训练,更符合国内用户的表达习惯。
目前,该功能已在豆包电脑版、网页端及扣子空间平台上线,手机端App也已开启小流量测试,预计近期全量开放。豆包产品负责人透露,未来将推出“多角色扮演”功能,允许用户上传剧本或故事大纲,由AI生成多人对话的广播剧,进一步拓展内容创作边界。
市场影响:重新定义“听书”体验
随着AI播客功能的普及,内容消费场景正从“阅读”向“聆听”迁移。艾瑞咨询数据显示,2025年中国有声内容市场规模预计突破800亿元,其中AI生成内容占比将达30%。豆包AI播客的推出,不仅降低了播客创作门槛,也为教育、出版、传媒等行业提供了新的内容分发渠道。
例如,出版社可将新书章节转化为播客试听片段,吸引读者购买;企业则可将产品白皮书转化为音频,通过播客平台触达更多用户。一位教育行业从业者评价:“AI播客让知识传播更碎片化、更沉浸,未来或成为在线教育的重要工具。”
结语:AI赋能内容创作的新里程碑
豆包AI播客功能的上线,标志着AI技术在内容生成领域的又一次突破。从文本到音频的“一键转化”,不仅解放了用户的双手,更让知识获取变得更加高效、便捷。随着技术的持续迭代,AI播客或将成为每个人口袋里的“私人电台”,重新定义信息传播与消费的方式。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
文/八真来源/节点财经具身智能赛道,谁最有可能拔得A股资本市场的头筹?答案大概率是诞生刚刚两年,由华为"天才少年"、B站百万粉丝科技UP主稚晖君(彭志辉)创立的智元机器人。近期,从事新材料研发与生产的上纬新材(688585.SH)丢出重磅炸弹,宣布智元机器人及相关主体将通过收购其至少63.62%的股
文/道哥大举裁员、清空账号、国内IP无法访问——曾被誉为“中国AIAgent希望之星”的Manus,在估值飙至5亿美元的高光时刻“闪离”中国市场。近日,Manus“裁员、出走”的消息在媒体端大量发酵。消息称,Manus公司总部将由中国迁至新加坡,其国内团队也将大幅裁撤——原有120人规模团队除40余
四个月前邀请码炒至10万元,如今官网变灰、社交账号清空,这家AI新贵的闪电迁移折射中国科技企业出海潮涌。7月11日,打开Manus官网的用户发现一则突兀提示:“Manus在你所在的地区不可用”。而就在不久前,这个位置还显示着“Manus中文版本正在开发中”的乐观声明。同时,Manus官方微博和小红书
文/十界来源/节点财经一场围绕算力自主的竞赛,正在科创板上演。近日,国产全功能GPU厂商摩尔线程递交科创板招股书,拟募资约80亿人民币,成为今年上半年科创板拟募资规模最大的冲刺者,也打响了“国产英伟达”上市的第一枪。据招股书显示,摩尔线程自2020年成立以来,主营全功能GPU芯片的研发与销售,以自主
“AI大模型六小虎”百川智能危机重重。这是前搜狗CEO王小川创办的AI公司。昨天就爆出新闻,百川智能的联合创始人离职,这是王小川入局AI的第一道大坎。接下的成败非常关键:(1)拿下河北(2)学习科大讯飞百川智能离职高端概览:(1)2025年7月10日,百川智能技术联合创始人谢剑将离职。他是百川只能的
百度AI团队今日正式推出PaddleOCR3.1版本,以突破性的多语言组合识别(MultilingualCompositionPerception,MCP)技术为核心,彻底重构复杂文档处理边界。此次升级标志着OCR领域首次实现对同一文档内任意混合语言文本的精准识别,为全球化企业、跨境业务及多元文化场
“宇树已形成硬件、算法、场景联动的业务飞轮,自研率超95%的技术壁垒让其成为全球机器人赛道不可忽视的中国力量。”首程资本管理合伙人朱方文在追加投资时如是评价。7月7日,据每日经济新闻从宇树科技投资方处获悉,国内人形机器人领军企业宇树科技(UnitreeRobotics)已明确计划于科创板IPO,预计
推理与多模态的终极融合,将彻底终结用户在不同模型间切换的烦恼。7月7日,OpenAI正式确认将在今年夏季推出新一代人工智能模型GPT-5。这一突破性产品将整合现有的多个强大模型,特别是融合专注推理能力的“O系列”与具备多模态功能的“GPT系列”,为用户提供前所未有的统一体验。OpenAI开发者体验负
高考一结束,忙坏了海内外一众大模型。豆包、DeepSeek、ChatGPT、元宝、文心一言、通义千问……掀起了一波“AI赶考”大战。据悉,去年高考期间,大模型的成绩才勉强过一本线,今年集体晋升985。据悉,豆包甚至过了清北的录取线。头部大模型在高考“考场”上玩得不亦乐乎,中小AI创企的处境却日益尴尬