1969年,Unix 源代码在 Unix 社区自由共享,人类历史上首次发起开源动作;
1991年,开源系统Linux内核问世;
1998年,网景通讯将源代码开放,“开源”一词首次出现;
2005年, 一个叫Git 的SCM工具出现,托管式的Git 代码仓库诞生;
……
开源,已经扎根在互联网基因深处,深刻改变互联网发展模式。
开源的历史,俨然是一部波澜壮阔的互联网发展史。
自达特茅斯会议人工智能概念提出以来,人工智能发展多次起落,随着技术的变革,互联网、大数据、云计算、5G的发展,人工智能在人类舞台正式大展拳脚。
人工智能开启了人类下一个纪元,开源继续扮演着重要角色,用于机器学习和AI训练的数据开源平台先后涌现,开发者们继续贡献着人类的智慧,开源、开放、自由和协作的精神推动人工智能不断发展。
政府、公益机构和个人将数据分享出来,为全球人工智能输送“燃料”,越来越多公司、大学、团体和个人也加入开源队伍,Kaggle、UCI、OpenML、ImageNet、OpenSLR等平台开源了大量图像、文本和语音数据。数据成为人工智能领域开源精神的核心载体。
图:MagicHub数据开源社区正式发布
在此背景下,MagicHub.io数据开源社区(https://magichub.io)应运而生,并于4月15日正式发布。爱数智慧目前拥有全球领先的对话式AI语音数据集,并在业界首次通过自主开发的开源平台与第三方的各产业伙伴进行共享,这可能会颠覆目前的产能瓶颈以及用户的数据使用习惯。
语音识别开源工具Kaldi之父Daniel Povey等数十位国内外开发者、人工智能领域大咖为MagicHub.io数据开源社区疯狂打CALL。
大量结构化、多领域和多场景数据集上传到MagicHub.io社区,社区对数据集多维度细分,帮助AI开发者快速找到适合自己模型的数据集,从而节省开发者大量精力,将时间专注在模型开发和优化上。
MagicHub.io数据开源社区秉持“共享共建、奉献创新,共同发展”精神,部分数据由爱数智慧上传,同时鼓励其他个人和团体在开源社区上传高质量、可靠的数据集,有开源数据需求可联系我们,让我们一起连接数据生产者与AI开发者,互相护持,构建创新。
图:MagicHub开源社区首页页面
目前,MagicHub.io数据开源社区首次开源30种用于人工智能训练/测试的数据集,包括中文对话数据集、中文客服数据集、英语对话数据集、上海方言对话数据集等。开源的数据集涵盖NLP、ASR、TTS数据集和LEX发音词典等,这些数据集按照语言、场景、应用领域等不同维度进行分类。
接下来,我们将在MagicHub.io社区持续开源高质量的数据集,并且增加更多板块,让MagicHub.io社区持续贡献,让创新和分享组成一股力量,共同打造一个高质量的人工智能数据开源社区。
开源是推动科技创新的一大源头,开源社区的打造已上升到国家层面,鼓励开源社区发展,健全知识产权体系。《“十四五”规划和2035年远景目标纲要》提到,要“支持数字技术开源社区等创新联合体发展,完善开源知识产权和法律体系,鼓励企业开放软件源代码、硬件设计和应用服务。”
人工智能开启开源的下一个纪元,你我一起参与!
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
虽然我国汽车芯片行业还处在发展初期,但已经迸发出无限潜力。一方面,智能汽车的发展不断带动需求增长;另一方面,政策引导下,汽车芯片企业持续抢占高地。对此,在7月5日-7日举办的2023年中国汽车论坛上,中国汽车工业协会副秘书长李邵华就做出表示,“中国将成为未来汽车芯片发展的集聚地”。车规芯片行业近日的
2023世界人工智能大会将于7月6日至8日在上海举办。云天励飞将在大会上展示自主设计开发的新一代边缘计算芯片DeepEdge10系列SoC芯片,并公布“天书”大模型的最新动态。欢迎莅临上海世博展览馆H1-C801展台参观交流!同时,云天励飞也将与中国电子、中国信通院、华为等合作伙伴,在WAIC的舞台
近日,酷学院智能产品发布会在深圳闪亮登场。近200位现场观众和近万人次在线观看,共同见证了这一激动人心的时刻。发布会上,酷学院引领大家探索企业培训学习和人才发展领域的新高度,并揭幕其全新的产品智能升级和突破。酷学院产品负责人徐晨通过形象生动、逻辑严谨的讲述,揭晓了全新的智能企业培训和人才发展平台,以
随着人工智能技术的快速发展,各行各业都受到了深刻影响,特别是中小学人工智能教育的普及,已经成为当今不可忽视的重要课程。ChatGPT等人工智能技术的出现,让我们看到了人工智能将成为未来推动科技跨越发展、生产力整体跃升的重要驱动力量之一。在这个背景下,中小学教育已经将人工智能作为重要学习内容,并将科技
四个月前邀请码炒至10万元,如今官网变灰、社交账号清空,这家AI新贵的闪电迁移折射中国科技企业出海潮涌。7月11日,打开Manus官网的用户发现一则突兀提示:“Manus在你所在的地区不可用”。而就在不久前,这个位置还显示着“Manus中文版本正在开发中”的乐观声明。同时,Manus官方微博和小红书
文/十界来源/节点财经一场围绕算力自主的竞赛,正在科创板上演。近日,国产全功能GPU厂商摩尔线程递交科创板招股书,拟募资约80亿人民币,成为今年上半年科创板拟募资规模最大的冲刺者,也打响了“国产英伟达”上市的第一枪。据招股书显示,摩尔线程自2020年成立以来,主营全功能GPU芯片的研发与销售,以自主
“AI大模型六小虎”百川智能危机重重。这是前搜狗CEO王小川创办的AI公司。昨天就爆出新闻,百川智能的联合创始人离职,这是王小川入局AI的第一道大坎。接下的成败非常关键:(1)拿下河北(2)学习科大讯飞百川智能离职高端概览:(1)2025年7月10日,百川智能技术联合创始人谢剑将离职。他是百川只能的
百度AI团队今日正式推出PaddleOCR3.1版本,以突破性的多语言组合识别(MultilingualCompositionPerception,MCP)技术为核心,彻底重构复杂文档处理边界。此次升级标志着OCR领域首次实现对同一文档内任意混合语言文本的精准识别,为全球化企业、跨境业务及多元文化场
“宇树已形成硬件、算法、场景联动的业务飞轮,自研率超95%的技术壁垒让其成为全球机器人赛道不可忽视的中国力量。”首程资本管理合伙人朱方文在追加投资时如是评价。7月7日,据每日经济新闻从宇树科技投资方处获悉,国内人形机器人领军企业宇树科技(UnitreeRobotics)已明确计划于科创板IPO,预计
推理与多模态的终极融合,将彻底终结用户在不同模型间切换的烦恼。7月7日,OpenAI正式确认将在今年夏季推出新一代人工智能模型GPT-5。这一突破性产品将整合现有的多个强大模型,特别是融合专注推理能力的“O系列”与具备多模态功能的“GPT系列”,为用户提供前所未有的统一体验。OpenAI开发者体验负
高考一结束,忙坏了海内外一众大模型。豆包、DeepSeek、ChatGPT、元宝、文心一言、通义千问……掀起了一波“AI赶考”大战。据悉,去年高考期间,大模型的成绩才勉强过一本线,今年集体晋升985。据悉,豆包甚至过了清北的录取线。头部大模型在高考“考场”上玩得不亦乐乎,中小AI创企的处境却日益尴尬
文/二风来源/节点财经每年高考成绩放榜后,数千万考生和家长将迎来另一场硬仗——填报志愿。今年,这一领域迎来了AI的全面介入,多家互联网大厂和教育公司纷纷推出智能志愿填报产品,为考生提供院校和专业选择建议。据艾媒咨询数据,2023年中国高考志愿填报市场付费规模约9.5亿元,近九成考生愿意借助志愿填报服
苹果还没从WWDC25的“群嘲”中走出,又迎来了一次新的痛击。据路透社报道,21日,苹果公司遭到股东集体起诉,被指在信息披露中低估了将先进生成式AI整合进语音助手Siri所需的时间,导致iPhone销量受影响、股价下滑,构成证券欺诈。在这份诉讼中,库克、首席财务官凯文·帕雷克及前首席财务官卢卡·马埃