1969年,Unix 源代码在 Unix 社区自由共享,人类历史上首次发起开源动作;
1991年,开源系统Linux内核问世;
1998年,网景通讯将源代码开放,“开源”一词首次出现;
2005年, 一个叫Git 的SCM工具出现,托管式的Git 代码仓库诞生;
……
开源,已经扎根在互联网基因深处,深刻改变互联网发展模式。
开源的历史,俨然是一部波澜壮阔的互联网发展史。
自达特茅斯会议人工智能概念提出以来,人工智能发展多次起落,随着技术的变革,互联网、大数据、云计算、5G的发展,人工智能在人类舞台正式大展拳脚。
人工智能开启了人类下一个纪元,开源继续扮演着重要角色,用于机器学习和AI训练的数据开源平台先后涌现,开发者们继续贡献着人类的智慧,开源、开放、自由和协作的精神推动人工智能不断发展。
政府、公益机构和个人将数据分享出来,为全球人工智能输送“燃料”,越来越多公司、大学、团体和个人也加入开源队伍,Kaggle、UCI、OpenML、ImageNet、OpenSLR等平台开源了大量图像、文本和语音数据。数据成为人工智能领域开源精神的核心载体。
图:MagicHub数据开源社区正式发布
在此背景下,MagicHub.io数据开源社区(https://magichub.io)应运而生,并于4月15日正式发布。爱数智慧目前拥有全球领先的对话式AI语音数据集,并在业界首次通过自主开发的开源平台与第三方的各产业伙伴进行共享,这可能会颠覆目前的产能瓶颈以及用户的数据使用习惯。
语音识别开源工具Kaldi之父Daniel Povey等数十位国内外开发者、人工智能领域大咖为MagicHub.io数据开源社区疯狂打CALL。
大量结构化、多领域和多场景数据集上传到MagicHub.io社区,社区对数据集多维度细分,帮助AI开发者快速找到适合自己模型的数据集,从而节省开发者大量精力,将时间专注在模型开发和优化上。
MagicHub.io数据开源社区秉持“共享共建、奉献创新,共同发展”精神,部分数据由爱数智慧上传,同时鼓励其他个人和团体在开源社区上传高质量、可靠的数据集,有开源数据需求可联系我们,让我们一起连接数据生产者与AI开发者,互相护持,构建创新。
图:MagicHub开源社区首页页面
目前,MagicHub.io数据开源社区首次开源30种用于人工智能训练/测试的数据集,包括中文对话数据集、中文客服数据集、英语对话数据集、上海方言对话数据集等。开源的数据集涵盖NLP、ASR、TTS数据集和LEX发音词典等,这些数据集按照语言、场景、应用领域等不同维度进行分类。
接下来,我们将在MagicHub.io社区持续开源高质量的数据集,并且增加更多板块,让MagicHub.io社区持续贡献,让创新和分享组成一股力量,共同打造一个高质量的人工智能数据开源社区。
开源是推动科技创新的一大源头,开源社区的打造已上升到国家层面,鼓励开源社区发展,健全知识产权体系。《“十四五”规划和2035年远景目标纲要》提到,要“支持数字技术开源社区等创新联合体发展,完善开源知识产权和法律体系,鼓励企业开放软件源代码、硬件设计和应用服务。”
人工智能开启开源的下一个纪元,你我一起参与!
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
虽然我国汽车芯片行业还处在发展初期,但已经迸发出无限潜力。一方面,智能汽车的发展不断带动需求增长;另一方面,政策引导下,汽车芯片企业持续抢占高地。对此,在7月5日-7日举办的2023年中国汽车论坛上,中国汽车工业协会副秘书长李邵华就做出表示,“中国将成为未来汽车芯片发展的集聚地”。车规芯片行业近日的
2023世界人工智能大会将于7月6日至8日在上海举办。云天励飞将在大会上展示自主设计开发的新一代边缘计算芯片DeepEdge10系列SoC芯片,并公布“天书”大模型的最新动态。欢迎莅临上海世博展览馆H1-C801展台参观交流!同时,云天励飞也将与中国电子、中国信通院、华为等合作伙伴,在WAIC的舞台
近日,酷学院智能产品发布会在深圳闪亮登场。近200位现场观众和近万人次在线观看,共同见证了这一激动人心的时刻。发布会上,酷学院引领大家探索企业培训学习和人才发展领域的新高度,并揭幕其全新的产品智能升级和突破。酷学院产品负责人徐晨通过形象生动、逻辑严谨的讲述,揭晓了全新的智能企业培训和人才发展平台,以
随着人工智能技术的快速发展,各行各业都受到了深刻影响,特别是中小学人工智能教育的普及,已经成为当今不可忽视的重要课程。ChatGPT等人工智能技术的出现,让我们看到了人工智能将成为未来推动科技跨越发展、生产力整体跃升的重要驱动力量之一。在这个背景下,中小学教育已经将人工智能作为重要学习内容,并将科技
我觉得我们AI的目标是:从芯片设计到软件生态,全链路自主开发,建立可控的世界级AI体系。所以这是俺对未来5年中国AI圈的展望和判断。(1)2026年,英伟达造车、国产开车26年国产芯片会在推理和垂直场景上发力。以DeepSeek为代表,大多数AI大模型会以软件弥补硬件不足,所以训练和推理分开,训练就
文/道哥在深陷“后门”风波、接受网信办问询之后,英伟达的“特供版”H20芯片,又有了新消息。近日,美国科技媒体《TheInformation》援引知情人士消息称,英伟达已悄然向其关键供应商——包括负责封装的安靠科技、供应高带宽内存的三星电子、以及承担后端处理的富士康发出指令,要求暂停所有与H20AI
文/二风来源/节点财经一场关于“中国芯”的IPO审议,正把投资者们的目光锁定在上交所。根据上交所发布的公告,上市审核委员会已定于9月26日审议摩尔线程的科创板首发申请。作为中国半导体自主化浪潮中最受瞩目的“考生”之一,包括其创始人显赫的英伟达背景、高达80亿元人民币的募资雄心,以及在国产GPU领域取
技术的进步永无止境,继创下TPC-C性能&性价比双冠之后,阿里云PolarDB云原生数据库再度实现关键突破。9月24日杭州云栖大会上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技术的PolarDB数据库专用服务器。在原有RDMA网络的基础上,Polar
2025年9月24日,在杭州举办的云栖大会上,阿里云正式发布全新一代服务器操作系统AlibabaCloudLinux4(简称Alinux4)。Alinux4基于Linux6.6内核打造,是首个全面遵循龙蜥社区“开源生态合作倡议”规范的商业发行版。它不仅兼容主流开源社区生态,更针对阿里云最新9代ECS
9月24日,杭州云栖大会技术主论坛上,阿里云重磅发布AI安全护栏,提供五项核心安全能力,护航AI安全。一方面为客户提供融入AIAgent开发全链路的原生安全防护,另一方面持续用AI赋能安全产品智能化升级,打造Agentic-SOC安全运营,提升安全威胁检测和响应效率。在过去的一年,AIAgent正在
9月24日,魔搭社区举办了“全球协作•科学突破•创意无限”的专题论坛,并发布魔搭社区国际版、科学智能专区与AIGC创作引擎FlowBench,旨在连接全球开发者、加速科研范式创新、赋能创意表达。自2022年11月初成立至今,魔搭社区已成长为中国最大AI开源社区,其模型数量已突破10万,服务了全球20
9月24日,2025云栖大会现场,阿里云CTO周靖人接连发布了七款大模型技术产品。七款技术产品覆盖语言、语音、视觉、多模态、代码等模型领域,在模型智能水平、Agent工具调用以及Coding能力、深度推理、多模态等方面均实现突破。在大语言模型中,阿里通义旗舰模型Qwen3-Max全新亮相,性能超过G
9月24日,阿里云在云栖大会上宣布新一轮全球基础设施扩建计划:将在巴西、法国和荷兰首次设立云计算地域节点(region),并将扩建墨西哥、日本、韩国、马来西亚和迪拜的数据中心,以便更好服务全球客户日益增长的AI和云计算需求。目前,阿里云在全球29个地区运营91个可用区,是中国最大、亚太第一的云服务商