1. 创业头条
  2. 前沿领域
  3. AI智能
  4. 正文

深度测评全新大模型「天工」,这些AI体验太香了

 2023-04-19 17:58  来源:A5专栏  我来投稿 撤稿纠错

  一键部署OpenClaw

ChatGPT火了后,很多人都在关注“国产ChatGPT”的名号究竟花落谁家。

事实上,名号不重要,体验才是王道。ChatGPT能够火成“史上增长最快的消费者应用”,关键在于把体验提升到了新层次。毕竟对于用户来说,并不清楚产品背后究竟投入了哪些技术,要的只是独特且出色的体验,尤其是针对中国市场的体验。

眼下,已经有一些国内企业入局ChatGPT所在的生成式AI赛道,其中相当一部分还在痴迷于参数的军备竞赛,忽略了体验。当然,也有一些企业在技术和体验上做到了兼顾。

4月17日,昆仑万维发布新⼀代千亿级⼤语⾔模型「天⼯」。它是由昆仑万维与国内领先的AI团队奇点智源联合开发的,即日起启动邀请测试。

相对来看,「天⼯」出现的速度在行业里并不是最快的,但在体验上是最为独特的产品之一。比如,它是国内⾸个对标ChatGPT的双千亿级⼤语⾔模型,在满足中国用户需求上的表现十分出色。

“国产ChatGPT”,已经有了清晰的模样。

更懂中文的“国产ChatGPT”

能不能满足中国用户需求,就看能不能回答带有“中国特色”的问题。

《一点财经》用三个“中国特色”问题进行评测,发现「天⼯」的回答都比较让人满意。

第一个问题是:“有一种饿,叫妈妈觉得你饿”是什么意思?,这是典型的“中国式”的梗,很多外国的大语言模型产品都回答得不够好,「天⼯」马上就给出了准确且生动的答案。

第二个问题是:“大过年的,就别计较了”是什么意思?,这个问题更考验产品是否理解中国人的思维逻辑,「天⼯」也解释地非常到位。

第三个问题是:“骑车滑了一下,我一把把把把住了”,这句话是什么意思?这个问题需要产品不仅会断句,而且还要对中文有深度了解,可以看到「天⼯」也解释地非常到位。

几番评测下来,相比许多同类型产品,「天⼯」更能理解中国用户的需求,对指令的理解能力也呈指数级上升,反馈速度同步升级,整体的用户体验不俗。

用户体验的提升,可以分“产品服务化”和“服务产品化”两部分进行。

前者指的是能够站在为用户服务的角度来设计产品,更能满足用户需求。后者指的是把服务变得像产品制造一样,能够可标准化、可复制化,可以让服务实现“规模+速度”上的提升。

面对当下一些生成式AI产品,许多中国用户诟病最多的其实“不懂中文”,这其实就是没有把握住产品服务化,而「天⼯」在这方面表现出色。

在产品服务化之外,「天⼯」的服务产品化体验也较为出色。

生成式AI的关键之处在于“生成”,也就是能生成各种内容,提供帮用户干活的服务才算是优秀产品。

具体而言,这些服务包括书籍翻译、文案创意、报告创作等等,能够通过标准化的指令应用到工作、学习、娱乐、创作等各种场景上,帮助用户解放双手和突破脑力极限。

比如,输入“做一份关于中秋节的品牌创意策划”,这需要生成式AI产品特别懂中国用户的需求。「天⼯」立马生成了一份创意品牌策划,甚至细化到了品牌视觉元素、宣传语、形象代言人,估计许多品牌策划的打工人要担心会失业了。

更为关键的是,「天⼯」具备超强记忆力,支持一万字以上的超长文本对话,支持20+轮次交互,而且拥有超强算力支撑(中国最大GPU集群),运算和响应速度更快。这意味着它能够批量、快速地生成大量作品。

从产品服务化和服务产品化两个层面上看,「天⼯」整体处于国内⼤语⾔模型产品的头部水平,文本写作在中文语境里有时甚至比ChatGPT表现更好,不过在逻辑推理上与ChatGPT有一定差距,当然后续快速迭代后相信差距会不断缩小。

就目前的评测体验而言,「天⼯」称得上是更懂中文的“国产ChatGPT”。

体验背后的“双重创新”

体验至上,并不意味着忽略技术。

技术是生成式AI产品的基础,没有它就如同在沙滩上建高楼,一推就倒。不过,技术并不是今天投入明天就能立竿见影的,而是一个长期积累和自我迭代的过程。ChatGPT的爆红就源自不断迭代,在用户体验上持续优化。如果没有前几代的技术积累,不会有这一次的爆发。

说白了,生成式AI产品比拼的不是现在做什么,而是过去做了什么,并且做出了哪些创新。这考验的是企业在“延续性创新”和“颠覆式创新”上的表现。

在企业的发展过程中,存在这样一条成长逻辑:机会牵引人才,人才牵引技术,技术牵引产品,产品牵引更多更大的机会。促进四种力量之间的良性循环,就会加快公司的成长。

昆仑万维旗下业务包括浏览器、社交娱乐、新闻、游戏等板块,和内容的关联性都非常强,所以对内容生成方面的技术进展一直非常敏感,早在2020年,昆仑万维就捕捉到了生成式AI带来的机会,开始在音乐AI领域投入。而奇点智源在GPT3诞生后,即开始在大模型研发上投入了大规模的算法和算力资源,并在2021年发布了百亿级大模型「瑶光」。

到了2022年,昆仑准备从音乐AI往多模态AI拓展,也明确了只有自研千亿级大模型,才能建立核心壁垒、掌握主动权。与此同时,奇点智源越发强烈地意识到千亿级大模型是AGI的一个突破口,于是双方一拍即合,自研「天工」成了个水到渠成的选择。

这一次「天⼯」的诞⽣,也是延续性创新到一定程度后厚积薄发的结果。

当然,「天⼯」的诞生也有它的颠覆式创新之处。

在市场上现有的许多产品中,一般采取基于Transformer架构的自然语言处理模型,其算法主要是基于深度学习中的神经网络算法。

在此基础上,「天⼯」首次将自然语言处理技术结合蒙特卡洛搜索树算法,这进一步提高了解码过程中的准确性和安全性,让「天⼯」在复杂任务和场景中能够快速且准确地响应指令,输出高质量回答,让模型“更懂人性更懂你”。

另外,「天⼯」采用的双千亿参数的超大规模结构,包括千亿基座模型和千亿排序模型,这让它具有了更高级的自主学习和智能涌现能力,从而能帮用户解答跨领域的问题和比较复杂的问题。

ChatGPT无疑在全球掀起了新一轮的科技热潮,中国企业的脚步也跟上了。当然,市场是检验成败的最佳标准,要在市场上获得用户青睐必须首先在体验上过关,而体验的背后又是技术在支撑。

两条腿并行,缺一不可。

读者福利:《一点财经》获得了 5个邀请码,读者朋友们可以留言自己想和「天工」互动的问题,4 月 19 日 24:00 前评论点赞最多的5位读者朋友将获得邀请码。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关标签
ai技术

相关文章

  • 瓯江论道:AI赋能绿色发展

    2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,

    标签:
    ai技术
  • 王通:未来个人创业的十个机会

    个人创业需要启动成本低、无需庞大团队、可快速验证、能利用个人技能或资源。这里分享适合个人创业的十个机会一.AI内容优化与本地化服务·做什么:帮助企业或个人利用AI工具(如GPT-4,Midjourney)优化内容生产流程。例如,为跨境电商撰写多语言产品描述,为小红书博主生成爆款文案,为小公司制作营销

  • 百度智能云PaddleOCR 3.1正式发布:关键能力支持MCP

    百度AI团队今日正式推出PaddleOCR3.1版本,以突破性的多语言组合识别(MultilingualCompositionPerception,MCP)技术为核心,彻底重构复杂文档处理边界。此次升级标志着OCR领域首次实现对同一文档内任意混合语言文本的精准识别,为全球化企业、跨境业务及多元文化场

    标签:
    ai智能
    ai技术
  • AI工具导航网站,未来的发展前景怎么样?

    导航网站的崛起:从信息过载到精准触达随着全球AI工具数量爆发式增长(2025年已超数万款),用户面临前所未有的选择困境。传统搜索引擎的“关键词-链接”模式难以应对工具筛选的场景需求,垂直化、场景化的AI导航网站应运而生。这类平台通过聚合、评测、分类与推荐四重机制,将分散的工具资源整合为结构化入口。例

  • 微信AI搜索被指“强行开盒”:名字成了数据入口,腾讯回应“仅用公开信息”

    当微信公众号文章中出现一个人的名字,它会自动变成蓝色链接,点击即可查看AI生成的“个人简历”——这一微信新功能让不少用户感到被“扒光”在互联网上。近日,微信新上线的“AI搜索”功能陷入隐私泄露争议漩涡。多位网友在社交平台反映,当微信公众号推文中出现本人姓名时,名字会自动变为蓝色超链接,点击即可浏览由

    标签:
    ai技术
    ai搜索
  • 一秒当导演:小云雀上线短剧Agent,10万字剧本一键生成60集

    凌晨两点,小王合上笔记本,揉了揉酸胀的眼睛。花了一个月写出来的10万字短剧剧本躺在硬盘里,要真正把它拍成剧,得找演员、租场地、请摄像、做后期……粗算下来少说要几十万,他只能把剧本继续锁在抽屉里。不过,现在小王的剧本可以“见光”了。2026年3月19日,字节跳动旗下的小云雀AI正式上线了短剧Agent

    标签:
    大模型
  • 腾讯云推出“龙虾”记忆服务,准确率飙升近六成

    你一定遇到过这样的场景:明明刚和AI助手聊了半个小时的项目细节,退出会话后重新打开,它却像个失忆患者一样,连你上一轮说过什么背景信息都忘得一干二净,你又得从头把需求讲一遍。这种“聊完就忘”的体验,让无数使用AI智能体的用户深感头疼。为了解决这一普遍困扰,腾讯云在4月3日正式推出了名为“龙虾”的记忆服

  • 谷歌 Gemma 4 正式开源,开源赛道迎来变局!

    4月3日凌晨,谷歌DeepMind悄然甩出一枚重磅炸弹——全新一代开源大模型Gemma4正式发布,以极其宽松的Apache2.0协议向全球开发者免费开放。这是自2025年3月发布Gemma3以来,谷歌时隔整整一年的重大迭代。本次发布的Gemma4包含四个不同规格的版本:E2B(有效20亿参数)、E4

    标签:
    大模型
  • OpenClaw常见的五种“病”,到底该怎么“治”?

    AI龙虾也会生病。别怕,大部分病不是什么绝症,自己在家就能治。我养OpenClaw一年多,总结出五种最常见的毛病,附上我的“土方子”,希望对你有用。病一:不吃食(完全不执行任何任务)症状:你给了指令,它没反应,日志里一片空白。就像龙虾趴在塘底不动弹,碰它也不理。病因:通常是进程卡死了,或者依赖服务没

  • 普通人怎么养AI龙虾,别让你的AI龙虾饿着或撑着

    养过真龙虾的人都知道,投喂是个技术活。喂少了,龙虾饿得互相残杀;喂多了,剩饵坏水,整塘发病。OpenClaw这个AI龙虾也一样——你给它安排的任务太少,它会“闲得发慌”,反应迟钝;你一次塞给它太多复杂任务,它会“消化不良”,要么报错要么干一半就卡住。每天该喂几次?我的经验是:每天喂两次,早上一次简单

  • 选对版本和“饲料”,OpenClaw小龙虾才能长得壮

    养过真龙虾的人都知道,苗种的好坏直接决定收成。养AI龙虾也一样——OpenClaw有不同版本,有的稳定但功能少,有的功能多但爱“闹脾气”。新手该怎么选?我用自己的踩坑经历告诉你。版本怎么选?OpenClaw目前主要有三个分支:稳定版(Stable)、测试版(Beta)和社区魔改版(Community

热门排行

编辑推荐