率先全面开放,文心一言为何一骑绝尘? - {$web_name} 先是华为新机深夜启动
连续两天,半夜爆出大讯息。先是华为新机深夜启动,让处理器国产替代的步伐更进一步;次日晚,百度文心一言官宣向大众完整启动——两大劲爆讯息直接点燃技术圈。周杰伦网易游戏
8月31日凌晨,百度权威大众账户即亮相推文,称“文心一言向全民间启动”,使用者可以在使用商店获取“文心一言APP”或登陆“文心一言官网”感受。含有百度文心一言在内,一共有8个企业/机构的模型位列第一批名单,可以官方启动面向大众提供办事,值得注意的是,被看作文心一言比拼者的阿里通义千问、360智脑、讯飞星火等,不在首批获批名单中。
接着“文心一言APP”在各大使用商店冲上热榜,在苹果App Store上更是直接登顶免费榜榜首,变成当日热门使用,这无疑让百度再一次占得了先机。
此前,在获得备案审批之前,各家只能小范围内测,使用者需要“排队”申请内测资格,由此大大限制了模型在使用者层面的使用,如今模型备案获批和完整启动,重磅电影预告盘点模型的步伐有望迈入下一阶段。
秉持着技术自主的理念,将资金大规模倾斜到自主技术开发的百度和华为,可以说是殊途同归,而软设备领域的“双子星”联袂,共同合作技术投入走向“开花结局”。
技术坚守,换来厚积薄发
模型在境内掀起新一代技术浪潮,迅速席卷了全部互联网,而百度在模型赛道上的步伐一直领先。2019年第一个亮相了文心模型,2023年,大厂中最初启动大语言模型“文心一言”,如今又率先获批、得到认可,官方向全民间启动。
百度之所以高效踩在了模型的全球性技术风口上,是兴办在百度雄厚的技术基底之上。
早从2010年着手,百度就已然着手布局AI有关技术的开发,近十年来,累计开发投入超过 1400 亿元。其中2022 年开发费用高达 214.16 亿元,占百度核心收益比例达到 22.4%。与全球其他大厂相比,这些投入也是数一数二。
在高开发成本的最新笔记本电脑速递持续投入下,这些年从最初探索深度进修等基础技术,到合作AI在互联网等场景使用落地,再到如今扎根千行百业、大力合作AI工业化大生产等,百度既达成了在处理器、框架、模型和使用四层构架对应的自研技术积累,具备了做AI基础设施供给者的前提条件,又顺利推动了AI技术成果在产业层面的实践,下降了AI的开发和使用门槛。
这也使得百度不管在技术专利、技术商品还是技术使用上,都占据了领先地位。以专利来看,依据由全国工业信息可靠进展探究中心、工信部电子知识产权中心亮相的《中国AI专利技术确认报表(2022)》显示,百度AI专利申请量1.68万件,连续五年维持中国第一;专利授权量上,百度仍以5705件专利授权量位列第一。
文心一言模型,正是百度多年技术积累和产业实践的水到渠成,而基于技术和实践的领先长处,文心一言问世不到半年,在境内外多家调研机构、权威传媒和高校等亮相的模型评测报表中,表现优异。
如IDC新近亮相的近日快速Steam特惠《AI模型技术能力评估报表,2023》,报表显示,百度文心模型3.5拿下12项指标的7个满分,综合评分第一,算力模型第一,行业覆盖第一。其中算力模型是模型能力最为核心的要素,百度文心模型在这一维度获得了唯一的满分。
更令外界欣喜的是,从测评来看,百度文心一言模型能力从5月至今不断提升,正逐步赶上国外模型。
百度‘AI大底座’的全栈能力,合作文心一言进化
31日凌晨完整启动后,百度文心一言APP迅速飙升至苹果商店免费榜榜首,变成首个登顶使用商店榜首的中文AI原生使用。
使用者的反响,透露出他们对文心一言表现出的强劲进化能力的盼望。自本年3月亮相至今,文心一言高效成熟,熟练掌握的创作体裁超过200个,信息丰富度是亮相初期的1.6倍,思维链长度是初期的2.1倍,知识点覆盖达到初期的8.3倍。在一些公开测评中,文心模型3.5版扶持下的文心一言中文能力突出,乃至有超出GPT-4的表现。
这很大程度上得益于百度飞桨,百度拥有自研的深度进修渠道飞桨,它有力支撑了模型的高效训练和推理。经由飞桨端到端自适应混合并行训练技术以及压缩、推理、办事部署的合作完善,文心模型训练速度达到原来的3倍,推理速度达到原来的30多倍。
飞桨和文心一言,一个是框架渠道,一个是模型,这两者之间正好处在AI技术体系里面很重大的两层,它们之间有很强的合作完善潜力,由此飞桨领先的训练技术,能够完善模型的训练效率。
百度不单单在框架层和模型层拥有核心技术。进入AI时代,IT技术的技术栈发生了根本性转变,从过去三层转变为“处理器-框架-模型-使用”四层,百度则是全球为数不多、开展全栈布局的AI企业。从高端处理器昆仑芯,到飞桨深度进修框架,再到文心预训练模型,及检索、智能云、自动驾驶、小度等使用,各层都有领先业界的核心自研技术。
如框架层上,百度从2016年就开源了飞桨深度进修框架,当下这一框架已然集成了深度进修核心训练和推理框架、基础模型库、端到端开发套件等工具组件,在中国行业占比中排行第一。
全栈布局的长处在于,可以在技术栈的四层架构中,做到端到端完善,大幅提升效率,飞桨和文心一言的完善,就是最典型的例子。另外,处理器、框架、模型和终端使用场景,也可以形成一个高效的反馈闭环,合作模型不断去调优迭代,越做越好。
比如文心一言与检索、信息流等使用层的合作。百度的检索办事,每天响应几十亿次真实的使用者使用需求,每天开展1万亿次深度语义推理与匹配,能够提供最真实、最及时的反馈,从而倒逼模型、深度进修框架和处理器的完善。相对地,文心一言使用于检索,也将带来检索的变革。
除了全栈自研的‘AI 大底座’,百度智能云启动的两大AI工程渠道—‘AI 中台’和‘百度百舸· AI 异构计算渠道’,也分别在开发和资源层面开展提效,加速训练过程。这给文心一言的成熟提供了最坚实的技术支撑,也变成其追赶国外模型的底气。
核心能力升级,百度加速模型落地时代到来
5月底举行的2023万象·百度移动生态大会上,百度检索亮相“AI伙伴”着手内测。这款全能的“Al伙伴”能够听懂使用者的任何难题,并用语音开展互动,还能合作使用者标记答案中的重点,提供权威的来源。在演示中,“Al伙伴”完整地提供了一篇AI大会主持词。
百度旗下各类使用者侧商品正运用模型开展重构,而基于模型基座和云渠道开展开发生态的建设也在同步合作。前不久,百度承办的2023 WAVE SUMMIT上,启动了“超级助理”和“Comate X智能编程助手”。
理解、生成、逻辑和记忆,构成了一个AI或者通用AI操控系统最基础的能力,从文心一言在C端及B端使用上的表现来看,这四大核心能力正高效提升,而背后展示出的则是百度在知识增强、检索增强、对话增强方面的核心技术能力和差异化长处。
庞大的知识图谱和检索基础上对真实资料和使用者需求的理解,是百度多年来兴办技术护城河和兴办信息生态的基础,因而身为百度自主研制的知识增强大语言模型,文心一言在知识增强和检索增强方面天然具有长处。
据悉,百度文心模型拥有全球上最大规模知识图谱,包含50亿实体、5500 亿级事实,每天调用量超过400亿次。
在对话增强方面,百度深耕对话技术多年,前不久,王海峰带领团队达成的‘知识与深度进修融合的通用对话技术及使用’成果,荣获了‘2022 年度吴文俊AI技术提升奖特等奖’,这是该奖项兴办以来颁发的首个特等奖。对话技术所关乎的记忆机制、上下文理解和对话规划能力,能够合作文心一言做到更好的对话连贯性、合理性和逻辑性。
百度已然兴办了面向中文、办事使用、富含知识的多样化训练资料,并兴办起人类反馈、奖励模型和策略完善之间的飞轮机制,随着真实使用者的反馈越来越多,文心一言的效果会越来越好,能力也越来越强。
而今,文心一言率先面向使用者完整启动,也就说前方能获得更海量的真实全球中的人工反馈,这将进一步改进基础模型,合作文心一言加速迭代、提升能力。并且,对使用者层面的放开,会刺激模型比拼中心转向使用层,激起使用开发的创造活力,基于文心一言的领先,百度前方或将率先带来杀手级使用,真正推动模型进入落地时代。
这亦是使用者想从这场技术性浪潮目睹的,弯道超车,占领新一代技术变革的制高点。
转发免责告示:家电资讯站点对《率先完整启动,文心一言为何一骑绝尘?》一文中所陈述、观点判断维持中立,不对所包含信息的精确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担整体责任。
本站点有若干信息均转载自其它传媒,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,本站点无法鉴别所上传图片或文字的知识版权,本站所转载图片、文字不关乎任何商业性质,假如侵犯,请及时通知我们,本站点将在第一时间及时删除,不承担任何侵权责任。联系QQ:411954607
本网觉得,一切网民在进入家电资讯站点主页及各层页面时已然认真看过本条款并完全同意。敬请谅解。