购物网站html,贵阳网站建设套餐,2345网址导航下载桌面,企业电子网站建设“你训练的大模型涌现了吗#xff1f;”“还没有。好难受。”一时间成为了最近AI赛道玩家的一个爆热梗。
不管承不承认#xff0c;相信每个玩家都不愿意输掉这场激烈的竞争。自百度成为国内“第一个吃螃蟹的人”后#xff0c;又有两大中国科技巨头做好了准备——华为和阿里…“你训练的大模型涌现了吗”“还没有。好难受。”一时间成为了最近AI赛道玩家的一个爆热梗。
不管承不承认相信每个玩家都不愿意输掉这场激烈的竞争。自百度成为国内“第一个吃螃蟹的人”后又有两大中国科技巨头做好了准备——华为和阿里巴巴各自新研发的“大模型”、“ChatGPT”也都即将于近日问世。
首先是华为的盘古大模型新版本即将亮相的消息据称4月8日华为云人工智能首席科学家田奇将在杭州人工智能大模型技术高峰论坛上通过一场技术分享介绍“盘古大模型的进展及其应用”。
与此同时一封来自阿里的会议邀请函也给业内带来了很有分量的消息在4月11日的阿里云峰会上将正式推出阿里最新自研的大模型模型内测目前已在进行中且接下来还会有各类行业应用类模型问世。就在今天中午通义大模型已经官宣开始企业邀测 如果说之前巨头们从“大炼模型”到“炼大模型”是在秀肌肉、打地基那么这次发布模型的意义则更多的在于入局类ChatGPT产品赛道
一、华为深耕B端开辟多业务场景
事实上华为自2020年便启动了AI大模型布局。据相关资料显示盘古NLP大模型采用深度学习和自然语言处理技术采用了大量中文语料库进行训练基于“预训练下游微调”的工业化AI开发模式拥有超千亿参数并支持多种自然语言处理任务包括文本生成、文本分类、系统问答等。
1.华为版ChatGPT接近GPT3.5水平注重中文优化 根据华为云官方显示华为即将上线的“盘古系列AI大模型”分别为NLP大模型对标ChatGPT、CV大模型、多模态大模型与科学计算大模型。据介绍其中NLP大模型在预训练阶段学习了超40TB中文文本数据CV大模型首次实现兼顾图像判别与生成能力而科学计算大模型则可应用于气象、生物医药等领域。 与ChatGPT相比盘古NLP大模型在数据方面更接近GPT3.5的水平但其更加注重中文语言优化在中文语法语义理解上有着更大优势并且其拥有泛化能力强、小样本学习和模型高精度三大特性可适用大量复杂的行业场景即使少量样本也能达到高精度。
根据华为官方介绍盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一刷新三项榜单世界历史纪录总排行榜得分83.046多项子任务得分业界领先,是目前最接近人类理解水平 (85.61)的预训练模型之一。
2.华为的三个独特优势 在大模型研发方面华为相比于其他国内企业有着一项较为独特的优势——拥有完整的产业链和较强的算力匹配能力。据介绍盘古系列大模型都是基于华为Model Arts所构建的并由在2022年蝉联全球人工智能算力第一的鹏城云脑二期提供算力底座。在训练盘古大模型时华为团队调用了超过2000块昇腾910芯片进行了超过2个月的训练。
产业生态层面华为则延续了自己重B端的企业基因大模型产业化的初衷正是在于开辟更多B端业务场景正如华为云人工智能首席科学家田奇所言“将工业化的一面放置在更高的优先级上”。此外盘古大模型还融入了华为在5G、云计算、物联网等领域的技术优势可应用于智能客服、机器翻译、语音识别等多个领域为企业提供智能化服务。
据中信建投研究报告显示目前盘古预训练大模型能力已在包括能源、零售、金融、工业等领域得到验证。同时盘古NLP大模型通过迁移学习实现少样本学习目标并采用了分布式计算技术可以实现模型的在线训练和增量学习随着数据量的增加不断优化模型提高模型的准确度和质量使其更加适合复杂的商用场景在部分应用中的表现已超过GPT-3.5。
二、阿里C端发力测评结果喜人
再来看阿里这边无独有偶阿里的中文大模型研发之路也始于2020年左右。2021年阿里先后发布国内首个超百亿参数的多模态大模型“通义-M6”以及号称“中文版GPT-3”的语言模型PLUG。虽然参数量仅为270亿但PLUG与GPT-3一样拥有强大的文本生成能力。
1.通义大模型融合升级 据报道显示即将发布的阿里达摩院版ChatGPT正是基于通义大模型体系融合升级而成。通义大模型底座基于统一学习范式OFA等底层技术打造在不引入新增结构的情况下即可同时处理文生文、文生图、图片描述、内容摘要等多项单模态和多模态任务。经历升级后更是可以处理超过包括语音和动作在内的多种跨模态任务。
其中“通义-M6”主要解决文本图像生成构建的相关任务包括图文理解、图文生成、语音理解、语音生成且阿里2021年发布的模型版本已达千亿参数而通义-AliceMind则为NLP预训练模型应用场景包括文生文、文本理解、问答对话等通义-视觉应用场景则涵盖视频表征、图像检测、视频编辑等。
2.阿里内部爆料 在此前一份有关阿里大模型的采访中阿里内部人员表示阿里在大模型方面可以提供的方案主要有两种一是阿里内部推出的模型效果相对较好可以与集团内部广泛的C端产品进行结合例如天猫、淘宝和高德地图的搜索业务这将为搜索引擎带来全新的商业模式也将为阿里本就蓬勃的C端业务注入更多活力而C端的数据积累也将很好地反哺阿里大模型及相关应用的研发。此外阿里还可以输出自己的API并向合作伙伴或渠道商收费。对于API可能会在特定领域上对合作伙伴有所帮助例如电商、搜索推荐等。
而在算力方面阿里云在云上至少有上万片A100整体至少能够达到10万片集团的话应该会是阿里云5倍的量级。达摩院、天猫、淘宝的算力资源都是集团内资源使用。由于大模型及衍生应用研发等需求阿里云今年增速会达到30-50%个别客户会有复现GPT的需求提出大规模AI算力需求阿里将以云的方式进行支持。
除此之外还有爆料显示阿里即将推出的类ChatGPT对话机器人产品还可能将与钉钉生产力工具进行结合后续也得到阿里巴巴方面确认。
3.B站博主测评结果喜人 更值得注意的是就在近几天有B站博主测试了阿里的天猫精灵发现其已经上线了阿里版ChatGPT的语音助手。对此阿里也进行了回应表示目前天猫精灵所整合的是大模型技术Demo“天猫精灵和达摩院一直在紧密合作其中包括推进大语言模型、声学模型、语音AI等综合应用”。 在B站博主所发布的测评视频中博主与集成Demo版大模型的天猫精灵进行了超过3分钟的15轮问答对话其中10问题的回复都明显优于国内已公布的同类型产品。且在了解到用户订餐需求后天猫精灵同意了用户请求并表示已帮助用户完成了订餐。虽然由于并为集成相应接口Demo版天猫精灵并没有如它所言完成任务但相信在正式版发布后诸如订餐、打车、购票等功能均可能得到实现。
三、专家热评华为生态布局扎实阿里数据和算力更优
那么业内专家对于阿里和华为即将发布的大模型又有哪些评价和看法呢为此51CTO采访到了人工智能技术专家、前智源研究院政务创新中心技术负责人刘占亮老师。
据刘占亮分析华为在该方面的最主要优势是华为在toB领域的长期积累使其拥有着非常扎实的产业生态而华为在人工智能方面的全栈布局将有助于企业在各领域、各不同业务中的长期发展。但从短期角度来看华为大模型的商业化进展将有可能会受到底层基础设施成熟度的影响。
对于阿里而言其拥有着覆盖多个行业的生态体系大量C端以及B端的数据积累将为阿里大模型研发提供非常重要的动力而在算力方面阿里相比于大部分科技企业而言也有着巨大的优势。在数据和算力优势的加持之下阿里在大模型研发及生产应用方面的效率应该能够达到较高水平。
虽然从应用领域与目标用户的角度来看华为和阿里两家企业可能会有所不同。但归根结底两家公司都有潜力推动中国人工智能领域发展。
但在此之前刘占亮还指出摆在这两位巨头眼前的还有三大主要挑战其一是需要应对国内外激烈的市场竞争其二是需要对潜在的政治风险做到0失误的精准控制其三则是老生常谈的技术挑战无论华为还是阿里在自身业务层面都有着非常丰富的经验积累那么其所研发的大模型及一系列衍生产品能否在实际生产中发挥更高的效率这考验的便是企业对于特定领域技术的应用与理解。
四、国产化ChatGPT才是出路
近期以来ChatGPT陷入了一些列纷争之中由于非法收集用户数据的原因意大利已进行了对ChatGPT的全面禁封德国也出于对数据保护的考虑正在计划在全国范围内禁止ChatGPT的使用。而在不久前ChatGPT也针对亚洲地区进行了一次悄无声息的大规模封号。就以上事件看来依靠ChatGPT微软与OpenAI已经成为事实上的头号玩家而这对于国内企业类似产品的发展而言不管是封禁还是封号都并不是一个良好的势头。
诚然由于中文天然的复杂性实现中文版ChatGPT的难度将会变得更大但国内科技企业能够在这一时期利用自身优势研发针对不同业务场景的同类型模型及应用无论是出于对自身利益的考量还是出于对更高理想的追求这本身都是一件值得鼓励的事情。人工智能的发展在带来科技革命的同时也注定会带来同一赛道上的百家争鸣不管是企业层面还是全球层面都避无可避。
五、写在最后
如今ChatGPT成为下一代操作系统的“叙事”刚刚开始其所带来的强大的生产力提升必将赋能千行百业并带来巨大的商业机会。在这样的情况下自主可控与合理监管才是每个国家、每家科技企业甚至每位技术从业者应该关注与思考的问题。
虽然就目前而言无论百度、华为、阿里还是其他正在深耕该领域的科技企业都暂时无法推出能与GPT-4一较高下的AI大模型。但有时后发未必一定是坏事让我们给予它们一些信心与时间相信在这些企业与技术从业者的不断努力下国内AIGC生态建设自主化的步伐将能够越走越快。