(首发钛媒体APP 作者 | 杨丽) 跟随科技圈“时尚”,Microsoft宣布将于2023年3月底之前在全球裁员1万人,约占职员总数的5%。这次裁员规模之大,被Microsoft视为应付宏观经济情况和顾客优先事情变化的手段。但这种做法好像不影响这家企业有足够的资金对Open人工智能进行新一轮投资。
据外媒Semafor报道,Microsoft将以100亿USD投资Open人工智能,并且将获得Open人工智能 75%的价值份额,直到收回投资资金,之后Microsoft将持有Open人工智能 49%的股份。
投资Open人工智能,其源动力是ChatGPT带来的一系列业内反响,ChatGPT一方面正为Microsoft补强其在搜索范围的壁垒,其次也为自己在通用型人工智能和NLP范围塑造商业化能力,而这原本是一个由Google人工智能主导的大市场。
ChatGPT于2022年11月30日面向推广客户端进行发布,两个月后,该模型驱动的工具平台月活用户估计已达1亿。日前,ChatGPT还宣布了Plus增值版,每月收费20USD,面向更多有需要的企业和学生提供会员服务。摩根士丹利的一份报告正研究ChatGPT是不是对Google构成威胁,“该语言模型或许会占据肯定市场份额,并且破坏Google作为网络用户入口的地位。”
深受深度学习的影响,NLP范围近年来的科研成就是可见的,也解锁了不少新的应用场景,但仍然没迎来重要的商业化破局。而Open人工智能与Microsoft土财主的这次合力“氪金”,显然激起了新一轮NLP技术企业的集体焦虑。
ChatGPT的过去与目前从技术原理讲解,ChatGPT是由微调后的GPT3.5模型提供。与早期的ELMO,Google的BERT、ALBERT,百度的ERNIE,达摩院的M6一样,它们均为NLP预练习大模型的典型代表。这意味着像常识检索、人机交互、语言翻译、文学创作这类活儿,预练习模型仿佛都能干。
但不一样的是,ChatGPT这次还提供了推广客户端界面,用户可直接通过推广客户端基于模型练习出的“机器人”进行交互,并且达成WebUI免费版。这种做法也让很多C端用户可以飞速调用ChatGPT,如构思小说框架、写论文、辅助课程设计、为程序debug等操作花样百出。
在GPT3.5之前,Open人工智能已经连续发布三个版本的GPT模型,特别以GPT-3最为著名。在此期间,GPT模型就开始疯狂通过增加可练习参数、增加练习样本等方法进行改进。但暴力拆解方法下,GPT-3依旧会常常产生错误,曾有专家指出,“假如没很多复杂的工程调试,GPT-3还没办法真的投入用。”
其次,GPT-3,其参数目就已经达到1750亿,并用了45TB的练习样本。这意味着当人工智能任务练习成效提高的同时,也对模型练习本钱和时间带来了巨大挑战。业内有人曾估计仅练习GPT-3模型就需要1200万USD,假如用一块很一流的英伟达GPU练习GPT-3,大概需要100年。
在Transformer思潮的推进下,语言模型进入“巨量”年代,大模型已经在产业界带来了一系列连锁变化。而NLP范围又并不是是一个独立的技术范畴,依旧需要有底层算力、云数据、常识图谱、迁移学习等核心技术的支撑。
假如GPT根据以往的进步逻辑,将会渐渐通过开源方法让科研与工程界共享技术红利。但在商业世界,绝不是这样简单。
Microsoft的神来一笔2019年,在联合开创者埃隆马斯克转身离开后,Open人工智能宣布重组,成为有收益上限的盈利机构,股东的投资回报被限制为低于原始投资金额的100倍。同年7月,Microsoft以10亿USD注资,并获得了Open人工智能 GPT-3的独家授权,而Open人工智能则可借用Microsoft的Azure云服务平台解决商业化问题,缓解高昂的本钱重压。
过去几年,Open人工智能与Microsoft的合作步伐渐渐加快。2021年,Open人工智能与代码推广托管平台Github(被Microsoft回收)合作推出Copilot 人工智能智能代码生成平台,可将文字语言提示词转化为代码,现在是为了提高开发者编码效率。
2022年,Open人工智能先后推出图像生成器DALL-E 2和文本生成器ChatGPT,Microsoft也飞速将它整理到自己商品套件,如搜索引擎Bing、Office办公全家桶、会议视频商品Teams Premium均已经计划应用ChatGPT。
而现在,Microsoft不只期望进行新一轮百亿美金投资,还表示将在Azure云平台中整理ChatGPT,达成Azure Open人工智能服务全方位上市,通过该服务可访问Open人工智能开发的人工智能模型,届时Microsoft的每一个商品都将拥有相同的人工智能能力。
与Open人工智能的合作,成为Microsoft到迄今为止在人工智能范围一笔成功的交易,对Microsoft在搜索引擎、办公、会议视频,与云市场引发了强烈冲击,而这也让外面“期待”有望在2023年发布的GPT-4。
热闹的背后据外媒CNBC报料,Google近期正在加快研发一个名为“学徒巴德”(Apprentice Bard)的聊天机器人,其基于LaMDA语言模型。显然,Google于去年12月针对ChatGPT的“红色警报”已经拉响。而除去LaMDA以外,Google也已经计划将图像生成模型Imagen对抗Open人工智能的DALL·E 2。
而据百度披露,今年1月初,百度搜索将升级“生成式搜索”能力,基于百度自研的生成式模型能力,为用户开放式的搜索提问或定制化的信息需要“创作答案”。除此之外据路透社报道,百度曾计划于3月将该服务作为独立应用推出,再逐步将它集成到搜索引擎中。
无论在当下关注度较为集中的搜索范围,还是其他潜在范围,受ChatGPT的强烈刺激,包含Google、百度在内的人工智能主力梯队已经迅速跟进起来。不过,来源于GPT本身涉及的伦理问题与技术难题依旧存在。
如Stack Overflow已经宣布禁止将ChatGPT所产生的问题用于回答社区问题,并给出违规者最多可被封禁30天的惩戒手段。当不少大学生开始用ChatGPT写作业,纽约大学等高校的教授及学者们也发出警告,将人工智能视为作弊行为。
在技术层面,GPT-3过去会犯的错误,在ChatGPT上也并未解决掉,如只能计算精通十以内的加减法,甚至还会“一本正经地胡说八道”。这与ChatGPT的练习语料库有肯定关系,其喂养的数据还是来自2021年前来自网络的数十亿个文本示例。比如在专业常识范围或者信息更新快的IT范围,模型练习任务和练习成效总是会受其制约。
而在练习本钱上,小冰公司CEO李笛此前表达,“ChatGPT主如果研究性质上的突破。它有很好的革新,即证明了在原有些大模型基础之上,进行一些新的练习办法,可以更好地提升对话水平。但假如小冰用ChatGPT的方法来运行系统,目前小冰天天承载的交互量就需要花近3亿人民币的对话本钱,即便ChatGPT可以把本钱优化到目前的10%,也赚不回来。”
据外媒披露,Microsoft此前的筹资就以现金+Azure云算力的方法作为兑付,模型练习最消耗的也恰恰是算力本钱。这也难怪剖析机构预测,ChatGPT用量的迅速增长可能使英伟达在12个月内销售额达到30亿至110亿USD。长期来看,这也将是Microsoft应付算力高投入与ChatGPT高增长可预见收益下的一种对冲方案。
其实,ChatGPT出现之前,基本国内大的人工智能玩家就已经在涉足构建出像GPT、但主要基于中文语料库的预练习大模型。大模型在落地过程中呈现出了与以往模型不一样的技术特点,也带来了更好的自动化水平。
“但大模型想要在某个方向上练习得更好,自动化水平更高,需要在具体落地场景引入额外的范围常识,才能解决实质问题。人工智能大模型有其自己特征,练习时用的数据集主要来自网络,在通用常识和范围常识的分布上存在不均,会干扰其在具体行业的应用。”浪潮信息人工智能软件研发总监吴韶华对钛媒体App表示。
对于更多的创业公司而言,大模型做微调或二次开发的方法,且不说仍需要很多算力的支持,在实质场景中,能否等到成熟落地也需要时间本钱。
在ChatGPT之后,必然会有更多的人工智能团队试图给出算法愈加精准、练习本钱更低、对于用户而言调取更便捷的模型,它可能依旧会结合Transformer,也会运用新的机器学习技巧,提出对语言翻译、文本生成、甚至情感剖析等NLP通用场景下的解决思路。
特别对于中国的人工智能团队,也会在ChatGPT的这场狂欢中继续回答一个老问题:当技术的风口第三来了,怎么样防止走过去商业目的不明确的老路?





