拳打谷歌ChatGPT火出圈!投资人称更需警惕投资泡沫化跟风

数智人2023-05-31产业资讯174
一夕之间,ChatGPT突然火了。所谓ChatGPT,是在今年11月30日,由人工智能实验室OpenAI上线的新模型,其网页应用允许用户免费使用,目前用户与ChatGPT之间的对话互动包括了普通聊天、信息咨询、撰写诗词作文、修改代码等,甚至令用户产生ChatGPT能否取代谷歌等搜索引擎的疑虑。一位技术领域人士认为,让ChatGPT类平台、以及短视频平台或购物社交平台来取代搜索引擎,容易让知识来源单一化,这是危险的。东吴证券团队也认为,ChatGPT模型仍无法很好解决虚假信息的问题,甚至过度猜测用户意图导致回答偏差较大,因此其本质仍偏向AIGC内容生产工具,而非搜索引擎。此外,ChatGPT火速出圈,但对话过程中也经常会发生因语料积累不足而产生的“事故”。多位AI界行业人士对第一财经记者表示,无需因ChatGPT的智能而对AI产生恐惧,ChatGPT的出圈本质是算力与样本量提升后得到的自然结果,更需警惕的是将ChatGPT归属于AIGC赛道后引发的创业与投资泡沫。马斯克在推特上分享的跟ChatGPT的对话截图据官网介绍,计算模型GPT-3.5支持的通用聊天机器人ChatGPT,能回答连续性的问题、承认自己的错误、质疑不正确的假设,甚至拒绝不合理的需求。从写剧本、写诗、设计游戏,到给程序找bug,乃至制定一份“毁灭人类”的计划,这个AI能做的事情超乎想象。美国企业家马斯克询问了ChatGPT如何设计Twitter,AI回答称:“为了使用户更容易查看线程互联网对话并与之交互,你可以将线性一维界面转换为二维无限网格。”有人认为,ChatGPT的出现堪比AlphaGo打败李世石。12月5日,OpenAI创始人兼CEO阿尔特曼(SamAltman)发布推文表示,ChatGPT用户数已突破了100万。在这条推特下,马斯克询问“每次聊天的平均费用是多少”,阿尔特曼回复表示,“用户平均每次聊天所花费的可能是个位数美分。”目前ChatGPT仍处于免费测试阶段,不限量向公众开放,基于其破百万的用户数,平台所花费的成本不算小。不过,在使用过程中,用户提供的反馈对OpenAI也是最有价值的信息,可以不断训练语言模型,修正错误答案。第一财经记者注册并体验了一下ChatGPT对话。虽然目前ChatGPT并没有开放给中国地区的用户,但界面仍可使用中文。记者首先让AI自我介绍,其回复,“我是Assistant,一个由OpenAI训练的大型语言模型。我的工作是帮助人们回答各种问题,尽可能提供准确和详细的信息。我可以回答各种问题,无论是关于历史、科学、人文还是其他话题。”计算机领域从业人士高毅对第一财经表示,试用ChatGPT的体验很奇妙,一个聊天AI能写代码,能用“意念”分析代码,甚至能用“意念”分析一个超时程序的运行结果,“一开始以为他打开了个gcc或者python之类的外部进程辅助分析,但试下来感觉并不是这样,而是他真的像人一样在试图理解这些代码。”高毅故意提供了一些有问题的输入程序,使其根本无法正确执行,还故意给了个有生之年无法运行结束的程序,而ChatGPT像人而非机器一样,无视了上述这些不重要的问题,转而专注于问题的核心点,并在有限时间内给出了解答,“虽然他回答有小的错误,但能够做到这一步真的已经非常厉害了。”东吴证券研报分析认为,ChatGPT的模型经历从GPT到GPT3的升级,优化主要来自算力增加。GPT、GPT-2和GPT-3在算法模型并没有太大改变,但参数量从1.17亿增加到1750亿,预训练数据量从5GB增加到45TB,其中GPT-3训练一次的费用是460万美元,总训练成本达1200万美元。虽然训练数据量和算力大幅增加使GPT-3有显著优化,但高额投入也使其只能走B端变现。此次ChatGPT出圈,其技术模型最大变化出现在2022年推出的GPT3.5,技术迭代成优化来源于1月发布的InstructGPT模型中增加了人类对模型输出结果的演示,并在对结果进行排序的基础上训练,加上指令调整的帮助,虽然其只有13亿个参数,但回答准确率、道德表现却好于GPT-3。ChatGPT虽然强大,仍然有其局限性,比如偶尔会犯错误,有一定的误导性;作为一个AI,它也不能提供对人或事件的判断和评价。但基于其反馈强化学习系统,ChatGPT也在不断学习完善。有用户表示,前几天问ChatGPT的时候提供的错误答案,过了一天之后就已经被修正,或许是很多用户的反馈帮助ChatGPT对正确的答案进行了排序。日常对ChatGPT进行调戏逗乐仅是娱乐项目,一旦作为严肃工作内容,则需要严谨对待。据了解,程序员交友网站StackOverflow上已出现大量通过ChatGPT自动生成的内容,给StackOverflow的质量管理造成影响。StackOverflow方面发布公告称,由于从ChatGPT中获得正确答案的平台比率太低,发布由ChatGPT创建的答案对网站和询问者以及寻找正确答案的用户都有很大危害。“禁止用ChatGPT直接生成垃圾答案,否则封号。这是一个临时性规定,目的是应对目前论坛上ChatGPT生成内容的泛滥之势。”对此,ChatGPT回应称,“因为AI生成的答案不总是准确或相关的,可能会导致StackOverflow上混淆错误答案,误导在寻求帮助的用户。”“StackOverflow禁止用AI生成答案是合理的。”阿尔特曼也表示,正试图阻止ChatGPT随机编造,现阶段让其与当前技术保持平衡是很棘手的。随着时间的推移,会根据用户反馈来改进。开发出ChatGPT的公司是何来头?公开信息显示,ChatGPT由人工智能公司OpenAI开发,成立至今已经七年,坊间传言其最新估值已达到两百亿美元。OpenAI最初是由马斯克、阿尔特曼等六人在2015年联合创办,最初为非营利性机构。2018年马斯克宣布退出,2019年,OpenAI宣布重组为一家“有限营利(capped-profit)企业”,并接受了微软10亿美元的投资,双方表示将合作替Azure云端平台服务开发人工智能技术。此次推出的ChatGPT也是在微软AzureAI服务器上完成的训练。阿尔特曼在12月6日发布的推文中感谢微软和Azure,他表示,微软和Azure做了大量的工作,构建了迄今为止最好的AI基础设施,但目前并没有因为OpenAI推出的东西而获得足够的荣誉。此次ChatGPT的火热出圈也引发外界对AI是否即将战胜人类的恐慌。但多位AI界面人士对记者称,目前ChatGPT更多是算力与语料调教后的正常结果。据国盛证券研报,ChatGPT的背后离不开大模型、大数据、大算力,其技术底座使用的是微调后的GPT-3.5系列模型,有着多达1750亿个模型参数,OpenAI主要使用的公共爬虫数据集有着超过万亿单词的人类语言数据集。GPT-3.5在微软AzureAI超算基础设施上进行训练,总算力消耗约3640PF-days(即每秒一千万亿次计算,运行3640个整日)。针对外界认为ChatGPT可以取代搜索引擎的观点,前Google总部科学家、出门问问创始人李志飞认为,相对于语音助手和搜索引擎,ChatGPT目前还有很多不能干或干不好的实情,如不能查询附近的川菜馆,不能进行打电话、定日历、播放歌曲等手机本地操作。此外,ChatGPT大概率不能回答训练时它没有看到的最新网页知识,不一定能正确回答一个五年前政治人物今年的年龄,大概率不能做对简单的逻辑题和加减乘除题。总结来说,李志飞认为,ChatGPT的“认知”建立在虚拟训练文本上,没有跟实时的数据库或信息连接,也没有显式的逻辑推理,仍有些“空中楼阁”的味道,所以特别适合插科打诨。虽有不少声音将ChatGPT与谷歌等搜索引擎对比,但东吴证券团队认为,由于ChatGPT模型仍无法很好解决虚假信息的问题,甚至过度猜测用户意图导致回答偏差较大,因此其本质仍偏向AIGC内容生产工具。搜索引擎核心是海量信息集合,而非信息创造;但在“存在标准答案”的编码、数学计算等领域,ChatGPT或将对搜索引擎产生一定冲击。其次,相比更多面向B端客户的GPT-3,C端学习和使用成本低、产出效果好的ChatGPT有望助力AIGC破圈,并在接收海量用户反馈的过程中继续迭代,推动AIGC文字内容生产走向全民化。不少游戏人士和插画人士也开始关注ChatGPT,但不少用户在使用之后反馈表示ChatGPT并没有想象中那么智能。有一位游戏行业人士发现,ChatGPT对于2021年之后发生的事情似乎了解得并不多,“问它《原神》,它不知道稻妻(原神的一个地名)是哪里。”该用户说。另有用户向ChatGPT提问“《原神》的开发公司是哪家”,得到的回应不是米哈游而是腾讯。对此,另一位用户表示,目前ChatGPT的学习的数据样本只截止到2021年,等到训练的人数增加了,反馈内容的质量便会有所提升。此外,部分用户向记者反馈认为,ChatGPT在不同语种的识别和解读上存在差异,使用中文和同样内容转译成的英文输入得到的反馈结果并不相同。尽管目前ChatGPT仅能实现文字应答,但是不少插画人士也开始利用ChatGPT工作。一位插画师告诉记者,对于目前市面上流行的AI绘画软件stablediffusion,插画师常苦于反复修改提示语但仍无法得到理想的结果。不过ChatGPT提供了一个新的思路:用于生成指导AI作画的提示语模板,即利用AI告诉AI如何作画。“相当于把ChatGPT当成一个人类惯用语和ai绘画能理解的语言中间的翻译器,只需要在它生成的模板中填写几个关键词然后粘贴到stablediffusion就好了,经过ChatGPT转换后的指令成的图比原先手动输入的内容相比要好很多。”相较而言,人工智能研究专家、创新工场人工智能工程院执行院长王咏刚持有更谨慎的态度,他表示,其一,AI创作目前在知识教育领域争议很大,例如王咏刚杜撰了一个学术概念“镜像等离子规范场”,但ChatGPT竟然真的一本正经地进行了解读。王咏刚称,ChatGPT的模仿能力和文笔越好,这个未来风险就越值得重视且需要提前应对。今天的AI生成理论,还没办法保证生成内容的逻辑正确与合理;建立人类领域专家参与的AI训练过程,发展与正确性相关的增强学习算法可能会是未来的一个AI科研热点。其二的担忧点在于AI/CS专业人需保持冷静,王咏刚认为,面对大幅提升多轮对话能力的ChatGPT,越是AI/CS的从业者越是不能一味地顶礼膜拜;最起码,应该有测试和验证的精神,不断探索新模型的能力上限,甄别模型生成答案时真正的“记忆认知”和基于特征相似性的“模仿游戏”。ChatGPT的火爆让国内创投圈再次热议AIGC的投资价值,AIGC全称AI-GeneratedContent,指利用AI技术寻找数据规律并泛化生成的内容。国泰君安研发分析称,AI绘画是AIGC的一大重要分支,目前处于由简单的降本增效向创造额外价值升级的阶段,跨文字和图像的多模态内容成为关键的发展节点。2022年8月,StableDiffusion、Midjourney等AI绘画应用因《太空歌剧院》作品的获奖而在海外迅速出圈,此后热度蔓延至国内,无界版图AI、意间AI等应用于9月底相继上线,其中意间AI用户数在42天内突破百万。此次ChatGPT仅用5天便实现百万用户数,AI问答及其他分支应用的热度有望持续攀升。就技术层面而言,国泰君安称,模型效率、素材库丰富度是AIGC应用的核心竞争力。以AI绘画为例,此前流行的GAN模型存在一定局限性,包括从噪声/条件到最终结果的一步到位式生成方式难度较高,面对复杂数据时容易训练失败,跨模态生成效果较差等。但2022年出现的Diffusion模型在这三方面均有改善,模型迭代驱动多个AI绘画应用出圈。并且此次OpenAI发布的ChatGPT模型较前代而言有较大进步,如减少不真实回答、避免有害回答、挑战用户问题前提等,同时还具备连续对话的记忆能力,人机交互体验更为逼真。丰富的内容素材库保障模型得到充分训练,并最终生成高质量内容,是AIGC应用的另一核心竞争力。因此,浙商证券研报认为,ChatGPT模型的出现对于文字模态的AIGC应用具有重要意义。从下游相关受益应用来看,包括但不限于代码机器人、小说衍生器、对话类搜索引擎、语伴、语音工作助手、对话虚拟人等。从上游增加需求来看,包括算力、数据标注、自然语言处理(NLP)等。至于ChatGPT加入后对行业造成的“威胁”,高毅表示,ChatGPT不一定能完全替代所有人,但可能是相对基础的那部分,“具体到软件行业,今天能离谱地生成和分析代码,那明天很有可能PRD文档都能直接生成软件产品,仅需少量资深产品研发测试等人力介入。作为从业者,平时还是得多想想,哪些技能是更深的、不那么容易被替代的。”就目前ChatGPT存在的问题而言,主要是来自于训练过程和数据集的局限性,此次面向用户免费开放能够进一步强化训练,从而完善模型质量。国盛证券研究所发现,目前OpenAI等巨头已着手自建计算集群来满足AIGC的要求,这种集中式的训练对GPU、存储、机房、供电等基础设施均有巨大需求。国内部分创业团队目前基于公有云训练,随着需求的增加,也有望转向自建集群。今年以来,我国“东数西算”战略自上而下快速推进,作为数字经济的基础,“算力即权力”,其重要性不言而喻,此前国内厂商的更多互联网应用聚焦于“存”而非“算”,随着AIGC技术在全球的兴起,“东数西算”的算力需求将越来越显著。未来随着深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,AIGC有望加速发展。但针对此次ChatGPT再次点燃创投圈内AIGC赛道的火热,王咏刚持有谨慎态度。2022年11月,王咏刚前往硅谷,拜访了多家投资公司、科技公司、创业团队,他发现科技圈里几乎人人都在谈论AIGC,似乎没有AIGC包装的创业项目就不是好项目,没有AIGC概念的科研就发不出好论文。但实情的确如此吗?在后续与OpenAI两位联合创始人的交流中,王咏刚发现,对方会通过非常技术化、务实的心态谈论其工作计划与技术思考,但他们并不知道AIGC到底是什么意思,这令王咏刚非常诧异,思考之后王咏刚认为,“从科技上开创AIGC这个新领域的OpenAI创始人,其实并不需要知道类似AIGC之类纯粹用来包装科技概念的新名词。他们要研究的是大模型结构、并行训练加速、神经网络优化等等具体科学与技术。这样的人才是真正的创建者和领航者。”目前国内AIGC一片火热,在王咏刚看来,其中一部分创业者、投资者、或将AIGC快速包装成应用产品的大多数,其实只是并无能力决定科技大方向的跟风者。“期望跟风者在AIGC这个大舞台上,不要过于头脑发热,还是要多判断一下,自己构建的所谓‘产品’,到底是有益于人类进步的,还是向已经碎片化的内容世界继续灌水或倾倒垃圾的。”王咏刚表示。作者:吕倩▪刘晓洁▪樊雪寒 原文链接://shuzhiren.com/post/18148.html

相关文章

解析中兴通讯2020年三季报:业绩强劲增长的动力何在?

昨日晚间,中兴通讯发布了2020年第三季度财报。财报显示,第三季度实现营收269亿元,同比增长37.2%;净利润8.6亿元,同比下降67.83%。不过,去年同期净利润包含了一笔约22亿元的一次性资产处...

门槛降低“观星热”兴起 星空游“点亮”暗夜

中国星空旅游目前处于快速成长的萌芽期,近年来参与到观星、拍星活动的人越来越多,兴起一波“观星热”。“这是我拍摄的稻田星空摄影作品,采用了较为复杂的景深合成技术……”近期,韦文俊在社交平台上分享了一组星...

“国潮风”吹旺纺织服装业

当前,国货强势崛起,这在纺织服装业中表现得尤为明显。今年上半年,纺织服装板块的201家公司市值超1.8万亿元,远远高于上年同期的8821.83亿元。国产品牌在整体运营能力上与国外品牌的差距正迅速缩小。...

从10月份电商物流指数看消费市场活力满满 农村电商、新技术表现亮眼

中国物流与采购联合会11月11日公布10月份中国电商物流指数。在多重因素促进下,电商物流需求增加明显,电商物流业务量显著提升。10月份中国电商物流指数为115点,较上月回升0.6点。10月份市场迎来消...

互联网贷款新规:强化风险管理 助推行业良性快速发展

银保监会官网7月17日发布公告,《商业银行互联网贷款管理暂行办法》(以下简称《办法》)已于2020年4月22日经中国银保监会2020年第4次委务会议通过。现予公布,自公布之日起施行。作为银保监会202...

湖南发布石化行业"十四五"发展规划

近日,湖南省工信厅正式发布《湖南省石化行业“十四五”发展规划》(以下简称《规划》),到2025年,全省石化行业主营业务收入达到3500亿元。《规划》提出了未来5年发展目标和重点。到2025年,湖南省打...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。