从软硬件到生态加速AI PC革命,英伟达凭实力证明RTX就是AI
一个插件让显卡速度翻3倍?解密英伟达AIGC时代的最新王牌。作者 | 云鹏
编辑 | 漠影
最近的AIGC圈着实迎来了一波新品发布小高潮!先是谷歌Gemini突然深夜炸场,硬刚OpenAI的GPT-4,然后是斯坦福科学家李飞飞团队亮出AI视频生成模型W.A.L.T,拳打Pika脚踢Gen-2,最近微软又发布了手机端侧都能跑的小语言模型Phi-2,平均性能甚至超过Llama 2。
01.从通用计算到加速计算,从数据中心到PC,英伟达CUDA生态占C位
02.兼容性架构铺路,TensorRT-LLM让推理性能翻倍,AI绘图进入“秒速时代”
03.DLSS用AI改写游戏产业,英伟达为开发者武装到牙齿,RTX就是AI
04.结语:AIGC时代要想玩转AI,英伟达是彻底绕不开了
编辑 | 漠影
最近的AIGC圈着实迎来了一波新品发布小高潮!先是谷歌Gemini突然深夜炸场,硬刚OpenAI的GPT-4,然后是斯坦福科学家李飞飞团队亮出AI视频生成模型W.A.L.T,拳打Pika脚踢Gen-2,最近微软又发布了手机端侧都能跑的小语言模型Phi-2,平均性能甚至超过Llama 2。
▲W.A.L.T文生视频案例片段
AI大模型火爆之下,各路科技巨头几乎都在“All in AI”,而AI军备竞赛已经很快从云端卷到了端侧,从智能手机到PC,我们身边各类熟悉的智能硬件都已被卷入这场大模型浪潮。各类智能助手、各类AIGC相关应用如雨后春笋般涌现,各类“GPTs”已经逐渐进入大众视野。热况之下,AI大模型在端侧的落地离不开底层硬件的支持,英伟达、英特尔、AMD等大厂也不断亮出各种应对AI新时代的软硬件新品,加速着AI PC时代的到来。PC作为算力最强的消费级产品,成为AI大模型在端侧应用的最理想平台之一。毫无疑问,AI将成为PC产业发展的一个关键拐点,AI也会彻底改变玩家、创作者、上班族、学生乃至每一个普通PC用户的体验。▲图片由Bing创作,来源:PCWorld
目前全球搭载英伟达RTX GPU的Windows PC和工作站已经超过了1亿台,英伟达作为AI大模型时代最核心的全栈玩家,正通过全栈生态的赋能让这些“RTX PC”的AI性能有翻倍式暴涨。在我们熟悉的文生图应用Stable Diffusion中,基于英伟达的RTX专用加速插件,一张RTX 4090仅用49秒就可以生成100张高质量图像,速度翻了3倍,而这样的升级甚至不需要改变其他硬件配置。英伟达RTX相关技术在AI领域的应用,让全球无数开发者可以更轻松、高效地创建AI应用,人们使用PC的方式,也在潜移默化中改变着。英伟达如何为AI PC时代的底层筑基?英伟达在AIGC时代藏得最深的王牌又是什么?今天,从硬件、软件到生态,英伟达似乎已经和AI画上了等号。01.从通用计算到加速计算,从数据中心到PC,英伟达CUDA生态占C位
02.兼容性架构铺路,TensorRT-LLM让推理性能翻倍,AI绘图进入“秒速时代”
▲TensorRT-LLM v0.6.0可以带来最高5倍推理性能提升
实际上,TensorRT-LLM有着这样的表现,与CUDA的特性是密不可分的。英伟达CFO在财报电话会中特别提到,他们之所以能够创建TensorRT-LLM,正是因为CUDA是可编程的,如果CUDA和其对应的GPU不是可编程的,以如今这样快的速度迭代改进软件栈是很难实现的。经过20多年的深耕,每一个英伟达GPU的背后,都是不断迭代更新的软件栈在做坚实支撑,而CUDA的灵活性和兼容性无一不是这一生态的突出优势。英伟达有着规模庞大的生态系统软件开发人员、系统制造商生态系统和分销合作网络,而将这些真正连结在一起形成一个高效生态系统的,正是英伟达CUDA软件生态和架构层面的兼容性。▲TensorRT扩展的配置需求,由Bilibili UP主Nenly同学制作
根据Bilibili平台上一位专业设计师UP主Nenly同学的测试,在Tensor RT的加持下,Stable Diffusion这一热门文生图应用基于RTX GPU生成的模型推理速度直接提升了2倍甚至3倍以上,AI绘画进入了“秒速时代”。▲标准StableDiffusion与TensorRT引擎优化后相比,每分钟绘制图片数的差异,由Bilibili UP主Nenly同学制作
根据Nenly同学发布视频,在GeForce RTX 4090上,Stable Diffusion的运行速度是使用苹果M2 Ultra的Mac顶配版的7倍。甚至4060Ti在TensorRT扩展的支持下,生成图片的速度已经超过了加速前的4090。对于一些需要大量出具草图的创意工作者们来说,这样的加速能力所带来的收益是极为明显的。面对数千张图片吞吐量的工作,节省下来的时间可能是以天计算的。比如被誉为“插画领域的刘慈欣”、“国内科幻绘画第一人”,也是首位获得全球雨果奖的华人艺术家赵恩哲,在工作中就使用了全流程经GeForce RTX GPU加速的Stable Diffusion进行创作,AI辅助创作工具可以省掉细化时间,同时给他很多意向不到的创作设计可能。▲《虚空之舟》——使用SD创作,全流程经GeForce RTX GPU加速
赵恩哲特别说道,其实每位创作者都渴望将脑海中的世界完美呈现,但由于技术门槛和工业化流程等方面的限制,他们过去只能在概念设计与最终呈现之间做出妥协。但如今,借助英伟达GeForce RTX显卡的强大算力以及SD、RUNWAY等AI创意工具,概念设计师可以突破限制,在短短几秒内尝试所有想法,相信今后有了更强大的算力加持,每位艺术家都可以实现无限创造!▲赵恩哲
当然,基于RTX GPU这些能力,相关公司也可以基于自己的模型构建具有最有效果的加速引擎,让算力的效益最大化,从而实现显著的降本增效。可以说,从企业到个人,从数据中心到PC,基于数十年建立的坚实生态,英伟达正通过技术创新拉近每一个人与AI大模型的距离。03.DLSS用AI改写游戏产业,英伟达为开发者武装到牙齿,RTX就是AI
04.结语:AIGC时代要想玩转AI,英伟达是彻底绕不开了
*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。
