看了英伟达的GTC,给人的感觉除了对未来科技的向往之外,更有一种急迫感。
黄仁勋谈了哪些主要内容呢?总结下来有这几个关键词:
1. iphone时刻
chatGPT的火爆,被黄仁勋称为是iphone时刻。这个说法应该是黄仁勋原创,之前没有听说过这样的说法。一个是表达对自己的大客户苹果的敬佩之心,另外也确实很形象地说明了如今以chatGPT为代表的生成式AI对于整个世界的重大改变。
iphone时刻之后,移动互联网正式到来。
而chatGPT之后,人工智能时代也到来了。
言外之意,如果说移动互联网时代最牛的芯片公司是高通,那么显然,人工智能时代,最牛的就是我黄仁勋领导的英伟达。
人工智能时代,有两种资源是最重要的,一个是数据,一个是算力。而英伟达要垄断的是算力资源。
2. 生成式AI
「加速计算是曲速引擎,AI 就是它的动力。」黄仁勋说道,「生成式 AI 日新月异的能力,给我们重新构想其产品和商业模式带来了紧迫感。」
那么生成式AI和现在最火的chatGPT以及GPT4是什么关系呢?其实可以将chatGPT理解为生成式AI的一种。
生成式AI可以作曲,可以写文章,画画等创作性的工作。是不是要GPT很类似?
3. 计算光刻
英伟达宣布推出 cuLitho——一个计算光刻库。并与 ASML、台积电等巨头展开合作,从而大幅降低芯片设计过程中的算力消耗,节能减排。
划重点,节能减排。计算光刻用cpu也能做,但是速度慢,能耗太高。用英伟达的技术,可以很大程度上解决这个痛点。
cuLitho在GPU上运行,其性能比当前光刻技术工艺提高了40倍,能够为目前每年消耗数百亿CPU小时的大规模计算工作负载提供加速。
我的理解英伟达的GPU的这个应用可以算是一个小小的应用场景。类似于5G在煤矿中的应用。
可能有人还是不太理解什么是计算光刻。其实很简单,由于光经过掩膜版会产生畸变,那么生产的时候就需要模拟光刻机原理提前计算出这些畸变,在生产掩膜版甚至是芯片设计的时候进行相应的调整,由于工艺复杂,芯片中图形又数以百亿计,这就导致了计算量以及数据量非常庞大。
当然,对于我们来说,还是先解决成熟工艺的卡脖子问题,条件成熟时,相信完全可以有合适的方法来解决相关的问题。
在黄仁勋眼中,英伟达定位非常明确,就是加速计算。
而令人担心的,恰恰是算力。
大语言模型chatGPT的痛点是成本,而英伟达最先进的基于Hopper架构的H100可以将大语言模型的处理成本降低一个数量级。目前这个型号已不能在中国卖了。因此英伟达为中国特殊设计了一款相同架构的芯片H800。通过优秀的系统设计,基本上可以满足大语言模型对于算力的需求。
H800已经是符合美国法律的最高等级了,也意味着未来英伟达开发出更先进的显卡,也无法卖到中国。
这一点是非常令人感到非常急迫的。
原本我们的计划没有问题,先吃透成熟工艺,然后一步一步再掌握先进工艺。不过chatGPT的出现,导致这种急迫性迅速提高。没有先进工艺加持,算力很难提高。没有算力,那么无论是大语言模型还是生成式AI,都成了无源之水。
那么我们该怎么做呢?我认为我们需要继续发扬华为的精神,加速对于底层技术的突破。玩概念,炒话题的资本运作可以休矣。底层如果不突破,接入再多的openAI的API,也没用。相反,这不是伸着脖子让别人卡么?还有就是聚焦,比如酱香科技此类非关键技术,就不要浪费资源在上面了。
关键技术是一方面,生态也是一方面。比如华为开发了鸿蒙系统,但是单靠一家公司是很难建立生态的。苹果是特例,其实华为也有这个实力。然而遗憾的是美国打压的原因华为自身的手机电脑面临无芯可用的局面。如果国内公司不能拧成一股绳,那么鸿蒙可能也难以成功。
如今,英伟达其实也在努力建立自己的生态以及垄断地位,我们需要警惕。建立在他人的生态之上固然轻松,但是相当于将大厦建立在沙漠上,根基不稳。