第34章 构建属于自己的生态

“我怎么觉得你就盼着这一天呢啊?”张建看着似笑非笑的纪弘,说话的语气都带着一点儿幽怨。

“张总,说实话,仰人鼻息的感觉是不是不好受?而且,摩尔科技以兼容的方式利用英伟达CUDA的生态,效率也不尽如人意,性能损失也很大吧?”

纪弘正色起来:“要我说,倒不如直接断了,构建真正属于我们自己的生态。”

“你说的倒是轻巧,CUDA英伟达早在2007年就推出来了,优化迭代了十好几近二十年才有如今的水平,是我们想搞就能搞的?

“诚然,CUDA的理念并不复杂,本质就是一个帮助开发者构建自己应用的GPU编程服务简易API接口。

“就算是内里的运算架构,在内行人眼里,理念也几乎是透明的。

“比如,AMD搞的所谓HIP,就是提供了一种类似于CUDA的编程接口。甚至,语法和编程模式都和CUDA一模一样。

“但效果怎么样呢?投入巨量人员和资金,但竞争力还是不行。再说了,我们之前有得用,就没有在这一块儿上心。”

“其实就是想省成本。”

纪弘算是听明白了,之前英伟达让用,这边也没有更多的资源和精力去搞这个,就先凑合用了,他接着说道:

“我也能理解,毕竟当时你们的目标是能活十年,而且与英伟达关系也还好,也不用太过担心授权的问题。”

“但,今时不同往日了。”顿了一下,纪弘如此强调。

张建心说,当然不同往日了,往日我们的目标是活着就好,现在搞得英伟达都急跳脚了:

“主要还是你这边【基于AI的GPU智慧调度】,训练卡应该也是能用的吧?

“CUDA只是以流处理核心为元单位对外开放的GPU编程接口。

“这个时候,如果我们重新搞一套,完全用这个理念,其实意义不大,竞争力还是有限,AMD已经给我们打过样了,毕竟CUDA的生态早已经成型且非常完善,后来者很难去挑战。”

“你是想问,能不能把GPU智慧调度的理念融入到我们的通用运算架构里是吧?”纪弘肯定道:“那必须能!”

张建不由得嘴角又抽了抽,能当然是好事儿,但是,我是不是又得割肉?

“我们其实可以从智算中心开始。智算中心规模较大,现在都是一千张卡起步。

“这里边不仅涉及到流处理单元,更是涉及千卡算力怎么利用和分配才能效率最大化的问题。

“利用我们的AI核心能力进行智慧监测和算力综合分配,再加上基于AI调度的GPU运算架构,你大可以想想,那效率会怎么样!”

张建嘴角抽的更厉害了,心道:我不想听你画饼,只想听你想管我要多少钱!