通过深入研究arm架构,在上面继续优化改造,建立了一套属于自己的npu神经性网络架构。
所谓的npu(嵌入式神经网络处理器/网络处理器)就是一种专门应用于网络应用数据包的处理器,它也是集成电路的一种。
但区别于特殊用途集成电路(asic)的单一功能,神经性网络器在处理更加复杂的问题方面更加灵活。
一般都可以利用软件或硬件依照网络运算的特性特别编程从而实现网络的特殊用途,在一块芯片上实现许多不同功能,以应用于多种不同的网络设备及产品。
而海思和华芯设计的这套架构,通过采用“数据驱动并行计算”的方式,在处理视频、图像类的海量多媒体数据上相对比传统方式更加擅长。
可以说是青出于蓝而胜于蓝。
不过目前这套架构在构造的时候涉及到了很多的系统性的数学难题,比如激活函数、二维数据运算、解压缩等模块等等。
如果是在常规的cpu或者gpu芯片中,这些问题并不是难题。但是npu神经性网络架构和前两者的性质不同,其数学的兼容性也完全不同。
这就导致设计出来的芯片在性能上甚至还不如10纳米甚至是14纳米的芯片。
目前来说,卡主海思和华芯的难点就在这里。
神经网络和机器学习处理在现在还是处于需求爆发的初期,这方面的数学家相对比传统的cpu/gpu架构数学家要少很多,国外研究这方面的人才都没有多少,更别提国内了。
所以迫不得已之下,发改那边才找上了他,寄希望于他能帮忙解决一下这方面的数学难题。
了解清楚整体的情况后,徐川才点开了数学文件,翻阅了起来。
《大规模稀疏矩阵特征值计算》
《非线性常微分方程组的初值问题的整体解》
《神经性网络架构下的一阶非线性时滞微分方程初值问题》
《基于npu的多项式矩阵特征值并行》
《.》
一项项的题目在他眼中划过,问题不算多,也不算少,总共十几个的样子,大部分都是基于npu神经性网络架构下诞生的难点。
徐川先挨个点开了问题看了看,从数学基础上来说,这些问题对于他而言并不难,但是涉及到npu神经性网络架构,他就不是很懂了。
要研究的话,他得先学一下npu神经性网络架构,了解一下大致,然后再来做。
不过也不全是这些,有两三个数学问题他现在应该就能解决。
芯片设计中涉及到的这些数学难题再复杂,对他来说难度也就那样。
不管多么复杂的计算方法,多么复杂的模型架构和取值,也不可能比可控核聚变中的高温高压等离子体湍流模型更加复杂,更不可能和七大千禧年难题相比。
而在已经解决了两个七大千禧年难题的他看来,这些题目用小学生的数学来形容可能有点过于夸大,但顶多也就是大学生的程度。
反正在看到这些题目的时候,他脑海中就已经有了解决的思路和方法。
花费了半个多小时的时间将毛舜带过来的文档整体粗略的过了一遍后,徐川坐直了身体,伸了个懒腰后长舒了口气,靠在椅子上思索了起来。
对面,屁股挨着半边椅子在书房中枯坐了半天的毛舜顿时就投来了期盼的目光。
不过还未等他开口,对面的徐川就从抽屉中摸出了稿纸和笔,重新低下了头开始忙碌了起来。
&n>> --