找回密码
 立即注册
搜索
日产 讴歌 福特 极氪 林肯 阿尔法 保时捷 奔腾 长城 东风 哈弗 Jeep 捷途 岚图 理想 兰博基尼 名爵 马自达 玛莎拉蒂 欧拉 奇瑞 smart 沙龙 坦克 特斯拉 蔚来 沃尔沃 小鹏 雪佛兰 高合 奥迪 丰田 本田 雷克萨斯 英菲尼迪 捷达 捷豹路虎 阿斯顿 马丁 罗密欧 标致 宾利 长安 法拉利 红旗 几何 凯迪拉克 领克 劳斯莱斯 路特斯 MINI 迈凯伦 哪吒 起亚 荣威 三菱 斯巴鲁 腾势 魏牌 五菱 现代 雪铁龙 宝骏 大众 宝马 比亚迪

卡尔瑞公司申请用于 AI 计算的优化后乘积累加运算符专利,优化 AI 计算过程

[XinWen.Mobi 原创复制链接分享]
xinwen.mobi 发表于 2025-1-30 22:37:44 | 显示全部楼层 |阅读模式

专利的意义
   乘积累加(MAC)运算符在AI计算中具有关键作用。在AI计算,尤其是深度学习的神经网络计算中,大量的矩阵乘法和累加操作是计算的核心部分。例如在卷积神经网络(CNN)中,卷积层的计算就包含了大量的乘积累加操作。
   卡尔瑞公司申请优化后的乘积累加运算符专利,可以提高计算效率。传统的乘积累加运算可能存在计算速度慢、能耗高的问题。通过优化后的运算符,能够减少计算时间,提高数据处理的吞吐量。
   在AI硬件加速方面有重要价值。对于专门用于AI计算的芯片(如GPU、TPU等),优化的乘积累加运算符可以更好地适配硬件架构,充分发挥硬件的计算能力,提高整个AI系统的性能。
对AI计算过程的优化体现
   算法层面
     可能在数值计算精度上进行优化。例如,在不损失太多计算精度的前提下,采用更高效的数值表示方法,减少数据存储和计算的开销。在深度学习中,一些神经网络模型对精度的要求并非绝对的高精度,适当降低精度(如从32位浮点到16位浮点甚至8位定点)并采用优化后的乘积累加运算可以大大提高计算速度。
     优化计算顺序。在进行矩阵乘法和累加时,调整计算顺序可能减少数据的读取和写入次数。例如,按照数据在内存中的存储布局来优化乘积累加运算的顺序,使得数据读取更加连续,减少缓存缺失(cache miss),提高缓存命中率,从而加速计算过程。
   硬件适配层面
     如果是针对特定的AI芯片架构,优化后的乘积累加运算符能够更好地利用芯片的并行计算能力。例如,在具有多个计算核心的AI芯片中,优化后的运算符可以更好地分配计算任务到不同的核心,实现并行计算,提高整体的计算效率。
     降低硬件的功耗。通过减少不必要的计算步骤和数据传输,优化后的运算符可以降低芯片在执行AI计算任务时的功耗,这对于移动设备或者大规模数据中心中的AI计算来说非常重要,因为它可以减少散热需求,提高能源利用率。
回复

使用道具 举报

QQ|标签|爬虫xml|爬虫txt|新闻魔笔科技XinWen.MoBi - 海量语音新闻! ( 粤ICP备2024355322号-1|粤公网安备44090202001230号 )

GMT+8, 2025-10-27 17:15 , Processed in 0.273704 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

消息来源网络

快速回复 返回顶部 返回列表