• linkedu视频
  • 平面设计
  • 电脑入门
  • 操作系统
  • 办公应用
  • 电脑硬件
  • 动画设计
  • 3D设计
  • 网页设计
  • CAD设计
  • 影音处理
  • 数据库
  • 程序设计
  • 认证考试
  • 信息管理
  • 信息安全
菜单
linkedu.com
  • 网页制作
  • 数据库
  • 程序设计
  • 操作系统
  • CMS教程
  • 游戏攻略
  • 脚本语言
  • 平面设计
  • 软件教程
  • 网络安全
  • 电脑知识
  • 服务器
  • 视频教程
  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号
您的位置:首页 > 程序设计 >C语言 > C中实现矩阵乘法的一种高效的方法

C中实现矩阵乘法的一种高效的方法

作者: 字体:[增加 减小] 来源:互联网 时间:2017-05-28

通过本文主要向大家介绍了c语言实现矩阵乘法,openmp实现矩阵乘法,java实现矩阵乘法,多线程实现矩阵乘法,verilog实现矩阵乘法等相关知识,希望对您有所帮助,也希望大家支持linkedu.com www.linkedu.com

如何计算矩阵乘法,这个大家都知道。通常情况下,我们都是用以下代码实现的:


for(i=0;i<n;++i)
    for(k=0;k<n;++k){
        r=A[i][k];
        for(j=0;j<n;++j)
            C[i][j]+=r*B[k][j];
}


</div>
细看一番就会发现这两种实现语义是等价的,但是后者的实际运行效率却比前者高。

那为什么会如此呢?

那是因为CPU读数据时,并不是直接访问内存,而是先查看缓存中是否有数据,有的话直接从缓存读取。而从缓存读取数据比从内存读数据快很多。

当数据不在缓存中时,CPU会将包含数据在内的一个数据块读到缓存,如果程序具有良好空间局部性,那么第一次cache miss后,之后的几次数据访问就可以直接在缓存中完成。除了空间局部性(程序倾向于引用与当前数据邻近的数据)之外,还有时间局部性(程序倾向于引用最近被引用过的数据)。

回到矩阵乘法。(我们只考虑内循环)

前者对矩阵A,有良好的空间局部性,假设一次能缓存四个元素,则每次迭代对于A只有0.25次miss,但是对于B,则不然,因此B是按列访问的,每次访问都会miss,因此每次迭代总的miss数是1.25。

后者对于矩阵C和矩阵B都有良好的局部性,每次迭代都只有0.25词miss,因此总的miss数是0.5。后者每次迭代多了一次存储(对C[i][j]写入),但是即便如此,后者的运行效率也比前者高。

总而言之,要想程序跑得快,就要在程序中多利用局部性,让缓存hold住你的数据,减少访存次数。要知道CPU可以在3个时钟周期内访问到L1 cache,10个时钟周期左右的时间访问到L2 cache。访问内存却要上百个时钟周期,孰快孰慢,很清楚了吧?

</div>
分享到:QQ空间新浪微博腾讯微博微信百度贴吧QQ好友复制网址打印

您可能想查找下面的文章:

  • C语言实现稀疏矩阵
  • C语言实现矩阵翻转(上下翻转、左右翻转)
  • C语言科学计算入门之矩阵乘法的相关计算
  • C中实现矩阵乘法的一种高效的方法

相关文章

  • 2017-05-28深入理解C预处理器
  • 2017-05-28C++广播通信实例
  • 2017-05-28STl中的排序算法详细解析
  • 2017-05-28常用的STL查找算法
  • 2017-05-28解析c中stdout与stderr容易忽视的一些细节
  • 2017-05-28C++单例模式应用实例
  • 2017-05-28C语言入门的一些基本资源推荐和程序语法概览
  • 2017-05-28对一个数组进行zig-zag重新排列
  • 2017-05-28解析wprintf 中使用%I64d格式化输出LONGLONG的详细介绍
  • 2017-05-28C语言数组入门之数组的声明与二维数组的模拟

文章分类

  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号

最近更新的内容

    • C++破坏MBR的代码
    • 基于Sizeof与Strlen的区别以及联系的使用详解
    • C++编程中队内联函数的理解和使用
    • 探讨:程序在内存中的分配(常量,局部变量,全局变量,程序代码)问题
    • 关于C++内存中字节对齐问题的详细介绍
    • 如何将C语言代码转换为应用程序(也就是编译)
    • 详解C++编程中的vector类容器用法
    • 深入剖析Android中init进程实现的C语言源码
    • C语言中的函数指针学习笔记
    • C语言中isdigit()函数和isxdigit()函数的用法

关于我们 - 联系我们 - 免责声明 - 网站地图

©2020-2025 All Rights Reserved. linkedu.com 版权所有