注册网站要百度实名认证安不安全,wordpress htaccess 404,大学加强网站建设与管理的通知,网站注册商标文章目录 任务管理器#xff1a;性能参数详解一、电脑的硬件组成二、机械硬盘和固态硬盘2.1、详细介绍#xff1a;HDD SSD2.2、读写性能2.2.1、#xff08;HDD#xff09;读写性能的影响因素#xff1a;寻道时间 旋转延迟 数据传输时间2.2.2、#xff08;SSD#xff… 文章目录 任务管理器性能参数详解一、电脑的硬件组成二、机械硬盘和固态硬盘2.1、详细介绍HDD SSD2.2、读写性能2.2.1、HDD读写性能的影响因素寻道时间 旋转延迟 数据传输时间2.2.2、SSD读写性能的影响因素读写速度IOPS 响应时间 三、CPU3.1、CPU - 组成3.2、CPU - 性能指标3.2.1、容量3.2.2、利用率 3.3、CPU与多线程的关系 四、GPU4.1、入门知识4.1.1、显卡 —— 是安装 GPU 的硬件设备4.1.2、GPU —— 是一种专用于图形或图像计算的处理器4.1.3、显存 —— 是显卡上的一种专用 GPU 内存。4.1.4、CUDA —— 用于在 GPU 上进行并行计算的编程模型 4.2、GPU内存 —— 专用 GPU 内存 共享 GPU 内存4.3、GPU计算流程代码实现4.3、GPU计算流程异步计算 同步计算 任务管理器性能参数详解
2023英伟达显卡排名天梯图(已更新)
一、电脑的硬件组成
电脑是由多个硬件和软件组件组成的复杂系统它们协同工作以执行各种任务。电脑的装机配件模拟选择 电脑的硬件组成图解 硬件组件1.1 中央处理器CPUCentral Processing Unit 功能用于执行计算机程序中的指令是电脑的大脑。 类型制造商Intel、AMD、架构x86、ARM1.2 图形处理器GPUGraphics Processing Unit 功能用于处理图形和图像任务图形渲染和加速计算 用途用途集成显卡、独立显卡、产品RTX、GTX1.3 内存RAMRandom Access Memory随机存取存储器 功能用于存储正在运行的程序和数据是CPU临时性的快速存储。 类型容量GB、类型DDR3、DDR4等。1.4 显卡VRAMVideo Random Access Memory显存 / 视频内存 功能 用于存储图形和图像数据是GPU临时性的快速存储。 类型容量GB、类型GDDR5、GDDR6等。1.5 存储设备 存储阵列存储阵列 将多个硬盘驱动器组合在一起以提供高容量、高性能和/或冗余性。专门设计用于存储和管理大量数据的硬件设备。存储阵列可用于企业级数据中心、服务器和其他需要大容量和可靠性的应用场景。 机械硬盘大容量、较慢的机械存储。固态硬盘小容量、高速的闪存存储。移动硬盘机械存储大型便携通过USB接口连接到计算机。光盘驱动器使用光学技术激光束来读写数据。包括CD-ROM、DVD-ROM和Blu-ray等U盘闪存存储小型便携通过USB接口连接到计算机。 1.6 主板 功能连接和协调所有硬件组件提供电源和数据传输。 包括CPU插槽、内存插槽、扩展插槽PCIe、输入输出端口等。1.7 电源供应器 功能提供电能给电脑所有硬件组件。 包括电源单元PSU和电源线。1.8 机箱 功能容纳和保护电脑内部组件。 类型台式机箱、小型机箱、游戏机箱等。1.9 冷却系统 功能保持硬件温度在可接受范围内。 包括风扇、散热器、散热片等。 外部设备2.1 输入设备键盘、鼠标、触摸板等。2.2 输出设备显示器、音响、耳机、打印机、扫描仪、投影仪、摄像头等。2.3 性能设备声卡、网卡等2.4 移动设备U盘、移动硬盘等 软件组件3.1 操作系统OS 功能管理硬件资源提供用户界面执行应用程序。 分类Windows、Mac OS、Linux等。3.2 驱动程序 功能使硬件和操作系统之间能够通信。 分类显卡驱动、打印机驱动等。3.3 应用程序 功能执行特定任务如办公套件、图形设计工具、游戏等。 分类办公软件、娱乐软件、开发工具等。 二、机械硬盘和固态硬盘
2.1、详细介绍HDD SSD 机械硬盘Hard Disk DriveHDD和固态硬盘Solid State DriveSSD是计算机存储设备的两种主要类型。 HDDSSD工作原理数据存储在具有磁性涂层的金属盘上并通过安装在控制器上的磁头采用机械运动来读取或写入使用闪存存储器有一堆NAND闪存颗粒来存储数据。数据通过电子访问存储芯片来读取或写入性能较慢的机械存储机械访问导致较长的读取和写入延迟高速的闪存存储电子访问具有高速的读取速度与传输速度、更短的访问时间耐久性易损坏有移动组件即具有物理运动的组件。在一定的冲击下会损坏磁力会导致故障耗电量较大更耐用没有移动部件。且在断电时也能保留电荷从而保留数据。容量大容量小容量上限比HDD低价格便宜更昂贵适用场景适用于大容量存储、成本较低和无需数据快速访问的场景如数据归档、备份等适用于高性能、快速数据访问和响应时间的应用如操作系统启动盘、游戏加载、视频编辑等
2.2、读写性能 2.2.1、HDD读写性能的影响因素寻道时间 旋转延迟 数据传输时间
机械硬盘读写性能的影响因素寻道时间 旋转延迟 数据传输时间 windows下如何查看磁盘IO性能
2.2.2、SSD读写性能的影响因素读写速度IOPS 响应时间 读写速度IOPS关键指标IOPS即每秒的读写次数单位MB/s、GB/s。更高的读写速度意味着更快的数据传输。响应时间Response Time 对读写请求的响应速度通常以毫秒为单位。低响应时间表示更快的存储系统响应。闪存类型SSD 中使用的 NAND 闪存分为不同类型如 SLCSingle-Level Cell、MLCMulti-Level Cell、TLCTriple-Level Cell和 QLCQuad-Level Cell。SLC 通常具有更高的性能和更长的寿命但也更昂贵。接口类型SSD 的接口类型包括 SATA、NVMe 和 PCIe。NVMe 和 PCIe 接口提供更高的带宽和更低的延迟。队列深度和并发访问支持更深的队列和更高的并发访问的 SSD 能够更好地处理多任务和大量并发请求。温度敏感过高或过低的温度可能会影响性能。温度过高还可能导致固态硬盘降低频率以防止过热。TRIM 支持用于在固态硬盘上删除无效数据的命令有助于垃圾回收和提高写入效率。写入次数和寿命NAND 闪存有写入次数的限制不同类型具有不同的寿命和写入次数限制影响长期使用性能。 三、CPU
中央处理器CPU是计算机系统中的大脑负责根据指令的顺序逐步执行各种指令来完成计算、逻辑操作、数据处理和控制流程等任务。 CPU结构的简单理解
3.1、CPU - 组成 CPU由运算器、控制器和存储器组成。 运算器Arithmetic Logic UnitALU负责执行算术运算如加法、减法等和逻辑运算如与、或、非等以及其他数值计算和逻辑操作。控制器Control UnitCU负责控制数据流和指令流以确保程序按照正确的顺序执行。如从内存中读取数据、执行计算、存储结果等。 控制器从内存中读取指令解码指令并将其发送到适当的部件执行。 存储器Memory是CPU用于存储数据和指令的地方。 存储器包括寄存器、缓存和主存。 寄存器Register用于存储CPU正在处理的数据和指令。—— 是最快的存储器缓存Cache用于暂存频繁使用的数据和指令。—— 是位于CPU内部的高速存储器主存Main Memory用于存储程序和数据。—— 是CPU外部的存储器 3.2、CPU - 性能指标
百度百科CPU性能参数 主频 外频 总线频率 倍频系数 缓存 工作电压 制程 超线程 性能饱和表示当系统的某个组件如CPU达到其最大处理能力时。 3.2.1、容量
CPU容量是指CPU的性能和处理能力。如处理任务的数量和复杂性。CPU容量的大小直接关系到计算机系统的整体性能。
3.2.2、利用率
震惊用了这么多年的 CPU 利用率其实是错的
CPU利用率 在一定时间内CPU用于执行计算任务的时间比例通常以百分比表示。 公式 计算时间 / 总时间 1 - 空闲时间 / 总时间 CPU利用率由两个部分组成 1系统CPU使用率表示CPU执行与操作系统相关的任务所花费的时间例如管理内存、磁盘操作和网络活动。 2用户CPU使用率表示CPU执行用户的应用程序和进程所花费的时间。 100% CPU利用率表示CPU处于执行状态。 —— 达到了安防等级可能导致CPU损坏或缩短寿命。0% CPU利用率表示CPU处于空闲状态。 —— 由于系统CPU使用率的存在所以是达不到的。 3.3、CPU与多线程的关系
时间片Time Slice是操作系统分配给每个线程或进程的最小时间单位。 CPU并发执行将CPU时间划分为多个时间片使得多个线程或进程分别在不同的时间片上同时运行从而实现在一个CPU上并发执行。 时间片的大小由操作系统的调度算法和系统配置决定。通常在几毫秒到几十毫秒之间。较小的时间片可以提高系统的响应速度但可能增加线程切换的频率反之亦然。 线程切换当一个线程或进程的时间片用完时操作系统会强制进行线程切换即暂停当前执行的线程或进程并选择下一个可运行的线程或进程分配给 CPU 执行。通过在各个线程之间来回切换实现了多任务的并发执行。 多线程与CPU利用率的关系 当CPU利用率未达到饱和时多线程并行计算可以提高整体性能。 当CPU利用率已经饱和时继续增加线程将使得整体性能下降出现 “线程切换” 和 “调度开销” 等问题。 线程切换开销从一个正在执行的线程切换到另一个线程的过程。在切换过程中操作系统需要上下文切换保存当前线程的上下文信息寄存器状态、程序计数器等并加载下一个线程的上下文信息使得另一个线程可以继续执行。线程调度开销由操作系统执行线程调度所需的开销。开销包括 选择合适的调度算法决定下一个要执行的线程、管理线程队列等操作。在多线程应用中尤为显著尤其是在高并发、线程数量众多的情况下。 为了最大化性能需要进行合理的线程管理。 1减小线程数量 2减少线程切换频率时间片用完、适当的线程数量、线程主动让出CPUtime.sleep()、阻塞和唤醒、I/O操作 3使用线程池使用 ThreadPoolExecutor 类创建线程池。可以指定线程池的大小决定可以同时执行的线程数量。 举例说明 已知若指定线程数为40其中前25个线程的CPU利用率已经达到100%。计算前25个线程在饱和状态下争夺有限的CPU资源而后15个线程需要等待前面的线程释放资源故后15个线程的每个线程的执行时间较长。 四、GPU
4.1、入门知识
4.1.1、显卡 —— 是安装 GPU 的硬件设备
显卡Graphics Card显示适配器Graphics Processing Unit Card图形处理单元卡是一块插在计算机主板上的扩展卡用于输出图形信号并控制显示器的显示。
组成部分显卡核心GPU显存、电路板PCB、金手指、供电 显示接口、以及散热器其他相关硬件。 【显卡科普】小白必看的入门显卡科普关于显卡的原理、结构、作用
4.1.2、GPU —— 是一种专用于图形或图像计算的处理器
GPUGraphics Processing Unit图形处理单元是一种专用于处理图形和图像相关计算的处理器。如渲染、图像处理、计算机视觉等。 GPU 具有大量的并行处理单元CUDA cores 或 stream processors这使得它们在执行大规模并行计算任务时具有显著的优势。GPU是图像处理芯片因为GPU功耗很高、背面电流过大都是焊接在显卡上。独立显卡将GPU焊在显卡的电路板上。集成显卡将GPU和CPU集成在一起。CPU是主板上的一块芯片。GPU是显卡上的一块芯片。 4.1.3、显存 —— 是显卡上的一种专用 GPU 内存。
显存Graphics Memory显存是显卡上的一种专用内存用于存储图形数据、纹理、帧缓冲区等与图形处理相关的数据。
显存的容量决定了显卡可以处理的图形数据大小和复杂度通常用于存储图像、纹理、帧缓冲区和其他与图形渲染相关的数据。
4.1.4、CUDA —— 用于在 GPU 上进行并行计算的编程模型
CUDACompute Unified Device Architecture统一计算设备架构是 NVIDIA 公司开发的用于在 NVIDIA GPU 上进行通用计算的一种并行计算平台和编程模型。
CUDA 提供了一组 API 和工具使程序员能够利用 GPU 的并行计算能力进行加速计算。CUDA 程序可以使用 C、C、Python 等编程语言编写并通过 NVIDIA 提供的 CUDA 编译器进行编译和优化。使用 CUDA 编程程序员可以直接操作 GPU 上的数据和执行核心并利用 CUDA 提供的并行计算模式和优化技术实现高性能的并行计算任务。
4.2、GPU内存 —— 专用 GPU 内存 共享 GPU 内存 专用GPU内存显存详见上述。共享GPU内存是 win10 系统从主存中专门为 GPU 划分的内存。当显存不够使用时超出部分将转移到共享GPU内存即主存中以防止程序奔溃但速度会明显减慢。
在使用多进程时 1若迭代任务 A 的整体耗时小于内部每个操作的耗时之和则多进程可以加速整个迭代过程。 2若迭代任务 A 的整体耗时大于内部每个操作的耗时之和则多进程会增加额外的开销。此时的多进程相当于串联执行。
4.3、GPU计算流程代码实现
numba.cuda的GPU计算流程区别
1将数据从主机内存CPU传输到设备内存GPU。 2在 GPU 上执行并行计算任务。 3将计算结果从设备内存传输回主机内存。
import torch# 1数据准备创建两个张量并将它们移动到 GPU 中
device torch.device(cuda if torch.cuda.is_available() else cpu)
x torch.tensor([1, 2, 3]).to(device)
y torch.tensor([4, 5, 6]).to(device)# 2并行计算在 GPU 上执行向量加法
result x y# 3数据传输将计算结果从 GPU 传输回 CPU
result_cpu result.cpu().numpy()
print(Result:, result_cpu) # Result: [5 7 9]
4.3、GPU计算流程异步计算 同步计算 GPU函数的启动方式是异步计算 异步计算CPU不会等待GPU函数执行完毕后才执行下一行代码。同步计算在调用的GPU函数后面添加torch.cuda.synchronize() —— 表示CPU需要等待GPU函数执行完毕后再计算。 import torch
import timedef async_example(x, y):# 异步计算在 GPU 上执行矩阵相乘start_time time.time()result torch.matmul(x, y)end_time time.time()execution_time end_time - start_timeprint(f同步计算执行时间{execution_time: .4}, )def sync_example(x, y):# 同步计算在 GPU 上执行矩阵相乘并等待计算完成start_time time.time()result torch.matmul(x, y)torch.cuda.synchronize() # 同步计算end_time time.time()execution_time end_time - start_timeprint(f同步计算执行时间{execution_time: .4}, )if __name__ __main__:device torch.device(cuda if torch.cuda.is_available() else cpu)num 20000x torch.randn(num, num).to(device)y torch.randn(num, num).to(device)sync_example(x, y) # 执行同步计算示例async_example(x, y) # 执行异步计算示例
同步计算执行时间 2.392 此时计算完成统计的是当前函数所需要完成的计算时间。
同步计算执行时间 0.0 此时计算未完成相当于并没有统计计算时间直接跳过。