网站建设秋实,wordpress 5.1.1主题,网站建设dede,做网站的销售怎么样本地安装
官方网站#xff0c;需要登录 选择Windows Host下载安装 服务器安装
选择Linux CLI .deb下载#xff0c;上传到服务器之后#xff0c;执行以下命令#xff0c;默认会安装在/opt/nvidia/nsight-systems-cli/2023.2.1/target-linux-x64/#xff0c;nsys在/usr/lo…本地安装
官方网站需要登录 选择Windows Host下载安装 服务器安装
选择Linux CLI .deb下载上传到服务器之后执行以下命令默认会安装在/opt/nvidia/nsight-systems-cli/2023.2.1/target-linux-x64/nsys在/usr/local/bin/nsys也有一份所以直接运行nsys即可。
apt install ./NsightSystems-linux-cli-public-2023.2.1.122-3259852.deb
GUI使用
打开界面之后是下面的界面点击下拉菜单连接到远程服务器。 选择红色的SSH按下enter之后在点击右侧的小扳手图标填写服务器的用户和密码。 连接成功之后会显示如下界面在Command line中填写执行的命令之后点击右侧的Start开始执行。 CLI使用
CLIcommand-line interface命令行界面指通过在命令行执行命令生成nsight文件的方式。
#application是程序application-arguments是程序参数
nsys [global-options] profile [options] application [application-arguments]
global-optionsoptions短options长options值含义-h-f--force-overwritetrue,false覆盖已有的相同名称的文件-v-o--outputfilename输出文件的名称-t--tracecuda,cublas,nvtx指定trace的api--statstrue,false生成统计信息#示例产生的nsight_t5_fp16下载到本地用nsight工具查看
nsys profile -o nsight_t5_fp16 -f true python temp.py
GUI使用技巧
鼠标拖动可以查看此段的kernel执行时间双击选中区域可以放大查看ctrl鼠标滚轮也可以放大/缩小在选中区域右键点击Filter and Reorder可以重排选中区域的核函数耗时占比和排行。继续右键选中区域点击Remove Filter恢复到之前的核函数耗时占比和排行。在左侧边栏Timeline View右键点击Show in Events View可以按Duration排序核函数